PromptRR: Diffusion Models as Prompt Generators for Single Image
Reflection Removal [138.4] 既存のシングルイメージリフレクション除去法(SIRR)は、画像のキー低周波(LF)と高周波(HF)の違いを見逃す傾向がある。
本稿では、周波数情報を新しい視覚的プロンプトとして利用し、反射性能を向上する新しいプロンプト誘導反射除去フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:11:10 GMT)
Model Editing Can Hurt General Abilities of Large Language Models [128.3] LLaMA-1 (7B) の編集に特定の方法を用いることで、単一の編集だけで選択された全てのタスクにおいて、大幅な性能低下が0に近づいた。
LLaMA-1 (7B) の編集に特定の方法を用いることで、単一の編集だけで選択された全てのタスクにおいて、大幅な性能低下が0に近づいた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:04:13 GMT)
Gaining Wisdom from Setbacks: Aligning Large Language Models via Mistake
Analysis [127.9] 大規模言語モデル(LLM)の急速な開発は、多くの機会を提供するだけでなく、重要な課題も提示している。
既存のアライメント手法は、人間による注釈付き、欠陥のない命令応答ペアを利用することで、LLMを好ましい結果に導くのが一般的である。
本研究は誤り解析に基づく新しいアライメント手法を提案する。ミスの原因と回避方法を学習するために,LLMを誤った内容に故意に公開する手法である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:02:39 GMT)
Key-Graph Transformer for Image Restoration [122.7] 本稿ではキーグラフ変換器(KGT)について紹介する。
提案したキーグラフコンストラクタは、すべてのノードの代わりに必須ノードを選択的に接続することにより、スパースだが代表的なキーグラフを効率的に形成する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:00:24 GMT)
Unified Training of Universal Time Series Forecasting Transformers [110.8] マスク型ユニバーサル時系列予測変換器(モイライ)について述べる。
Moiraiは、新たに導入された大規模オープンタイムシリーズアーカイブ(LOTSA)で訓練されており、9つのドメインで27億以上の観測が行われた。
Moiraiは、フルショットモデルと比較してゼロショットの予測器として、競争力や優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:00:45 GMT)
You Can Have Better Graph Neural Networks by Not Training Weights at
All: Finding Untrained GNNs Tickets [105.2] グラフニューラルネットワーク(GNN)の未訓練作業はまだ謎のままだ。
得られた未学習作品によって,GNNの過度なスムース化問題を大幅に軽減できることを示す。
また,そのような未学習作業が,入力摂動の分布外検出と堅牢性に優れていることも観察した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:08:53 GMT)
Fine-tuning can cripple your foundation model; preserving features may
be the solution [95.4] タスク上の概念を認識できる微調整モデルの能力は、事前訓練されたモデルに比べて大幅に低下する。
本稿では,モデルが事前学習した知識を保存できる「textitLDIFS$」というファインチューニング手法を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:28:06 GMT)
GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data
Generation [91.0] 様々な幾何学的条件をテキストプロンプトに柔軟に翻訳できるシンプルなフレームワークであるGeoDiffusionを提案する。
われわれのGeoDiffusionは、バウンディングボックスだけでなく、自動運転シーンのカメラビューのような余分な幾何学的条件もエンコードできる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:05:49 GMT)
TopoX: A Suite of Python Packages for Machine Learning on Topological
Domains [89.1] topoxはPythonのソフトウェアスイートで、トポロジ上のコンピューティングと機械学習のための信頼性とユーザフレンドリなビルディングブロックを提供する。
Topoxは3つのパッケージで構成されている。toponetxは、ノード、エッジ、高階セルなど、これらのドメインの構築と計算を容易にする。
TopomodelxはPyTorch上に構築されており、トポロジカルドメイン上のニューラルネットワークのための高階メッセージパッシング関数の包括的なツールボックスを提供する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:41:40 GMT)
Consciousness-Inspired Spatio-Temporal Abstractions for Better
Generalization in Reinforcement Learning [88.4] Skipperは、タスク時間を利用して、新しい状況下でスキルを学ぶモデルベースの強化学習エージェントである。
与えられたものをより小さく、より管理しやすいサブタスクに自動的に一般化し、スパースな意思決定を可能にする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:57:51 GMT)
Timer: Transformers for Time Series Analysis at Scale [88.0] 本稿では,大規模時系列モデル(LTSM)の早期開発を目的とした。
事前トレーニング中に、最大10億のタイムポイントを持つ大規模なデータセットをキュレートします。
多様なアプリケーションのニーズを満たすため,予測,計算,時系列の異常検出を統一的な生成タスクに変換する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:55:55 GMT)
Elijah: Eliminating Backdoors Injected in Diffusion Models via
Distribution Shift [86.9] DMの最初のバックドア検出・除去フレームワークを提案する。
DDPM, NCSN, LDMを含む3種類のDMを用いて, フレームワークのElijahを評価した。
提案手法では, モデルの有用性を著しく損なうことなく, 検出精度が100%に近づき, バックドア効果をゼロに抑えることができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:27:23 GMT)
DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion
Models [85.5] 保護されたデータセットにインジェクトされたコンテンツを配置することで、不正なデータ利用を検出する手法を提案する。
具体的には、ステルス画像ワープ機能を用いて、これらの画像にユニークな内容を追加することにより、保護された画像を修正する。
このモデルが注入されたコンテンツを記憶したかどうかを解析することにより、不正に不正に使用したモデルを検出することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:13:47 GMT)
Fine-Grained Zero-Shot Learning: Advances, Challenges, and Prospects [84.4] ゼロショット学習(ZSL)における微粒化解析の最近の進歩を概観する。
まず、各カテゴリの詳細な分析を行い、既存の手法と手法の分類について述べる。
次に、ベンチマークを要約し、公開データセット、モデル、実装、およびライブラリとしての詳細について説明する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:57:12 GMT)
Language Models are Super Mario: Absorbing Abilities from Homologous
Models as a Free Lunch [78.3] スーパーバイザード・ファインチューニングLMの能力に影響を与えることなく、ほとんどのデルタパラメータを設定するためにDAREを導入する。
次に,複数のSFTモデルのデルタパラメータを分散化するために,DAREを汎用的なプラグアンドプレイ手法として利用する。
DAREは90%または99%を無駄に除去することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:28:06 GMT)
Selecting Large Language Model to Fine-tune via Rectified Scaling Law [77.3] 制約のあるリソースを前提に、すべてのモデルを微調整し、その後の選択は非現実的である。
微調整スケーリング曲線は、よく知られた「パワーフェーズ」だけでなく、これまで観測されていなかった「プリパワーフェーズ」も含む。
本法則を利用して,資源消費の数百倍少ない最適モデルを選択する新しいLCM選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:55:00 GMT)
Generalizable Entity Grounding via Assistance of Large Language Model [77.1] 本稿では,長いキャプションから密接な視覚的実体を抽出する手法を提案する。
本研究では,意味代名詞の抽出に大規模なマルチモーダルモデル,エンティティレベルのセグメンテーションを生成するクラス-aセグメンテーションモデル,および各セグメンテーション名詞と対応するセグメンテーションマスクを関連付けるマルチモーダル特徴融合モジュールを利用する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:06:05 GMT)
Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues [75.7] 双方向ブリッジを用いた双方向オーディオ・ビジュアルデコーダ(BAVD)を提案する。
この相互作用はモダリティの不均衡を狭め、統合されたオーディオ視覚表現のより効果的な学習を促進する。
また,BAVDの微粒化誘導として,音声・視覚的フレームワイド同期のための戦略を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:02:35 GMT)
Spatio-temporal Prompting Network for Robust Video Feature Extraction [74.5] フレームテンポラリ(Frametemporal)は、ビデオ理解の分野における大きな課題の1つだ。
最近のアプローチでは、トランスフォーマーベースの統合モジュールを活用して、時間的品質情報を得る。
N-Temporal Prompting Network (NNSTP) という,クリーンで統一されたフレームワークを提案する。
ネットワークバックボーン内の入力特徴を調整することで,映像特徴の抽出を効率的に行うことができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:52:04 GMT)
AutoTimes: Autoregressive Time Series Forecasters via Large Language
Models [72.8] 本稿では,大規模言語モデル(LLM)を自動回帰時系列予測器として活用するためにAutoTimesを提案する。
提案手法は, LLM, 追加テキスト, 時系列を命令として利用することにより, 顕著な手法の一般化を実現し, 性能の向上を実現している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:59:21 GMT)
Enhancing Adversarial Training via Reweighting Optimization Trajectory [72.8] 余分な正規化、敵の重み付け、より多くのデータによるトレーニングといった欠点に対処するいくつかのアプローチが提案されている。
本稿では, 時間内学習の最適化トラジェクトリを利用するtextbfWeighted Optimization Trajectories (WOT) を提案する。
以上の結果から,WOTは既存の対人訓練手法とシームレスに統合され,頑健なオーバーフィッティング問題を一貫して克服していることがわかった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:18:30 GMT)
Transolver: A Fast Transformer Solver for PDEs on General Geometries [71.7] 本稿では, 離散化された測地の背後に隠れた本質的な物理状態を学習するTransolverについて述べる。
スライスから符号化された物理認識トークンに注意を向けることで、Transovlerは複雑な物理的相関を効果的に捉えることができる。
Transolverは6つの標準ベンチマークで22%の相対的な利得で一貫した最先端を実現し、大規模産業シミュレーションでも優れている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:37:38 GMT)
HelmFluid: Learning Helmholtz Dynamics for Interpretable Fluid
Prediction [71.2] HelmFluidは流体の正確かつ解釈可能な予測器である。
ヘルムホルツの定理に触発され、ヘルムホルツの力学を学ぶためにヘルム力学ブロックを設計する。
HelmDynamicsブロックをマルチスケールのマルチヘッド積分アーキテクチャに埋め込むことで、HelmFluidは学習したHelmholtzダイナミクスを複数の空間スケールで時間次元に沿って統合することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:28:46 GMT)
EuLagNet: Eulerian Fluid Prediction with Lagrangian Dynamics [71.2] 本稿では, タングルサム流体力学に対処する新しいラグランジアン誘導パラダイムを提案する。
ユーレリア観測に基づいて未来を予測するのではなく、ユーレリア・ラグランジアンデュアルリカレントネットワーク(EuLagNet)を提案する。
EuLagNetは、適応サンプリングされたキー粒子の複数のスケールでの運動を追跡することで、マルチスケールの流体力学をキャプチャする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:45:35 GMT)
Explore Synergistic Interaction Across Frames for Interactive Video
Object Segmentation [70.9] 複数のフレームを同時に受け入れることのできるフレームワークを提案し、フレーム間の相乗的相互作用(SIAF)を探索する。
我々のSwinB-SIAFはDAVIS 2017(89.6%、J&F@60)で最先端のパフォーマンスを達成した
我々のR50-SIAFは、挑戦的なマルチオブジェクトシナリオの下で、最先端の競合製品よりも3倍高速です。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:19:09 GMT)
TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [70.4] 時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:10:51 GMT)
Jailbreaking Attack against Multimodal Large Language Model [69.5] 本稿では,マルチモーダル大規模言語モデル(MLLM)に対するジェイルブレイク攻撃に焦点を当てた。
imgJP (emphimage Jailbreaking Prompt) の探索手法を提案する。
提案手法は, 生成したimgJPをジェイルブレイクモデルに転送できるため, 強いモデル伝達性を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:29:24 GMT)
AlignDiff: Aligning Diverse Human Preferences via Behavior-Customisable
Diffusion Model [69.1] AlignDiffは、人間の好みを定量化し、抽象性をカバーし、拡散計画をガイドする新しいフレームワークである。
ユーザがカスタマイズした動作と正確に一致し、効率的に切り替えることができます。
選好マッチング,スイッチング,カバーにおいて,他のベースラインに比べて優れた性能を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:48:30 GMT)
Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.8] 本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。
我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:28:02 GMT)
Nature-Inspired Local Propagation [68.6] 自然学習プロセスは、データの表現と学習が局所性を尊重するような方法で交わされるメカニズムに依存している。
ハミルトン方程式の構造を導出した「学習の法則」のアルゴリズム的解釈は、伝播の速度が無限大になるときにバックプロパゲーションに還元されることを示す。
これにより、バックプロパゲーションと提案されたローカルアルゴリズムの置き換えに基づく完全なオンライン情報に基づく機械学習への扉が開く。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:43:37 GMT)
Multi-modal Causal Structure Learning and Root Cause Analysis [67.7] 根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:50:38 GMT)
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large
Language Model [66.9] 我々は,ゴールドラベルへの依存を軽減するため,ゴールドラベルに依存しないプロンプト評価(GLaPE)を提案する。
GLaPEは,ゴールドラベルが存在しない場合でも,精度よく信頼性の高い評価を行う。
一般的な6つの推論タスクにおいて、GLaPEベースのプロンプト最適化により、精度ベースのプロンプトに匹敵する効果的なプロンプトが得られる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:57:54 GMT)
DiffEditor: Boosting Accuracy and Flexibility on Diffusion-based Image
Editing [66.4] 大規模テキスト・ツー・イメージ(T2I)拡散モデルは、ここ数年で画像生成に革命をもたらした。
既存の拡散型画像編集における2つの弱点を正すためにDiffEditorを提案する。
本手法は,様々な精細な画像編集タスクにおいて,最先端の性能を効率的に達成することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:50:29 GMT)
Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.1] 本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:41:20 GMT)
Fast Peer Adaptation with Context-aware Exploration [63.1] マルチエージェントゲームにおける学習エージェントに対するピア識別報酬を提案する。
この報酬は、効果的な探索と迅速な適応のための文脈認識ポリシーを学ぶためのエージェントのモチベーションとなる。
我々は,競争力のある(クーンポーカー),協力的(PO-Overcooked),あるいは混合的(Predator-Prey-W)な(Pedator-Prey-W)ゲームを含む多種多様なテストベッドについて評価を行った。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:02:27 GMT)
Exploring Homogeneous and Heterogeneous Consistent Label Associations
for Unsupervised Visible-Infrared Person ReID [62.8] 教師なし可視赤外人物再識別(USL-VI-ReID)は、アノテーションなしで異なるモードから同一人物の歩行者画像を取得することを目的としている。
均質かつ不均一なインスタンスレベルの構造を同時に説明できるModality-Unified Label Transfer (MULT) モジュールを導入する。
等質なアフィニティと異質なアフィニティの両方をモデル化し、それらを利用して擬似ラベルの不整合を定義し、最小化する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:39:34 GMT)
Point Cloud Matters: Rethinking the Impact of Different Observation
Spaces on Robot Learning [62.2] 本稿では,RGB,RGB-D,ポイントクラウドの3つのモードに着目し,異なる観測空間がロボット学習に与える影響について検討する。
ポイントクラウドベースの手法は、最もシンプルな設計であっても、パフォーマンスにおいてRGBやRGB-Dを上回ることがよくあります。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:18:45 GMT)
Physics-Inspired Degradation Models for Hyperspectral Image Fusion [61.7] ほとんどの融合法は、融合アルゴリズム自体にのみ焦点をあて、分解モデルを見落としている。
我々は、LR-HSIとHR-MSIの劣化をモデル化するための物理インスパイアされた劣化モデル(PIDM)を提案する。
提案したPIDMは,既存の核融合法における核融合性能を向上させることができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:07:28 GMT)
Generating Benchmarks for Factuality Evaluation of Language Models [61.7] FACTOR: Factual Assessment via Corpus Transformation, a scalable approach for LM factuality。
FACTORは、興味のある事実のコーパスをLMの正当性を評価するベンチマークに自動的に変換し、コーパスから真事実を生成する。
その結果, (i) ベンチマークスコアはモデルサイズに応じて増加し, LMが検索によって拡張されたときに向上する; (ii) ベンチマークスコアとパープレキシティは必ずしもモデルランキングに一致しない; (iii) パープレキシティとベンチマークスコアが一致しない場合, 後者はオープンエンド世代における事実性を反映する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:07:54 GMT)
Defining Neural Network Architecture through Polytope Structures of
Dataset [60.1] 本稿では, ニューラルネットワーク幅の上下境界を定義し, 問題となるデータセットのポリトープ構造から情報を得る。
本研究では,データセットのポリトープ構造を学習したニューラルネットワークから推定できる逆条件を探索するアルゴリズムを開発した。
MNIST、Fashion-MNIST、CIFAR10といった一般的なデータセットは、顔の少ない2つ以上のポリトップを用いて効率的にカプセル化できることが確立されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:57:42 GMT)
TrustGuard: GNN-based Robust and Explainable Trust Evaluation with
Dynamicity Support [59.4] 本稿では,信頼度を考慮した信頼度評価モデルであるTrustGuardを提案する。
TrustGuardは、スナップショット入力層、空間集約層、時間集約層、予測層を含む階層アーキテクチャで設計されている。
実験により、TrustGuardは、シングルタイムスロットとマルチタイムスロットの信頼予測に関して、最先端のGNNベースの信頼評価モデルより優れていることが示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:19:35 GMT)
CogVLM: Visual Expert for Pretrained Language Models [56.7] 我々は,オープンソースのビジュアル言語基盤モデルであるCogVLMを紹介する。
CogVLMは、凍結した事前訓練された言語モデルとイメージエンコーダの間のギャップを、注意とFFN層でトレーニング可能なビジュアルエキスパートモジュールによって埋める。
CogVLM-17Bは、NoCaps、Flicker30kキャプション、RefCOCO、RefCOCOg、Visual7W、GQA、ScienceQA、VizWiz VQA、TDIUCを含む10の古典的なクロスモーダルベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:23:04 GMT)
CNS-Edit: 3D Shape Editing via Coupled Neural Shape Optimization [56.5] 本稿では、3次元形状編集を潜在空間で暗黙的に行うために,結合表現とニューラルボリューム最適化に基づく新しい手法を提案する。
まず,3次元形状編集を支援する結合型ニューラル形状表現を設計する。
第二に、結合したニューラルネットワークの形状最適化手順を定式化し、編集操作対象の2つの結合した成分を協調最適化する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:52:56 GMT)
Smaller Language Models are Better Black-box Machine-Generated Text
Detectors [56.4] 小型で部分的に訓練されたモデルは、より優れたユニバーサルテキスト検出器である。
検出器とジェネレータが同一データでトレーニングされたかどうかが検出成功にとって重要でないことが判明した。
例えば、OPT-125Mモデルは、ChatGPT世代を検出するのにAUCが0.81であり、GPTファミリーのより大きなモデルであるGPTJ-6BはAUCが0.45である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:25:34 GMT)
FreDF: Learning to Forecast in Frequency Domain [56.2] 時系列モデリングは、歴史的シーケンスとラベルシーケンスの両方に自己相関が存在するという点で、独特な課題である。
本稿では、周波数領域の予測を学習することでラベル自己相関の複雑さを回避できる周波数強調直接予測(FreDF)を導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:23:41 GMT)
Layer-Wise Analysis of Self-Supervised Acoustic Word Embeddings: A Study
on Speech Emotion Recognition [55.0] 連続表現から派生した長さの固定長特徴である音響単語埋め込み(AWE)について検討し,その利点について検討した。
AWEは以前、音響的識別可能性の把握に有用であることを示した。
以上の結果から,AWEが伝達する音響的文脈が明らかになり,高い競争力を持つ音声認識精度が示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:24:54 GMT)
Integration of cognitive tasks into artificial general intelligence test
for large models [54.7] 我々は,大規模言語モデルとマルチモーダル大規模モデルのテストニーズを満たすために,人工知能(AGI)テストの包括的なフレームワークを提唱する。
AGIテストは認知科学と自然言語処理を橋渡しし、知能のあらゆる側面を包含する。
我々は認知科学にインスパイアされたAGIテストが、特定の知能の次元における大きなモデルの改善を効果的に導くと信じている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:50:42 GMT)
Riemannian Preconditioned LoRA for Fine-Tuning Foundation Models [54.0] 各ステップで$rtimes r$ preconditionerを導入します。
プレコンディショナーでは,SGDとAdamWの収束と信頼性を大幅に向上させることができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:05:43 GMT)
Revisiting the Power of Prompt for Visual Tuning [53.1] 本研究では,プロンプトとパッチトークンの相互関係について検討した。
プロンプトトークンはパッチトークンと高い相互情報を共有する傾向にあるという観測から着想を得て,下流トークンのプロトタイプを用いた初期化プロンプトを提案する。
本手法は, 自己指導型プレトレーニングの適応性を著しく向上させ, 少なくとも10%から30%のタスク性能向上を実現した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:49:02 GMT)
CompeteSMoE -- Effective Training of Sparse Mixture of Experts via
Competition [52.2] スパース・ミックス・オブ・エキスパート(SMoE)は、ネットワークの深さや幅を増大させる平均を超えた、モデルの複雑さをスケールアップする魅力的なソリューションを提供する。
本稿では,この表現崩壊の根本的な課題に対処する競合機構を提案する。
入力を最も高い神経応答を持つ専門家にのみルーティングすることにより、コンペティションが最適推定器と同じ収束率を持つことを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:17:09 GMT)
Towards an Information Theoretic Framework of Context-Based Offline
Meta-Reinforcement Learning [51.0] コンテクストベースのOMRL(COMRL)は,効率的なタスク表現を前提としたユニバーサルポリシーの学習を目的としている。
我々はCOMRLアルゴリズムが,タスク変数$boldsymbolM$と,その潜在表現$boldsymbolZ$の相互情報目的を,様々な近似境界を実装して最適化していることを示す。
理論的な洞察と情報ボトルネックの原理に基づいて、我々はUNICORNと呼ばれる新しいアルゴリズムに到達し、RLベンチマークの幅広い範囲にわたって顕著な一般化を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:58:42 GMT)
Incremental Quasi-Newton Methods with Faster Superlinear Convergence
Rates [50.4] 各成分関数が強く凸であり、リプシッツ連続勾配とヘシアンを持つ有限和最適化問題を考える。
最近提案されたインクリメンタル準ニュートン法は、BFGSの更新に基づいて、局所的な超線形収束率を達成する。
本稿では、対称ランク1更新をインクリメンタルフレームワークに組み込むことにより、より効率的な準ニュートン法を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:54:51 GMT)
A Graph is Worth $K$ Words: Euclideanizing Graph using Pure Transformer [50.1] 我々は、非ユークリッドグラフをユークリッド空間で学習可能なグラフ語に変換するGraph2Seqエンコーダを特徴とするGraphsGPTを紹介する。
GraphGPTデコーダは、元のグラフをグラフ語から再構成し、情報等価性を保証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:29:40 GMT)
VIGC: Visual Instruction Generation and Correction [47.5] 視覚言語タスクのための高品質なインストラクションチューニングデータの不足は依然として課題である。
LLaVAのような現在の主要なパラダイムは、データを生成するために言語のみのGPT-4に依存している。
本稿では,マルチモーダルな大規模言語モデルによる命令調整データの生成を可能にするビジュアルインストラクション生成と補正フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:46:03 GMT)
REFINER: Reasoning Feedback on Intermediate Representations [47.4] 中間推論を生成するための言語モデルを微調整するフレームワークであるREFINERを紹介する。
REFINERは、推論に対する自動フィードバックを提供する批評家モデルと対話することで機能する。
経験的評価は、同等のスケールのベースラインLMよりも大幅に改善された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:15:18 GMT)
PoCo: Policy Composition from and for Heterogeneous Robot Learning [47.3] 現在のメソッドは通常、1つのポリシーをトレーニングするために、1つのドメインからすべてのデータを収集し、プールします。
多様なモダリティやドメインにまたがる情報を組み合わせるための,ポリシ・コンポジションと呼ばれる柔軟なアプローチを提案する。
提案手法はタスクレベルの構成をマルチタスク操作に使用することができ,分析コスト関数を用いて推論時のポリシー動作を適応させることができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:51:49 GMT)
Differentially Private Domain Adaptation with Theoretical Guarantees [46.4] 多くのアプリケーションでは、ラベル付きデータの処分におけるラベル付きデータはプライバシー上の制約を受けており、比較的制限されている。
これは、パブリックソースからプライベートターゲットドメインへのドメイン適応を監督する現代の問題である。
我々は、理論的な学習保証の恩恵を受けるために、一般の学習者を利用する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:00:31 GMT)
Closed-Loop Unsupervised Representation Disentanglement with $\beta$-VAE
Distillation and Diffusion Probabilistic Feedback [45.7] 表現の混乱は、AIが現実世界を根本的に理解し、差別と生成の両方に利益をもたらす可能性がある。
我々はtextbfCL-Dis と呼ばれる textbfCL-Disentanglement アプローチを提案する。
実画像操作や視覚解析といったアプリケーションにおけるCL-Disの優位性を示す実験がある。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:03:22 GMT)
Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement
Learning with Diverse Human Feedback [45.2] 本稿では,RLHFに適したシステム実装であるUni-RLHFを紹介する。
Uni-RLHFには,1)ユニバーサルなマルチフィードバックアノテーションプラットフォーム,2)大規模なクラウドソースフィードバックデータセット,3)モジュール化されたオフラインRLHFベースライン実装の3つのパッケージが含まれている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:40:22 GMT)
Cyto R-CNN and CytoNuke Dataset: Towards reliable whole-cell
segmentation in bright-field histological images [44.8] 我々は,セル全体を鮮視野画像に正確に分割できるネットワークアーキテクチャCyto R-CNNを提案する。
また,頭頸部扁平上皮癌細胞に対する数千の手動アノテーションからなる新しいデータセットCytoNukeも提示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:47:28 GMT)
Formal-LLM: Integrating Formal Language and Natural Language for
Controllable LLM-based Agents [42.4] 大規模言語モデル(LLM)により、AIエージェントは複雑なタスクを解決するためのマルチステッププランを自動的に生成し実行することができる。
しかし、現在のLLMベースのエージェントは、しばしば無効または実行不可能な計画を生成する。
本稿では,自然言語の表現性と形式言語の精度を統合することで,LLMをベースとしたエージェントのための新しいフォーマルLLM'フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:16:48 GMT)
Your Diffusion Model is Secretly a Certifiably Robust Classifier [42.3] 我々はノイズ拡散(NDC)と呼ばれる新しい拡散分類器群を提案する。
NDCは、破損したデータの低いバウンダリの証拠を導き、国家技術に認定されたロバスト性を持っている。
我々は、それぞれ 0.25 と 0.5 未満の敵ノルムの下で、CIFAR-10 で80%以上、70%以上認証されたロバスト性を達成した最初の人物である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:09:18 GMT)
Diversity Measurement and Subset Selection for Instruction Tuning
Datasets [40.9] 決定点プロセスを用いて、サブセット選択のための命令チューニングデータセットの多様性と品質をキャプチャする。
興味のあるデータセットと最も多様な参照データセットとの距離であるログ決定距離でデータセットの多様性を測定することを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:09:43 GMT)
Tackling Hybrid Heterogeneity on Federated Optimization via Gradient
Diversity Maximization [40.5] フェデレートラーニング(Federated Learning)とは、データサンプルを分散化し、複数のクライアントに分散する分散機械学習パラダイムである。
統計学とシステム不均一性の複合効果は、フェデレート最適化の効率を著しく低下させる。
本稿では,サーバサイドのグラデーションに基づくFedtextscAWAREを理論的保証付きで導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:33:24 GMT)
Video Editing for Video Retrieval [40.2] ビデオクリップ編集のために学生-教師ネットワークが導入された。
教師モデルはトレーニングセットのクリップを編集するために使用され、学生モデルは編集されたクリップを訓練する。
3つのビデオ検索データセット、YouCook2、DiDeMo、ActivityNet-Captionsで行った実験では、編集済みクリップは3つの検索モデルすべてにわたって、初期クリップよりも検索性能を一貫して改善している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:13:31 GMT)
The Virtues of Pessimism in Inverse Reinforcement Learning [39.0] 逆強化学習(Inverse Reinforcement Learning)は、専門家によるデモンストレーションから複雑な振る舞いを学ぶための強力なフレームワークである。
内ループRLにおける専門家のデモンストレーションを活用することにより、探査負担を軽減することが望ましい。
我々は、IRLにおけるRLの高速化のための代替アプローチとして、Emphpessimism、すなわち、オフラインのRLアルゴリズムを用いてインスタンス化された専門家のデータ分布に近づき続けることを考える。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:22:29 GMT)
Copyright Protection in Generative AI: A Technical Perspective [38.8] ジェネレーティブAIは近年急速に進歩し、テキスト、画像、オーディオ、コードなどの合成コンテンツを作成する能力を拡大している。
これらのディープ・ジェネレーティブ・モデル(DGM)が生成したコンテンツの忠実さと信頼性が、著作権の重大な懸念を引き起こしている。
この研究は、技術的観点から著作権保護の包括的概要を提供することで、この問題を深く掘り下げている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:00:33 GMT)
Rethinking STS and NLI in Large Language Models [38.7] 我々は、意味的なテキストの類似性と自然言語の推論を再考しようと試みている。
臨床・バイオメディカル領域におけるSTSおよびNLIの性能について検討した。
次に, LLMの予測的信頼度と, 集団的人間の意見の収集能力を評価する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:44:34 GMT)
Large Language Model Adaptation for Networking [38.2] NetLLMは、ネットワーク問題を解決するために大規模言語モデルを効率的に適応する最初のフレームワークである。
我々は、NetLLMがVPが10.1-36.6%、ABRが14.5-36.6%、CJSが6.8-41.3%、そして、優れた一般化性能を実現していることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:21:34 GMT)
DenseFormer: Enhancing Information Flow in Transformers via Depth
Weighted Averaging [37.8] 我々はDenseFormerを提案する。DenseFormerは、モデルのサイズを増大させることなく、モデルの難易度を向上する標準アーキテクチャの簡単な修正である。
提案手法は,現在および過去の表現の重み付き平均を計算する,各変圧器ブロックの後の加算平均ステップに依存する。
実験によると、DenseFormerはよりデータ効率が高く、より深いトランスフォーマーモデルと同じ難易度に達する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:44:09 GMT)
Advancing Graph Representation Learning with Large Language Models: A
Comprehensive Survey of Techniques [37.6] グラフ表現学習(GRL)とLLM(Large Language Models)の統合は、複雑なデータ構造を分析する上で重要な進化である。
このコラボレーションは、LLMの洗練された言語機能を活用して、グラフモデルの文脈的理解と適応性を改善する。
LLMをグラフ領域に統合する研究団体が増えているにもかかわらず、コアコンポーネントとオペレーションを深く分析する包括的なレビューは特に欠落している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:51:14 GMT)
GeReA: Question-Aware Prompt Captions for Knowledge-based Visual
Question Answering [37.1] マルチモーダルな大言語モデル(MLLM)は,視覚的理解能力に優れる大規模言語モデル(LLM)よりも暗黙的な知識エンジンである,と我々は主張する。
InstructBLIPのようなMLLMに問題のある視覚と言語情報を与え、知識関連記述を生成するジェネレーション・レアソン・フレームワークであるGeReAを提案する。
具体的には、質問関連画像領域と質問特化マニュアルプロンプトをMLLMに符号化し、知識関連記述を生成する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:28:23 GMT)
Optimal Parameter and Neuron Pruning for Out-of-Distribution Detection [36.5] 我々は,textbfOptimal textbfParameter と textbfNeuron textbfPruning (textbfOPNP) アプローチを提案し,OODサンプルを検出する。
我々の提案は、トレーニングフリーで、他のポストホックメソッドと互換性があり、すべてのトレーニングデータから情報を探索する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:31:06 GMT)
AI Art Neural Constellation: Revealing the Collective and Contrastive
State of AI-Generated and Human Art [36.2] 我々は、人間の芸術遺産の文脈内でAI生成芸術を位置づけるための包括的な分析を行う。
私たちの比較分析は、ArtConstellationと呼ばれる広範なデータセットに基づいています。
鍵となる発見は、1800-2000年に作られた現代美術の原理とAIが生成したアートアートが視覚的に関連していることである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:49:51 GMT)
AI-Generated Content Enhanced Computer-Aided Diagnosis Model for Thyroid
Nodules: A ChatGPT-Style Assistant [36.0] 人工知能によるコンピュータ支援診断(AIGC-CAD)モデルがThyGPTとして開発されている。
このモデルはChatGPTのアーキテクチャにインスパイアされたもので、甲状腺結節のリスクをセマンティックレベルの人間と機械の相互作用を通じて評価するのに役立つ。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:24:13 GMT)
DeLLMa: A Framework for Decision Making Under Uncertainty with Large
Language Models [34.7] 大規模言語モデル(LLM)は、ビジネス、エンジニアリング、医療といった分野を含む、社会全体でますます使われている。
本研究では,不確実な環境における意思決定精度を高めるためのフレームワークであるDeLLMaを提案する。
以上の結果から,DeLLMaはLLM判定性能を大幅に向上し,競合手法よりも40%の精度向上が達成できることがわかった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:11:45 GMT)
DeepZero: Scaling up Zeroth-Order Optimization for Deep Model Training [34.2] ゼロオーダー(ZO)最適化は、機械学習(ML)問題を解決する一般的なテクニックとなっている。
ディープニューラルネットワーク(DNN)のトレーニングにおけるZO最適化の有効性を、パフォーマンスを著しく低下させることなく実証した以前の研究はない。
我々は,ZO最適化をDNNトレーニングにスクラッチから拡張可能なZOディープラーニング(DL)フレームワークであるDeepZeroを開発した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:55:18 GMT)
Discovering More Effective Tensor Network Structure Search Algorithms
via Large Language Models (LLMs) [34.0] ネットワーク構造探索(TN-SS)は,高次元問題を表現するために適切なテンソルネットワーク(TN)構造を探索することを目的としている。
より効率的なアルゴリズムを開発するために,TN-SSアルゴリズムの自動設計のために,大規模言語モデル(LLM)に埋め込まれた知識について検討する。
我々のアプローチはGPTN-SSと呼ばれ、進化的な方法で動作するLSMベースの巧妙なプロンプトシステムを活用している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:06:13 GMT)
Language is All a Graph Needs [34.0] InstructGLM (Instruction-finetuned Graph Language Model) を提案する。
我々の手法は、ogbn-arxiv, Cora, PubMedデータセット上のすべてのGNNベースラインを超える。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:08:05 GMT)
STEVE-1: A Generative Model for Text-to-Behavior in Minecraft [33.6] 本研究は,命令ラベル付き軌道の大規模なデータセットに頼ることなく,行動生成モデルを生成する手法を提案する。
STEVE-1と呼ばれる命令調整型ビデオ事前訓練(VPT)モデルを作成し、マインクラフトで短時間のオープンエンドテキストとビジュアルインストラクションを追跡できる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:57:08 GMT)
CoRaiS: Lightweight Real-Time Scheduler for Multi-Edge Cooperative Computing [33.0] 複数のエッジの制約されたリソースを強力なリソースプールに結合するマルチエッジ協調コンピューティングは、大きな利益をもたらす可能性がある。
しかし、大量の異種資源の構成とスケジューリング戦略の欠如により、マルチエッジコンピューティングシステムのモデリングと協調が特に複雑になる。
本稿では、まず、複雑なハードウェア構成を保護し、異種エッジで異なるサービス機能を再定義するシステムレベルの状態評価モデルを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:21:45 GMT)
AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly
Detection [32.9] AnomalyCLIPはオブジェクトに依存しないテキストを学習し、画像の一般的な正規性と異常をキャプチャする。
AnomalyCLIPは、非常に多様なクラスセマンティクスのデータセットにおける異常の検出とセグメンテーションにおいて、優れたゼロショット性能を実現する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:28:24 GMT)
Pathformer: Multi-scale transformers with Adaptive Pathways for Time
Series Forecasting [32.9] 適応経路を有するマルチスケールトランス (Pathformer) を提案する。
Pathformerは時間分解能と時間距離を統合してマルチスケールモデリングを行う。
実世界の11のデータセットの実験では、Pathformerは現在のモデルをすべて越えて最先端のパフォーマンスを達成するだけでなく、さまざまなトランスファーシナリオ下でのより強力な一般化能力も示している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:33:58 GMT)
Language Models Understand Numbers, at Least Partially [32.5] 大規模言語モデル(LLM)は様々なタスクにおいて顕著な能力を示してきたが、その内部メカニズムは数学的な問題での使用を妨げる。
言語モデルが数学の基本要素である数を理解するかどうかを考察する。
予備的な研究は、LLMが数の部分的な理解を示し、将来のモデルの数学的能力に関する研究の洞察を提供することを示唆している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:26:41 GMT)
RealFM: A Realistic Mechanism to Incentivize Federated Participation and
Contribution [32.5] フェデレーション学習(FL)におけるエッジデバイス参加は、通常、デバイスサーバ間通信(デバイスドロップアウトなど)のレンズの下で研究される。
本稿では,デバイスユーティリティを現実的にモデル化する最初のフェデレーション機構であるRealFMを提案する。(2)データコントリビューションとデバイス参加のインセンティブ,(3)フリーライダージレンマを確実に取り除き,(4)データの均一性,データ共有,金銭的報酬支払いに関する仮定を緩和する。
実世界のデータでは、RealFMはデバイスユーティリティとサーバユーティリティ、データコントリビューションを、ベースラインと比較してそれぞれ3倍と4倍改善する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:53:13 GMT)
Empowering Computing and Networks Convergence System with Distributed
Cooperative Routing [32.3] 本稿では,CNCシステムのための分散協調型ルーティングフレームワークを提案する。
クロスプレーン協調型エンドツーエンドルーティング方式では、ルーティングプランを作成しながら、異種サーバの効率とネットワーク混雑度の両方を考慮する。
シミュレーションの結果は、CNCシステムにおける計算要求のスケジューリングにおけるルーティング方式の性能を裏付けるものである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:44:06 GMT)
NavHint: Vision and Language Navigation Agent with a Hint Generator [31.3] 我々は、詳細な視覚的記述を提供するヒント生成装置を通じて、ナビゲーションエージェントに対して間接的な監視を行う。
ヒントジェネレータは、ナビゲーションエージェントが視覚環境のグローバルな理解を開発するのを支援する。
提案手法をR2RとR4Rのデータセット上で評価し,いくつかの指標で最先端を実現する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:23:16 GMT)
Interference-Aware Emergent Random Access Protocol for Downlink LEO
Satellite Networks [31.0] 本稿では,低地球軌道(LEO)衛星ネットワークをダウンリンクするための多重アクセスプロトコルを訓練するための多エージェント深部強化学習フレームワークを提案する。
既存の学習プロトコルであるeRACHの改良により,eRACHのための集中型および圧縮型創発型信号処理法であるeRACHは,衛星間干渉を軽減することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:27:59 GMT)
A Survey on Robotics with Foundation Models: toward Embodied AI [31.0] 近年のコンピュータビジョン,自然言語処理,マルチモーダリティ学習の進歩は,基礎モデルが特定のタスクに対して超人的能力を持つことを示している。
この調査は、ロボット工学の基礎モデルの包括的で最新の概要を提供し、自律的な操作に焦点を当て、高レベルの計画と低レベルの制御を包含することを目的としている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:55:01 GMT)
Factuality of Large Language Models in the Year 2024 [30.3] 我々は、主要な課題とその原因を特定することを目的として、既存の研究を批判的に分析する。
オープンエンドテキスト生成における事実自動評価の障害を解析する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:36:31 GMT)
Diffusion Model-Based Multiobjective Optimization for Gasoline Blending
Scheduling [30.0] ガソリンブレンドスケジューリングは、精製所の生産要求を満たすためにリソース割り当てとオペレーションシークエンシングを使用する。
非線形性、整数制約、および多数の決定変数の存在は、この問題に複雑さをもたらす。
本稿では拡散モデル(DMO)により駆動される新しい多目的最適化手法を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:46:28 GMT)
Active Learning for Graphs with Noisy Structures [29.8] グラフニューラルネットワーク(GNN)は、十分なラベル付きノードの可用性に大きく依存するノード分類などのタスクで大きな成功を収めている。
しかし、大規模グラフのラベル付けの過度なコストは、下流モデルの性能を最大化するための効率的なデータ選択を目的としたグラフのアクティブラーニングに焦点を合わせた。
本稿では,データ選択とグラフ浄化を同時に行うための反復的アプローチと,前回の反復から学習した最良の情報とを併用した,アクティブな学習フレームワークであるGALCleanを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:23:45 GMT)
MoE-LLaVA: Mixture of Experts for Large Vision-Language Models [29.2] 本稿では,LVLMのための簡易かつ効果的なトレーニング戦略であるMoE-Tuningを提案する。
MoE-LLaVAはMoEベースのスパースLVLMアーキテクチャで、ルータを通じてトップkの専門家のみをユニークに起動する。
様々な視覚的理解と物体幻覚のベンチマークにおいて,MoE-LLaVAの顕著な性能を示す実験を行った。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:55:33 GMT)
BRAIn: Bayesian Reward-conditioned Amortized Inference for natural
language generation from feedback [29.1] 本稿では,分布マッチング手法の一環として,リワードモデル(RM)を再導入する新しい手法であるBRAInを提案する。
BRAInは,要約やアントロピックHHタスクにおいて,先行技術よりも優れていた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:16:29 GMT)
MentaLLaMA: Interpretable Mental Health Analysis on Social Media with
Large Language Models [28.6] ソーシャルメディア上に,最初のマルチタスクおよびマルチソース解釈可能なメンタルヘルスインストラクションデータセットを構築した。
専門家が作成した数発のプロンプトとラベルを収集し,ChatGPTをプロンプトし,その応答から説明を得る。
IMHIデータセットとLLaMA2ファンデーションモデルに基づいて、メンタルヘルス分析のための最初のオープンソースLLMシリーズであるMentalLLaMAを訓練する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:47:49 GMT)
Conversational Crowdsensing: A Parallel Intelligence Powered Novel
Sensing Approach [28.4] 本稿では,産業用5.0のための新しいセンシングパラダイム,すなわち対話型群集センシングを提案する。
個人の作業負荷と専門的要件を緩和し、多様な労働力の組織と運用を促進することができる。
我々は,自然言語による会話が,クラウドセンシング過程における主要なコミュニケーションチャネルになることを期待している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:10:11 GMT)
SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.8] 本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:07:49 GMT)
PuzzleBench: Can LLMs Solve Challenging First-Order Combinatorial
Reasoning Problems? [27.7] LLMが一階述語推論問題に挑戦できるかどうかを考察する。
我々は,PuzzleBenchを31の難解パズルのデータセットとして提示する。シンボリック・ソルバによって支援された場合においても,我々のベンチマークではかなり低性能である。
そこで本研究では,LLMとシンボルソルバとプログラムインタプリタを組み合わせた新しいアプローチであるPuzzle-LMを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:56:09 GMT)
Adapt and Diffuse: Sample-adaptive Reconstruction via Latent Diffusion
Models [27.6] 逆問題は、ノイズや(非線形でない)観測からクリーンな信号を回復することが目的である複数のアプリケーションで発生する。
本稿では,オートエンコーダの潜伏空間における劣化の重大度を推定する手法を提案する。
推定重大度が真の汚損レベルと強く相関していることを示し,サンプル・バイ・サンプルに基づく復元問題の難しさを示唆する有用なヒントを与える。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:04:10 GMT)
Latent Graph Diffusion: A Unified Framework for Generation and
Prediction on Graphs [27.5] まず,各カテゴリのノード,エッジ,グラフレベルの特徴を同時に生成できる生成モデルであるLatent Graph Diffusion(LGD)を提案する。
次に、回帰と分類を含む予測タスクを(条件付き)生成として定式化し、LGDが証明可能な保証付きの全レベルのタスクを解けるようにした。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:03:47 GMT)
UniTSyn: A Large-Scale Dataset Capable of Enhancing the Prowess of Large
Language Models for Program Testing [27.5] 単体テスト合成のためのLLMの高度化が可能な大規模データセットUniTSynを提案する。
Language Server Protocolを活用することで、UniSynは、プロジェクトごとの実行セットアップや言語ごとのセットアップなしでフォーカス-テストペアを収集するという挑戦的な目標を達成する。
実験により、UniTSynをベースとした自己回帰モデルを構築することにより、単体テスト表現の学習と理解において大きなメリットが得られます。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:48:05 GMT)
DeSparsify: Adversarial Attack Against Token Sparsification Mechanisms
in Vision Transformers [27.4] DeSparsifyはトークンスペーサー機構を用いた視覚変換器の可用性を狙った攻撃である。
この攻撃は、ステルス性を維持しながら、オペレーティングシステムのリソースを浪費することを目的としている。
攻撃の影響を軽減するため,様々な対策を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:59:35 GMT)
KICGPT: Large Language Model with Knowledge in Context for Knowledge
Graph Completion [27.4] 本稿では,大規模言語モデルと3次元KGCレトリバーを統合したフレームワークKICGPTを提案する。
追加のトレーニングオーバーヘッドを発生させることなく、長い尾の問題を軽減する。
ベンチマークデータセットの実証結果は、KICGPTの有効性を示し、トレーニングオーバーヘッドは小さく、微調整は行わない。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:01:07 GMT)
BiSwift: Bandwidth Orchestrator for Multi-Stream Video Analytics on Edge [26.8] BiSwiftは、マルチレベルパイプラインと統合された新しい適応型ハイブリッドによって、同時リアルタイムビデオ分析をスケールする、双方向フレームワークである。
BiSwiftは10%$sim$21%の精度を改善し、最先端のビデオ分析パイプラインと比較して1.2$sim$9$times$スループットを提供する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:32:35 GMT)
Refined Temporal Pyramidal Compression-and-Amplification Transformer for
3D Human Pose Estimation [26.6] ビデオシーケンス中の人間の3Dポーズを正確に推定するには、精度とよく構造化されたアーキテクチャの両方が必要である。
本稿では,RTPCA(Refined Temporal Pyramidal Compression-and-Amplification)変換器を紹介する。
本稿では,Human3.6M,HumanEva-I,MPI-INF-3DHPベンチマーク上でのRTPCAの有効性を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:17:28 GMT)
The Fair Value of Data Under Heterogeneous Privacy Constraints in
Federated Learning [26.5] 本稿では,公正性の公理的定義に基づいて,ユーザのプライバシレベルでデータを補償するtextitfairの量を提案する。
また、ユーザのためのプライバシレベルオプションを備えたプラットフォームに対して、不均一なフェデレーション付き学習問題を定式化します。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:32:55 GMT)
M2-Encoder: Advancing Bilingual Image-Text Understanding by Large-scale
Efficient Pretraining [26.3] 我々は、60億以上の画像テキストペアを持つ包括的バイリンガルデータセットBM-6Bを導入する。
このようなデータセットのスケールを扱うために,画像テキストのコントラッシブな損失計算のためのグループ集約手法を提案する。
BM-6B上での細粒度理解能力を向上したバイリンガル画像テキスト基盤モデルの事前訓練を行う。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:30:07 GMT)
NOAH: Learning Pairwise Object Category Attentions for Image
Classification [26.1] Non-glObal Attentive Head (NOAH)は、ペアワイドオブジェクトカテゴリーアテンション (POCA) と呼ばれる新しい点積アテンションである。
ドロップイン設計として、NOAHは様々な種類のDNNの既存のヘッドを置き換えるのに容易に使用できる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:19:40 GMT)
A decoder-only foundation model for time-series forecasting [26.0] 我々のモデルは,大規模時系列コーパス上でパッチ付きデコーダスタイルのアテンションモデルを事前学習することに基づいている。
予測履歴の長さ、予測長、時間的粒度の異なる範囲でうまく機能する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:19:59 GMT)
Multimodal Federated Learning with Missing Modality via Prototype Mask
and Contrast [23.9] 本稿では,FedAvgベースのFederated Learningフレームワークにプロトタイプライブラリを導入する。
提案手法は,タスク校正されたトレーニング損失とモデルに依存しない一様性推論戦略を定式化するために,欠落したモダリティを表すマスクとしてプロトタイプを利用する。
ベースラインと比較して,トレーニング中に50%のモダリティが欠落し,一様性推論時に23.8%の精度で推論精度が3.7%向上した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:44:56 GMT)
Entire Chain Uplift Modeling with Context-Enhanced Learning for
Intelligent Marketing [23.2] オンラインマーケティングにおいて不可欠なアップリフトモデリングは、個別処理効果(ITE)を予測することにより、クーポンや割引などの様々な戦略がユーザに与える影響を正確に測定することを目指している。
本稿では,これらの問題に対処するために考案されたコンテキスト強化学習(ECUP)を用いたEntire Chain UPlift法を紹介する。
ECUPは,1)チェーン空間全体にわたるITTの推定にユーザ行動パターンを利用するEntire Chain-Enhanced Networkと,すべての段階にわたるコンテキスト認識を強化するタスク事前情報の統合,2)異なるタスクに対する処理の影響の把握,の2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:30:25 GMT)
Does DetectGPT Fully Utilize Perturbation? Selective Perturbation on
Model-Based Contrastive Learning Detector would be Better [22.8] 本稿では,ランダムマスキングによる情報損失を軽減するために選択的戦略摂動を用いた新しい検出器Pecolaを提案する。
実験により、ペコラは4つの公開データセットで平均1.20%の精度でSOTA法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:23:23 GMT)
Embedding Non-Distortive Cancelable Face Template Generation [22.8] 我々は、目では認識できないが、任意のカスタム埋め込みニューラルネットワークモデルで識別可能な顔画像を実現する革新的な画像歪み技術を導入する。
生体認証ネットワークの信頼性を,予測された同一性を変化させない最大画像歪みを判定することによって検証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:39:18 GMT)
Learning Mutual Excitation for Hand-to-Hand and Human-to-Human
Interaction Recognition [22.5] 相互励起グラフ畳み込み層を積み重ねた相互励起グラフ畳み込みネットワーク(me-GCN)を提案する。
Me-GCは各レイヤとグラフ畳み込み操作の各ステージで相互情報を学習する。
提案するme-GCは,最先端GCN法およびTransformer法より優れている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:00:00 GMT)
CharSpan: Utilizing Lexical Similarity to Enable Zero-Shot Machine
Translation for Extremely Low-resource Languages [22.5] 我々は,超低リソース言語 (ELRL) から英語への機械翻訳 (MT) の課題を,「近縁」な高リソース言語 (HRL) からの言語間移動を活用して解決する。
多くのERRLは、いくつかのHRLと語彙的類似性を共有しており、新しいモデリングの機会を提供する。
既存のサブワードベースのニューラルMTモデルは、HRLとELRLの埋め込み空間を暗黙的に調整するだけであるため、この語彙的類似性を明示的に利用しない。
HRLのトレーニングデータに「文字スパンノイズ増強」に基づく新しいCharSpanアプローチを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:21:03 GMT)
Computing high-dimensional optimal transport by flow neural networks [22.3] この研究はフローベースモデルを開発し、P$から任意の$Q$に転送する。
本稿では,フローニューラルネットワークのトレーニングにより,$P$と$Q$の間の動的最適輸送を学習することを提案する。
訓練された最適輸送流はその後、無限小密度推定(DRE)や、生成モデルのための潜在空間における分布を含む多くの下流タスクを実行することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:51:43 GMT)
DefInt: A Default-interventionist Framework for Efficient Reasoning with
Hybrid Large Language Models [21.3] 本稿では,ハイブリッド大言語モデルの相乗的ポテンシャルを解き放つために,デフォルト・インターベンショニスト・フレームワーク(DefInt)を提案する。
Defintは、最先端の推論精度とソリューションの多様性を一貫して達成する。
トークンのコストは第2の正確なベースラインに比べて49%-79%削減される。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:45:01 GMT)
DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based
Trajectory Stitching [21.3] オフライン強化学習(RL)では、学習ポリシーのパフォーマンスはオフラインデータセットの品質に大きく依存する。
本稿では拡散に基づく新しいデータ拡張パイプラインであるDiffStitchについて紹介する。
DiffStitchは、ローリワード軌道と高リワード軌道を効果的に接続し、オフラインRLアルゴリズムが直面する課題に対処するために、グローバルに最適な軌道を形成する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:30:23 GMT)
Enhancing Transformer RNNs with Multiple Temporal Perspectives [21.2] 本稿では、リカレントニューラルネットワーク(RNN)アーキテクチャに適用可能な新しいアプローチである、複数時間視点の概念を紹介する。
この方法は、以前遭遇したテキストの多様な時間的ビューを維持することを含み、コンテキストを解釈する言語モデルの能力を大幅に強化する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:12:29 GMT)
Does Long-Term Series Forecasting Need Complex Attention and Extra Long
Inputs? [21.2] トランスフォーマーベースのモデルは、様々な時系列タスクにおいて印象的なパフォーマンスを達成した。
近年、LTSF(Long-Term Series Forecasting)タスクも注目されている。
トランスフォーマーベースの手法を要求される計算複雑性と長いシーケンスのため、LTSFタスクへの適用には2つの大きな問題がある。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:42:26 GMT)
Spin: An Efficient Secure Computation Framework with GPU Acceleration [20.7] SpinはGPUアクセラレーションされたMPCフレームワークで、複数の計算パーティをサポートする。
Spinは、ディープニューラルネットワークトレーニングの最先端技術よりも最大2倍高速になる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:12:15 GMT)
PROSAC: Provably Safe Certification for Machine Learning Models under
Adversarial Attacks [20.7] 最先端の機械学習モデルは、敵の摂動によって深刻な危険にさらされる可能性がある。
本稿では,敵対的攻撃が存在する場合に,機械学習モデルの性能を証明するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:45:20 GMT)
Knowledge Generation for Zero-shot Knowledge-based VQA [20.7] 知識に基づく視覚的質問応答(K-VQA)に対する従来の解決策は、外部知識ベースから知識を取得し、教師付き学習を用いてK-VQAモデルを訓練する。
我々は、LLMから知識を生成し、K-VQAの知識をゼロショットで組み込む、類似した知識生成ベースのK-VQA法を提案し、テストする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:41:35 GMT)
martFL: Enabling Utility-Driven Data Marketplace with a Robust and Verifiable Federated Learning Architecture [20.5] セキュアなユーティリティ駆動型データマーケットプレースを実現するために特別に設計された,最初のフェデレーション付き学習アーキテクチャであるmartFLを提案する。
MartFLは、2つの革新的な設計によって実現されている: (i) 堅牢な局所モデル集約を実現する品質対応モデル集約プロトコル。
martFLは,データ取得コストを最大64%削減しながら,モデル精度を最大25%向上できることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:45:53 GMT)
Device Scheduling and Assignment in Hierarchical Federated Learning for
Internet of Things [20.1] 本稿では,デバイススケジューリングのための改良K-Centerアルゴリズムを提案し,IoTデバイスをエッジサーバに割り当てるための深層強化学習に基づくアプローチを提案する。
実験によると、IoTデバイスの50%のスケジューリングは一般的に、時間遅延とエネルギー消費を大幅に低減したHFLの収束を達成するのに十分である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:42:13 GMT)
Learning to Understand: Identifying Interactions via the Mobius
Transform [19.9] 機械学習における最も基本的な問題の1つは、我々が学習した関数の解釈可能な表現を見つけることである。
Mobius変換は、その係数が入力変数の集合上のユニークな重要なスコアに対応するため、このために有用なツールである。
この研究は、非ゼロモダス係数の分数(したがって入力間の相互作用)が小さい(典型的)レジームに焦点をあてる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:47:34 GMT)
Evaluating Large Language Models for Generalization and Robustness via
Data Compression [19.2] 本稿では,データ圧縮に基づく評価手法を提案する。
具体的には、2017年から2023年までの83ヶ月にわたる包括的なテストデータを収集し、モデルのトレーニングデータ遮断に従って、データをトレーニングとテスト期間に分割します。
実験では、ウィキペディア、ニュース記事、コード、arXiv論文、マルチモーダルデータなど、様々な規模の大言語モデル14を検証した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:16:25 GMT)
A Survey on Data Selection for LLM Instruction Tuning [18.9] 本稿では,データ選択手法の新たな分類法を提案し,最近の進歩を詳細に紹介する。
我々はオープンな課題を強調し、このタスクの新たなフロンティアを提示する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:32:01 GMT)
Are Large Language Models Table-based Fact-Checkers? [18.9] 表ベースのFact Verification (TFV) は、文と構造化テーブルの間の関係を抽出することを目的としている。
大規模モデルに基づく既存のTFV法は、ラベル付きデータ不足とゼロショット能力の弱さに悩まされている。
大規模言語モデル(LLM)は、強力なゼロショットとコンテキスト内学習能力を示している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:52:59 GMT)
Dynamic Incremental Optimization for Best Subset Selection [18.7] 最良のサブセット選択は、多くの学習問題に対する金の標準と見なされている。
主問題構造と双対問題構造に基づいて,効率的な部分集合双対アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:26:40 GMT)
INViT: A Generalizable Routing Problem Solver with Invariant Nested View
Transformer [18.7] 深い強化学習は、高速ルーティングを学習してルーティング問題を解決するための有望な結果を示している。
解法の大半は、異なるスケールで見えない分布や分布に一般化することに苦しむ。
Invariant Nested View Transformer (INViT) と呼ばれる新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:09:30 GMT)
Stability Analysis of Various Symbolic Rule Extraction Methods from
Recurrent Neural Network [18.5] 3600ドルのRNNモデルをトレーニングし、量子化アプローチ(k-meansとSOM)で18000ドルのDFAを抽出しました。
7ドルのTomitaと4ドルのDyck文法のデータセットをサンプリングし、LSTM、GRU、O2RNN、MIRNNという4ドルのRNNセルでトレーニングしました。
実験から得られた観測により,O2RNNの優れた性能と量子化に基づくルール抽出が他よりも優れていることが確認された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:16:45 GMT)
Arithmetic Feature Interaction Is Necessary for Deep Tabular Learning [18.4] 軽度な特徴相互作用を仮定した合成データセットを作成する。
本稿では,AMFormerと呼ばれる数値的特徴相互作用を実現する改良型トランスフォーマーアーキテクチャについて検討する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:07:39 GMT)
Mirage: Model-Agnostic Graph Distillation for Graph Classification [18.0] グラフ蒸留は、元のトレーニングデータからより小さな合成トレーニングセットを構築するための試みである。
Mirageは、メッセージパスGNNが入力グラフを複数の計算ツリーに分解する、という洞察に基づいて構築されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:08:00 GMT)
A Survey on Decentralized Identifiers and Verifiable Credentials [17.8] SSI(Self-Sovereign Identity)は、ユーザのデータを完全にコントロールする。
SSIは分散識別子(DID)と検証資格(VC)を活用する
これらの技術は、よりセキュアで分散化されたデジタルIDシステムを構築する可能性を秘めている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:55:14 GMT)
Variational DAG Estimation via State Augmentation With Stochastic
Permutations [17.6] ベイズネットワークの構造を観測データから推定することは統計的かつ計算的に難しい問題である。
確率的推論の観点から、主な課題は(i) DAG 制約を満たすグラフ上の分布を表すこと、(ii) 基礎空間上の後方を推定することである。
そこで本稿では,DAGと置換の強化空間上に共同分布を定式化することにより,これらの課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:51:04 GMT)
LLM-Enhanced Data Management [17.4] 大規模言語モデル(LLM)は文脈理解において高い一般化性と人間競合能力を示す。
LLMには幻覚、高コスト、複雑なタスクに対する低精度のいくつかの制限がある。
我々は、幻覚を避けつつ、一般化性と高い推論能力を有するLLMDBを設計する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:42:02 GMT)
Exploiting Low-level Representations for Ultra-Fast Road Segmentation [17.3] セグメント化のための低レベル特徴支配道路ネットワーク(LFD-RoadSeg)を提案する。
KITTI-RoadSegでは、LFD-RoadSegは最大F1測定値(MaxF)95.21%、平均精度93.71%を達成する一方、TITAN Xpでは238FPS、Jetson TX2では54FPSに達する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:59:18 GMT)
Zero-1-to-3: Domain-level Zero-shot Cognitive Diagnosis via One Batch of
Early-bird Students towards Three Diagnostic Objectives [17.0] 本稿ではドメインレベルのゼロショット認知診断(DZCD)に焦点を当てる。
最近のクロスドメイン診断モデルはDZCDにとって有望な戦略であることが示されている。
早期学生の1バッチを通したドメインレベルのゼロショット認知診断フレームワークZero-1-to-3を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:45:40 GMT)
AdaNAS: Adaptively Post-processing with Self-supervised Neural
Architecture Search for Ensemble Rainfall Forecasts [16.7] 本稿では,降雨予知処理と降雨予測を高精度に行う自己教師型ニューラルネットワークサーチ(NAS)手法を提案する。
さらに,降雨エリアの予測を著しく改善する雨量対応検索空間を設計する。
EmphNone、emphLight、emphModerate、emphHeavy、emphViolentの大規模な降水ベンチマークで検証実験が行われた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:43:43 GMT)
Enhance Reasoning for Large Language Models in the Game Werewolf [16.5] 本稿では,Large Language Models(LLM)を外部のThinkerモジュールと統合する革新的なフレームワークを提案する。
本フレームワークは,マルチシステム推論を必要とする9人プレイヤのWerewolfゲームを用いて提案する。
実験では, 帰納的推論, 音声生成, オンラインゲーム評価におけるフレームワークの有効性を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:47:10 GMT)
Symbol: Generating Flexible Black-Box Optimizers through Symbolic
Equation Learning [16.3] シンボル方程式学習によるブラックボックスの自動発見を促進するフレームワークであるtextscSymbolを提案する。
具体的には、閉形式最適化ルールを動的に生成できる記号方程式生成器(SEG)を提案する。
大規模な実験により、textscSymbolによって生成される一般化は最先端のBBOやMetaBBOのベースラインを超えるだけでなく、例外的なゼロショット能力を示すことが明らかになった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:41:27 GMT)
Delivery Optimized Discovery in Behavioral User Segmentation under
Budget Constrain [16.2] ユーザの行動フットプリントは,行動ベースのユーザセグメント(あるいはセグメント)を発見し,ユーザに対してセグメント固有のメッセージを配信することを可能にする。
セグメントの発見後、FacebookやGoogleのような好みのメディアチャンネルを通じてメッセージを送ることは難しい。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:18:33 GMT)
A Truly Joint Neural Architecture for Segmentation and Parsing [15.9] 形態的リッチ言語(MRL)の性能は他の言語よりも低い。
空間的に制限された入力トークンのモルフォロジーの複雑さとあいまいさのため、ツリーのノードとして機能する言語単位は事前に分かっていない。
本稿では,入力のすべての形態的あいまいさを保存する格子型表現をアーク分解モデルに提供し,その形態的・構文的解析タスクを一度に解く,結合型ニューラルアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:56:08 GMT)
Minusformer: Improving Time Series Forecasting by Progressively Learning
Residuals [15.8] 我々は,情報集約機構を付加と減算から再構築することで,バニラ変圧器を改修する。
本稿では,原モデルの各ブロックに補助出力分岐を組み込んで,最終的な予測に導くハイウェイを構築する。
提案手法は既存の最先端手法よりも優れており,各データセットの平均性能は11.9%向上した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:54:31 GMT)
Evaluating and Enhancing Large Language Models for Conversational
Reasoning on Knowledge Graphs [15.5] 我々は知識グラフ(KG)を用いた現在最先端の大規模言語モデル(GPT-4)の会話推論能力を評価する。
我々は,KG経路の正確かつ適応的な予測を行うために設計された基底KG推論エージェントであるLLM-ARKを紹介する。
LLaMA-2-7B-ARKは、現在の最先端モデルよりも5.28ポイント優れており、ターゲット@1評価基準では36.39%である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:45:04 GMT)
Learning Semantic Proxies from Visual Prompts for Parameter-Efficient
Fine-Tuning in Deep Metric Learning [15.3] 既存のソリューションは、既存の画像データセット上でトレーニング済みのモデルを微調整することに集中している。
我々は、事前学習された視覚変換器(ViT)における視覚プロンプト(VPT)の学習に基づく、新しい効果的なフレームワークを提案する。
セマンティック情報を用いた新しい近似が代表的能力よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:42:05 GMT)
Rethinking the Evaluation of Pre-trained Text-and-Layout Models from an
Entity-Centric Perspective [15.2] EC-FUNSDは、視覚的にリッチなドキュメント上での意味的エンティティ認識とエンティティリンクを評価するために設計されたエンティティ中心のベックマークである。
このデータセットには、ドキュメントレイアウトのさまざまなフォーマットと、セマンティック駆動エンティティとその関連性のアノテーションが含まれている。
実験結果から,最新のPTLMは,データセットバイアスを除去すると性能が急激に低下するため,ベンチマークに過度に適合する傾向を示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:33:45 GMT)
On the Complexity of Finite-Sum Smooth Optimization under the
Polyak-{\L}ojasiewicz Condition [14.8] 本稿では、$min_bf xinmathbb Rd f(bf x)triangleq frac1nsum_i=1n f_i(bf x)$, ここで、$f(cdot)$はパラメータ$mu$と$f_i(cdot)_i=1n$は$L$-mean-squared smoothである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:14:53 GMT)
Fair Multi-Agent Bandits [14.6] 残念な$Oleft(N3 log fracBDelta f(log T) log T right)$, where $f(t)$ は infinity に $t$ で分岐する任意の関数である。
これにより、オーダー$O(f(log T) log T )$と同じ上限を持つ前の結果を大幅に改善するが、エージェントの数に指数関数的に依存する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:42:43 GMT)
Agent-Specific Effects: A Causal Effect Propagation Analysis in
Multi-Agent MDPs [14.5] エージェント特異的効果(ASE)は、エージェントの作用が他のエージェントを介して伝播する結果に与える影響を測定する新しい因果量である。
我々は,敗血症管理環境を含むシミュレーションベースのテストベッドを用いて,cf-ASEの有用性を実験的に評価した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:17:49 GMT)
LVC-LGMC: Joint Local and Global Motion Compensation for Learned Video
Compression [13.8] 本稿では,映像符号化のための共同ローカル・グローバル・モーション補償モジュール(LGMC)を提案する。
グローバルなコンテキストを捉えるために,機能領域におけるクロスアテンションを用いて動き補償を行う。
LVC-LGMCは,ベースラインDCVC-TCMよりも高い速度歪み性能を有する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:43:28 GMT)
Neural Control: Concurrent System Identification and Control Learning
with Neural ODE [13.7] ニューラル・コントロール(NC)と呼ばれる未知の力学系を制御するためのニューラル・ODEに基づく手法を提案する。
本モデルは,対象状態へ誘導する最適制御と同様に,システムダイナミクスを同時に学習する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:27:07 GMT)
Accelerating Inverse Reinforcement Learning with Expert Bootstrapping [13.4] 専門家による実験をうまく活用することで、内部のRLループでのハード探索の必要性を低減できることを示す。
具体的には、(1)内部RLアルゴリズムの再生バッファに専門家遷移を配置する(例えば、ソフトアクター批判)ことで学習者に高い報酬状態を直接通知し、(2)Q値のブートストラップにおけるエキスパートアクションを使用して目標Q値の推定を改善し、より正確に高価値のエキスパート状態を記述する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:49:53 GMT)
$C^*$-Algebraic Machine Learning: Moving in a New Direction [13.2] 我々は機械学習研究の新しい方向性を提案する:$C*$-algebraic ML $-$$C*$-algebraと機械学習のクロスファーティライズ。
機械学習に$C*$-algebrasを使用する理由と方法を説明し、技術的な考察を提供する。
C*$-algebraic MLのオープンな質問や課題について議論し、今後の開発やアプリケーションについて考えます。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:11:19 GMT)
A flexible Bayesian g-formula for causal survival analyses with
time-dependent confounding [12.9] 因果解析の一般的な目的は、仮説的介入シナリオの下で因果生存曲線を推定することである。
従来のパラメトリック g-formula アプローチを強化するため,より適応性の高いベイズ型 g-formula 推定器を開発した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:30:14 GMT)
Development of a Evaluation Tool for Age-Appropriate Software in Aging
Environments: A Delphi Study [12.8] 2000年1月から2023年4月までの研究では,技術年齢の指標を体系的に検討した。
専門家は、予備指標のスクリーニング、評価、追加、フィードバックを依頼された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:30:47 GMT)
Detection of ChatGPT Fake Science with the xFakeBibs Learning Algorithm [12.6] ChatGPTは新しい現実になりつつある。
本稿では,ChatGPTが生成した出版物を科学者が生成した出版物と区別する方法を示す。
前提は、ChatGPTコンテンツは独特な振る舞いを示し、科学的記事とは別物に設定できるということである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:59:45 GMT)
Multiplexed all-optical permutation operations using a reconfigurable
diffractive optical network [12.5] 大規模かつ高次元の置換操作は、通信や暗号化といった様々な用途において重要である。
ここでは、高次元の置換演算の実行に全光回折計算を用いることを実演する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:19:14 GMT)
Overcoming Order in Autoregressive Graph Generation [12.4] グラフ生成は、化学やソーシャルネットワークなど、さまざまな領域における基本的な問題である。
近年の研究では、リカレントニューラルネットワーク(RNN)を用いた分子グラフ生成が、従来の生成手法と比較して有利であることが示されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:58:22 GMT)
Why are hyperbolic neural networks effective? A study on hierarchical
representation capability [12.1] 本稿では,HRC評価のためのベンチマークを提案し,大規模実験によりHNNが有効である理由を包括的に分析する。
実験により、HNNは理論的に最適な埋め込みを達成できないことが示された。
本稿では,HRCの強化と下流タスクの性能向上のための事前学習戦略を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:15:59 GMT)
Deductive Beam Search: Decoding Deducible Rationale for Chain-of-Thought
Reasoning [11.9] 従来の手法では中間段階の推論エラーに対処できず、累積誤差が発生する。
本稿では,大規模言語モデルのステップワイド・ビームサーチとチェーン・オブ・シント推論をシームレスに統合する,導出ビームサーチ(DBS)を提案する。
提案手法は検証器をデプロイし,推論ステップとその前提の再現性を検証し,エラーの蓄積を軽減する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:18:34 GMT)
Large Language Models for Autonomous Driving: Real-World Experiments [11.9] 我々は,人間からの音声コマンドを処理する枠組みを導入し,文脈情報を用いて自律運転決定を行う。
このフレームワークは、様々なドライバーの乗っ取り率を最大90.1%削減することができる。
われわれの知る限りでは、Talk2DriveはLLMベースのシステムを現実の自動運転環境に導入した最初の例だ。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:39:22 GMT)
Sample as You Infer: Predictive Coding With Langevin Dynamics [11.5] 汎用的な深層生成モデルにおけるパラメータ学習のための新しいアルゴリズムを提案する。
提案手法は,標準変分自動エンコーダトレーニングから得られる性能と超越性を実現するために,標準PCアルゴリズムを改良する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:29:41 GMT)
Gazebo Plants: Simulating Plant-Robot Interaction with Cosserat Rods [11.4] 植物の動きをモデル化するために,コセラットロッドをベースとしたGazeboシミュレーションプラットフォーム用のプラグインを提案する。
筆者らは,このプラグインを用いて,果実を摘むロボットアームを模擬することにより,ガゼボで収穫シミュレーションを行うことができることを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:19:46 GMT)
TransMed: Large Language Models Enhance Vision Transformer for
Biomedical Image Classification [11.2] ごく少数のサンプルでモデルをタスクに適応させるために、いくつかのショットラーニングが研究されている。
大規模言語モデル(LLM)を用いてラベルを文脈化する新しい手法を提案する。
以上の結果から,LLMが生成するコンテキストは,類似のカテゴリに対する意味埋め込みの識別を著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:05:28 GMT)
Quantum Secret Sharing Enhanced: Utilizing W States for Anonymous and
Secure Communication [11.1] 量子秘密共有(Quantum Secret Share、QSS)は、量子力学の原理と秘密情報の共有を融合させた結果である。
我々は、W状態を介してQASSプロトコルを提案し、シークレットを共有できると同時に、回復可能性、回復セキュリティ、回復匿名性を確保できる。
調査の結果,W状態はノイズ干渉の緩和に優れた性能を示し,実用化に適していることが判明した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:15:02 GMT)
Navigate Biopsy with Ultrasound under Augmented Reality Device: Towards
Higher System Performance [11.1] 生検は腫瘍の分類とステージングを決定する上で重要な役割を担っている。
拡張現実(AR)を使用して、外科医は実際の組織とシームレスに統合された超音波データと空間ナビゲーション情報を視覚化することができる。
この革新はより高速で正確な生検操作を促進する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:18:43 GMT)
SSCFormer: Push the Limit of Chunk-wise Conformer for Streaming ASR
Using Sequentially Sampled Chunks and Chunked Causal Convolution [10.9] 本研究では,ストリーミングASRにおけるチャンクワイド・コンバータの限界を押し上げるために,SCFormerを提案する。
我々は、End-to-End (E2E) CER 5.33%が達成できることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:03:23 GMT)
Aligner: Achieving Efficient Alignment through Weak-to-Strong Correction [10.9] 大規模言語モデル(LLM)の整合化への取り組みは、主にRLHF法(Reinforcement Learning from Human Feedback)を通じて行われる。
ここでは、アライメントとアンアライメントされた回答の間の補正残差を学習することにより、RLHFプロセス全体をバイパスする新しい効率的なアライメントパラダイムであるAlignerを紹介する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:24:51 GMT)
Solution-oriented Agent-based Models Generation with Verifier-assisted
Iterative In-context Learning [10.7] エージェントベースのモデル(ABM)は、仮説的な解決策やポリシーの提案と検証に不可欠なパラダイムである。
大きな言語モデル(LLM)は、ドメイン間の知識とプログラミング能力をカプセル化することで、このプロセスの難しさを軽減できる可能性がある。
SAGEは、ターゲット問題に対する自動モデリングおよびソリューション生成のために設計された、汎用的なソリューション指向のABM生成フレームワークである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:59:06 GMT)
Improving Assessment of Tutoring Practices using Retrieval-Augmented
Generation [10.4] ワン・ワン・ワン・チュータリングは、学習力を高める効果的な指導方法であるが、その効果は家庭教師の能力に左右される。
本研究の目的は, GPT-3.5 や GPT-4 モデルなどの生成事前学習型トランスフォーマー (GPT) を用いて, 教師が社会的情緒的学習戦略を活用できる能力を自動的に評価することである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:42:30 GMT)
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal
Language Model [10.3] 我々は,新しい多段階視覚言語アライメント戦略とカリキュラム学習手法を通じて,RS画像理解に適したMLLMであるLHRS-Botを紹介する。
総合的な実験により、LHRS-BotはRS画像の深い理解と、RS領域内でニュアンス推論を行う能力を示すことが示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:46:43 GMT)
Deep Spectral Improvement for Unsupervised Image Instance Segmentation [10.2] 本稿では,自己教師付きバックボーンから抽出した特徴マップのすべてのチャネルが,例えばセグメント化の目的のために十分な情報を含んでいるわけではないという事実に対処する。
ノイズチャンネルリダクション(NCR)とディバイジョンベースリダクション(DCR)の2つのチャネルリダクションモジュールを提案する。
NCRはノイズが少ないためエントロピーの低いチャネルを保持するが、DCRは効果的なインスタンスセグメンテーションのための十分な情報がないため、標準偏差の低いチャネルを保持する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:09:13 GMT)
A Survey of Large Language Models in Finance (FinLLMs) [10.2] 大規模言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクで顕著な機能を示している。
この調査は、FinLLMの歴史、テクニック、パフォーマンス、機会と課題を含む、包括的な概要を提供する。
ファイナンスにおけるAI研究を支援するために、アクセス可能なデータセットと評価ベンチマークのコレクションをGitHubにコンパイルします。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:06:57 GMT)
Can Large Language Models Learn Independent Causal Mechanisms? [10.0] 大きな言語モデル(LLM)は、一般的でない設定や分散シフトで同じタスクで不足する。
我々は,複数の疎相互作用言語モデリングモジュールからなる新しいLLMアーキテクチャを開発した。
このような因果的制約は、抽象的および因果的推論タスクにおけるアウト・オブ・ディストリビューション性能を向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:04:02 GMT)
Breaking MLPerf Training: A Case Study on Optimizing BERT [9.5] 本稿では,BERTモデルの高速大規模学習のための新しいアプローチを提案する。
分散BERTトレーニングは、様々な長さのサンプルによって特徴付けられるため、ロードバランシングが不可欠である。
本稿では,1)負荷分散のためのデータセット階層化に基づく局所的事前ソートと,(2)帰納前のバケットワイド勾配クリッピングという2つの新しいアイデアを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:12:17 GMT)
A Collaborative Model-driven Network for MRI Reconstruction [9.4] 本稿では,ディープラーニング手法の性能向上のためのモデル駆動型ネットワークを提案する。
協調型モデル駆動ネットワークは、モデル駆動型ワーク、アテンションモジュール、修正モジュールで構成される。
実験の結果、計算の複雑さが増すことなく大幅な改善が見られた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:29:00 GMT)
Visibility into AI Agents [9.3] AIエージェントに対する商業的、科学的、政府的、個人的活動の委譲の増加は、既存の社会的リスクを悪化させる可能性がある。
エージェント識別子,リアルタイム監視,アクティビティログという,AIエージェントの視認性を高めるための3つの尺度を評価した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:33:36 GMT)
On Size-Independent Sample Complexity of ReLU Networks [9.2] 一般化の観点からReLUニューラルネットワークを学習する際のサンプル複雑性について検討する。
関連する関数クラスのRademacher複雑性を推定する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:12:16 GMT)
Large Language Model for Table Processing: A Survey [9.1] 大規模言語モデル (LLMs) は、学術や産業から大きな利益を得る。
テーブルは通常2次元で、大量のデータを格納するために構成され、データベースクエリやスプレッドシート計算、Webテーブルからのレポート生成といった日々のアクティビティに不可欠である。
この調査は、テーブル質問応答(Table QA)や事実検証といった従来の領域だけでなく、テーブル操作や高度なテーブルデータ分析といった、新たに強調された側面を含む、テーブルタスクの広範な概要を提供する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:47:53 GMT)
MetaOptimize: A Framework for Optimizing Step Sizes and Other
Meta-parameters [9.1] 本稿ではメタファクタを動的に調整するメタフレームワークについて紹介する。
より具体的には、Metaは任意の一階最適化アルゴリズムをラップし、特定の形態の後悔を最小限に抑えるために、ステップサイズの調整をオンザフライで行うことができる。
また、複数の最適化アルゴリズムへの適応性とともに、手作り学習率の最高のスケジュールに匹敵する性能を示すメタの低複雑性な変種も導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:55:54 GMT)
Theoretical Analysis of Robust Overfitting for Wide DNNs: An NTK
Approach [9.0] Adversarial Training (AT)は、ディープニューラルネットワーク(DNN)の堅牢性を高めるための標準的手法である
我々は, ニューラル・タンジェント・カーネル(NTK)理論をATに非自明に拡張し, 線形化されたDNNによって逆向きに訓練されたワイドDNNを適切に近似できることを証明する。
正方形損失の場合、線形化DNNの閉形式ATダイナミクスが導出され、新たなAT退化現象が明らかになる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:31:50 GMT)
Evaluating Large Language Models in Analysing Classroom Dialogue [8.8] この研究には中学生のデータセットが含まれており、数学と中国語の授業間での教室での対話を含んでいる。
これらの対話は、教育専門家が手作業でコーディングし、カスタマイズされたGPT-4モデルを用いて分析した。
その結果、GPT-4によるかなりの時間節約と、モデルと人間のコーダ間のコーディングにおける高い一貫性が示され、特定のコードではいくつかの相違が見られる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:39:06 GMT)
Evading Deep Learning-Based Malware Detectors via Obfuscation: A Deep
Reinforcement Learning Approach [8.7] Adversarial Malware Generation (AMG) は、Deep Learning (DL) ベースのマルウェア検出装置を強化するための、敵マルウェアの派生版である。
本研究では、Reinforcement Learning (RL)フレームワークと組み合わされたオープンソースの暗号化ツールが、マルウェアの難読化に成功していることを示す。
提案手法は,最先端の強化学習法と比較して,回避率を27%~49%に向上することを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:23:15 GMT)
EasyFS: an Efficient Model-free Feature Selection Framework via Elastic
Transformation of Features [8.5] 本稿では,従来のモデル認識手法よりも優れた性能を実現するために,機能拡張と圧縮による効率的なモデルフリー特徴選択フレームワーク,すなわちEasyFSを提案する。
21の異なるデータセットの実験では、EasyFSは回帰タスクの10.9%、分類タスクの5.7%で最先端のメソッドよりも優れており、時間の94%以上を節約している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:25:07 GMT)
Pruner: An Efficient Cross-Platform Tensor Compiler with Dual Awareness [8.4] 我々は,テンソルプログラムの最適化を階層的に向上させるハードウェア/ソフトウェア共同設計の原則に従い,$textbfPruner$を提案する。
Prunerは2つの主要なコンポーネントで構成されている。静的アナライザ(textbfPSA$)とパターン対応コストモデル(textbfPa$)である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:11:12 GMT)
On the Role of Initialization on the Implicit Bias in Deep Linear
Networks [8.3] 本研究は,遊びにおける暗黙の偏見に起因する現象を探索することに焦点を当てた。
ステップサイズ、重み初期化、最適化アルゴリズム、パラメータ数など、暗黙バイアスの様々な情報源が特定されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:54:07 GMT)
Variational Quantum AdaBoost with Supervised Learning Guarantee [8.2] 変動量子AdaBoostは、予測においてはるかに高い精度を達成できるだけでなく、ノイズの影響を軽減するのにも有効であることを示す。
我々の研究は、現在のNISQ時代において、適切なアンサンブル法を導入することは、量子機械学習アルゴリズムの性能向上に特に有用であることを示している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:18:44 GMT)
A rigorous introduction to linear models [8.0] この本は線形モデルとその背後にある理論について紹介することを目的としている。
機械学習では、出力は通常入力の非線形関数である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:20:48 GMT)
Can Language Models Be Tricked by Language Illusions? Easier with
Syntax, Harder with Semantics [7.8] 我々は「言語錯覚」に関連するLMのより微妙な判断について検討する。
比較錯視、深さ電荷錯視、負極性イリュージョン(NPI)という3つの錯覚を考察する。
我々は,人間の言語処理の認知モデルとして,かつ複雑な言語材料において,ニュアンスだが重要な情報を認識する能力において,LMは相対的に制限されていることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:00:11 GMT)
Brain-inspired Distributed Memorization Learning for Efficient
Feature-free Unsupervised Domain Adaptation [7.5] 本稿では,移動モデルの高速領域適応を支援するために,勾配のない分散記憶学習機構,すなわちDMLを提案する。
特に、DMLはランダムに連結されたニューロンを用いてインパルスとして伝播する入力信号の関連を記憶し、その信頼度に基づいて分散記憶を関連付けることで最終的な決定を行う。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:58:17 GMT)
Self-training Strategies for Sentiment Analysis: An Empirical Study [7.4] 自己学習は感情分析モデルを開発するための経済的かつ効率的な手法である。
いくつかの自己学習戦略と大規模言語モデルの介入を比較した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:52:03 GMT)
Flexible Non-interactive Short-term Implicit Certificate Generation for VANETs [7.1] 車両用アドホックネットワーク(VANET)におけるセキュアで信頼性の高い通信のための業界標準は、セキュリティ・クレデンシャル・マネジメント・システム(SCMS)である。
車両のプライバシーを守るために、匿名の証明書、別名として機能する。
我々はSCMSに対して非インタラクティブなアプローチを提案し、車自体が短期キーペアと匿名の暗黙の証明書を生成できるようにする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:37:01 GMT)
Learning Any-View 6DoF Robotic Grasping in Cluttered Scenes via Neural
Surface Rendering [7.0] この研究は、グリップをレンダリングとして再解釈し、6DoFグリップ検出の新しい方法であるNeuGraspNetを導入する。
NeuGraspNetは、モバイル操作のシナリオに共通するランダムな視点で動作し、既存の暗黙的および半単純的把握方法より優れている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:23:36 GMT)
Grover-QAOA for 3-SAT: Quadratic Speedup, Fair-Sampling, and Parameter
Clustering [6.9] 本研究では,Grover Quantum Approximate Optimization Algorithm (G-QAOA) の2次高速化の数値的証拠を示す。
G-QAOAはGroverのアルゴリズムよりもリソース集約性が低く、3-SATやMax-SATに適応しやすい。
また、小さなインスタンスに対してIonQ Aria量子コンピュータのG-QAOAの利点を観察し、現在のハードウェアが全てのソリューションを決定・サンプリングするのに十分であることを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:01:27 GMT)
ClipFormer: Key-Value Clipping of Transformers on Memristive Crossbars
for Write Noise Mitigation [6.9] 非揮発性メモリ(NVM)に基づくインメモリコンピューティング(IMC)クロスバーは、トランスフォーマーを高速化するための有望なソリューションとして登場した。
書込みノイズを動的に発生させることにより、事前訓練された視覚変換器(ViT)がクロスバーに対して脆弱であることがわかった。
本稿では,事前学習したViTモデルの非理想的精度を高めるために,新しい旋律的クロスバープラットフォームを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:04:37 GMT)
Exact Numerical Solution of Stochastic Master Equations for Conditional
Spin Squeezing [6.8] 同一原子を持つ系に対する条件付きスピンスクイーズ方程式の正確な数値解を示す。
スピンスクイーズが集合密度行列要素のガウス的分布によって鮮明に説明できることを実証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:03:42 GMT)
Full Characterization of the Depth Overhead for Quantum Circuit
Compilation with Arbitrary Qubit Connectivity Constraint [6.8] 量子コンピュータのいくつかの物理的実装では、2量子ビット演算は特定の量子ビットのペアにのみ適用できる。
本稿では、基礎となる制約グラフのルーティング数によって、深さオーバーヘッドを完全に特徴づける。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:29:41 GMT)
Vision Transformer-based Multimodal Feature Fusion Network for Lymphoma
Segmentation on PET/CT Images [6.7] 18F-Fluorodeoxyglucose positron emission tomography (PET) とCT画像によるリンパ腫分画の精度向上を目指した。
悪性リンパ腫のセグメンテーションのアプローチは,視覚トランスフォーマーとデュアルエンコーダを併用し,マルチモーダル・クロスアテンション・フュージョン(MMCAF)モジュールを介してPETおよびCTデータを浮き彫りにする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:25:12 GMT)
Foundation Model Makes Clustering a Better Initialization for Active
Learning [6.6] アクティブラーニングは、アノテートするためにラベルのないデータセットから最も情報に富んだサンプルを選択する。
以前の研究のほとんどはランダムサンプリングやナイーブクラスタリングに頼っている。
本稿では,基礎モデルとクラスタリング手法を統合して,アクティブな学習のためのサンプルを選択することを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:27:37 GMT)
Post-Regularization Confidence Bands for Ordinary Differential Equations [6.4] 我々は、未知の機能とノイズの多いデータ観測を備えたODEにおける個々の規制機能に対する信頼バンドを構築した。
構築された信頼バンドはカーネルのカバレッジ確率が所望であることを示し、回復した規制ネットワークは1つに傾向のある真理に近づいた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:55:36 GMT)
What Can Self-Admitted Technical Debt Tell Us About Security? A
Mixed-Methods Study [6.3] 自己充足型技術的負債(SATD)
潜在的に悪用可能な脆弱性や セキュリティ上の欠陥に関する 恐ろしい情報源と見なすことができます
本研究は、SATDのセキュリティへの影響を、技術と開発者中心の観点から検討する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:28:50 GMT)
STAGE: Scalable and Traversability-Aware Graph based Exploration Planner
for Dynamically Varying Environments [6.3] このフレームワークは,それぞれ局所グラフ層とグローバルグラフ層から構成される,新たな目標指向グラフ表現を中心に構成されている。
グローバルグラフは、シーケンシャルなサブグラフの重なり合う領域にのみノードエッジ情報交換を用いて、効率的な方法で構築される。
提案手法はシーン変更を処理し,グローバルグラフの障害部分をトラバーサブルからトラバーサブルに適応的に更新する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:05:27 GMT)
Accelerating PDE Data Generation via Differential Operator Action in
Solution Space [6.2] 我々は、新しいPDEデータセット生成アルゴリズム、すなわち、解空間における微分演算子アクション(DiffOAS)を提案する。
DiffOASはいくつかの基本的なPDEソリューションを取得し、それらを組み合わせてソリューションを得る。
これらの解に対して微分演算子、すなわち「演算アクション」と呼ばれるプロセスを適用して、正確なPDEデータポイントを効率的に生成する。
実験の結果,DiffOASは1万インスタンスの大規模データセットの生成を300倍加速することがわかった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:28:27 GMT)
Towards Principled Risk Scores for Space Cyber Risk Management [5.7] エアロスペース・コーポレーションは、スペースアタック・リサーチと戦術分析の枠組みの中で、Notional Risk Scores (NRS) を提案した。
NRSは実践者による採用を意図しているが、現実のシナリオでは分析されておらず、その有効性に疑問を呈している。
本稿では,衛星に対する現実のサイバー攻撃シナリオを通じてNRSを分析し,NRSの強み,弱点,適用性を特徴付ける。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:01:49 GMT)
Exploring Intrinsic Properties of Medical Images for Self-Supervised
Binary Semantic Segmentation [5.4] ダイナミック・セルフアダプティブ・セマンティック(MedSASS)を応用した医用画像の紹介
MedSASSは、医療画像のセグメンテーションに適した、専用のセルフ教師付きフレームワークである。
MedSASSを4つの多様な医療データセットにまたがる既存の最先端手法に対して評価した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:39:01 GMT)
Rethinking Attention: Exploring Shallow Feed-Forward Neural Networks as
an Alternative to Attention Layers in Transformers [5.4] 本研究は,従来のトランスフォーマーモデルにおけるアテンション機構の動作を模倣するために,標準の浅層フィードフォワードネットワークを用いることの有効性について分析した。
我々はトランスフォーマーの注意機構の重要な要素を簡単なフィードフォワードネットワークで置き換え、知識蒸留により元のコンポーネントを用いて訓練する。
IWSLT 2017データセットで実施した実験では,これらの“アテンションレストランスフォーマー(attentionless Transformers)”の能力が,オリジナルのアーキテクチャのパフォーマンスに匹敵することを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:39:33 GMT)
A fast and gridless ORKA algorithm for tracking moving and deforming
objects [5.1] 多くの場合、興味の対象はその形や位置をある測定値から別の測定値に変更する。
これは、アルゴリズムが所定の測定値よりも変化するオブジェクトを扱う必要があるため、識別と追跡を複雑にする。
再サンプリング手法を用いてデータの複数の解像度を生成する反復戦略を導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:16:56 GMT)
A Survey on African Computer Vision Datasets, Topics and Researchers [5.1] 本研究は,アフリカから約63,000冊のScopusをインデクシングしたコンピュータビジョン出版物を網羅的に分析した。
目的は、アフリカにおけるコンピュータビジョンのトピック、データセット、研究者のサーベイを提供することである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:17:27 GMT)
Smooth Lower Bounds for Differentially Private Algorithms via
Padding-and-Permuting Fingerprinting Codes [5.1] 微分プライベートアルゴリズムのサンプル複雑性に基づいて,スムーズな下界を生成するための新しいフレームワークとツールを提案する。
提案手法の適用性について,様々な設定で新しい下位境界を提供することにより説明する。
我々の主な技術は、指紋コードにパディング・アンド・パーミュート変換を適用することである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:36:42 GMT)
Dive into Machine Learning Algorithms for Influenza Virus Host
Prediction with Hemagglutinin Sequences [5.1] インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:44:13 GMT)
A Quantitative Discourse Analysis of Asian Workers in the US Historical
Newspapers [4.8] 本稿は、アジア系労働者がアメリカにおける歴史的新聞でどのように表現されているかに関する、計算テキスト分析について述べる。
クーリー(coolie)という言葉は、一部の州では意味的に異なるが、クーリー(coolie)に関する言説は異なっている。
また、当時のアメリカ連合新聞や当時のユニオン新聞が、過剰に表現された単語を測定することで、独特な談話を形成したことも見出した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:32:52 GMT)
Towards a Better Understanding of the Computer Vision Research Community
in Africa [4.8] 我々は、アフリカの機関が最上位のコンピュータビジョン会場で公開できる機会について研究する。
我々は,北米やアジアなど他の大陸とは異なり,上位階層におけるアフリカ系出版の傾向が一貫した成長を見せていないことを示す。
我々は、東アフリカと西アフリカの両方が、過去2年間に南アフリカとのギャップを閉じることで、有望な増加を見せていることを強調した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:36:50 GMT)
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long
Documents [4.7] Jina Embeddings 2は、最大8192トークンを収容できるオープンソースのテキスト埋め込みモデルである。
Jina Embeddings 2は、様々な埋め込み関連タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:11:53 GMT)
Individualized Policy Evaluation and Learning under Clustered Network
Interference [4.6] クラスタ化されたネットワーク干渉下での最適個別化処理ルールの評価と学習の問題点を考察する。
ITRの実証性能を評価するための推定器を提案する。
学習ITRに対する有限サンプル残差を導出し、効率的な評価推定器の使用により学習ポリシーの性能が向上することを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:47:55 GMT)
Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to
CT Image Fusion [4.1] 画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:12:51 GMT)
Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate
Group Conversations [3.9] Multi-User Chat Assistant (MUCA)は、グループディスカッション用に特別に設計されたチャットボットのためのLLMベースのフレームワークである。
MUCAは適切なチャイムインタイミング、関連コンテンツ、ポジティブなユーザエンゲージメントなどの効果を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:50:17 GMT)
Predicting Software Performance with Divide-and-Learn [3.6] 本稿では,DALと呼ばれる「分枝学習」の概念に基づくアプローチを提案する。
実世界の8つのシステムと5つのトレーニングデータによる実験結果から、DaLは40件中33件で最高のシステムよりもパフォーマンスが劣っていることが判明した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:24:24 GMT)
New Security Proof of a Restricted High-Dimensional QKD Protocol [3.6] 高次元(HD)状態は量子暗号に適用する場合、いくつかの興味深い性質を持つことが知られている。
本稿では,Alice と Bob が相互に偏りのない完全なベースで送信・測定できるような,特定の HD-QKD プロトコルを再検討する。
我々は、新しいセキュリティの証明を提供し、脱分極チャネルに対して明示的なキーレート方程式を与え、任意の高次元状態に対するキーレートを評価する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:02:27 GMT)
LayerAct: Advanced activation mechanism utilizing layer-direction
normalization for CNNs with BatchNorm [3.4] LayerAct 関数は、既存の要素レベルのアクティベーション関数よりもノイズが強いように設計されている。
また,LayerAct関数は,素子レベルのアクティベーション関数よりも優れたノイズ・ロバスト性を示すことを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:34:10 GMT)
Weisfeiler Leman for Euclidean Equivariant Machine Learning [3.4] WeLNetは、位置-速度対を処理し、置換や剛体運動と完全に同値な関数を計算できる。
WeLNetは、実際に実装されている環境で、確実に完全であることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:25:18 GMT)
VM-UNet: Vision Mamba UNet for Medical Image Segmentation [3.2] 医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。
我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:37:21 GMT)
idMotif: An Interactive Motif Identification in Protein Sequences [3.1] idMotifは、ドメインの専門家がタンパク質配列内のモチーフを識別するのを助けるために設計されたビジュアル分析フレームワークである。
深層学習に基づくタンパク質配列の分類法を用いる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:51:03 GMT)
Utilization of Non-verbal Behaviour and Social Gaze in Classroom
Human-Robot Interaction Communications [3.1] この要約は、よりシームレスな社会的相互作用を促進するために、ロボット認知アーキテクチャにおける人間にインスパイアされた社会的視線モデルの適応に焦点を当てた、ヒューマン・ロボットインタラクション(HRI)のシナリオを探索する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:59:19 GMT)
MicroNAS: Memory and Latency Constrained Hardware-Aware Neural
Architecture Search for Time Series Classification on Microcontrollers [3.1] 我々は、資源制約型マイクロコントローラ(MCU)における時系列分類問題を解決するために、差別化可能なニューラルネットワーク探索(DNAS)の概念を適用した。
ドメイン固有のHW-NASシステムであるMicroNASを導入し、DNAS、ルックアップテーブル、動的畳み込み、MCUの時系列分類に特化して設計された新しい検索空間を提案する。
異なるMCUと標準ベンチマークデータセットの研究により、MicroNASは、最先端のデスクトップモデルに近いパフォーマンス(F1スコア)を達成するMCUに適したアーキテクチャを見つけることを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:54:06 GMT)
Neuromorphic hardware for sustainable AI data centers [3.0] ニューロモルフィックハードウェアは、脳が情報を処理する方法からインスピレーションを得ている。
その可能性にもかかわらず、ニューロモルフィックなハードウェアは商用AIデータセンターに導入されていない。
本稿は、ニューロモルフィックハードウェアをデータセンターに統合する際の課題に対する意識を高めることを目的としている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:08:50 GMT)
MobileARLoc: On-device Robust Absolute Localisation for Pervasive
Markerless Mobile AR [2.9] 本稿では,大規模マーカーレスモバイルARのための新しいフレームワークであるMobileARLocを紹介する。
MobileARLocは絶対ポーズ回帰器(APR)とローカルVIOトラッキングシステムを組み合わせる。
我々は,MobileARLocが基盤となるAPRと比較して誤差を半減し,デバイス上での高速(80,ms)の推論速度を実現することを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:26:50 GMT)
It's how you do things that matters": Attending to Process to Better
Serve Indigenous Communities with Language Technologies [2.8] 本稿では,NLP技術の構築における倫理的考察について考察する。
本稿では,AbgenousおよびTorres Strait Islanderコミュニティの研究者17人とのインタビューについて報告する。
我々はNLP研究者に対して、先住民コミュニティとの関わりのプロセスに注意を向けるよう推奨する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:23:51 GMT)
Non-adiabatic holonomic quantum operations in continuous variable
systems [2.6] 物理系で生成する幾何学的位相を利用する量子演算は、その潜在的堅牢性のために好まれる。
そこで本研究では,猫符号を持つ連続可変系における非断熱的ホロノミック量子論理演算を実現するための実現可能なスキームを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:06:23 GMT)
Non-Hermitian skin effect and nonreciprocity induced by dissipative
couplings [2.5] 本研究では,非エルミート皮膚効果(NHSE)を散逸結合によって実現するためのメカニズムについて検討した。
周期的な散逸コヒーレントカップリング構造によって提供されるマルチチャネル干渉と組み合わせると、散逸結合は不等な左-右カップリングに繋がる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:29:38 GMT)
Time-energy uncertainty relation for noisy quantum metrology [2.5] 本研究では、ノイズが量子時計の精度を低下させる量と、環境に漏れるクロックのエネルギーに関する情報量とを関連づける基本的なトレードオフについて検討する。
我々は、ハミルトニアンが論理演算子として振る舞う同様の距離の量子誤り訂正符号として書けないメロジカル符号が存在することを示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:14:12 GMT)
Robot Trajectron: Trajectory Prediction-based Shared Control for Robot
Manipulation [2.3] emphRobot Trajectron (RT) と呼ばれる新しい意図推定器を開発した。
RTは、その最近の位置、速度、加速度履歴に基づいて、ロボットの予測軌道の確率的表現を生成する。
我々は、RTの予測能力と潜在的到達目標の位置の表現を組み合わせた、新しい共有制御ソリューションを導出する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:18:20 GMT)
IGCN: Integrative Graph Convolutional Networks for Multi-modal Data [2.2] 我々は、IGCN(Integative Graph Convolutional Networks)という、マルチモーダルデータネットワークのための新しい統合ニューラルネットワークアプローチを導入する。
IGCNは複数のトポロジからノード埋め込みを学習し、ノード埋め込みに注意係数を割り当てることで、複数のノード埋め込みを重み付け形式に融合する。
提案するアテンションメカニズムは,特定のクラスを予測するために,各サンプルに対してより強調されるデータの種類を特定するのに役立つ。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:41:47 GMT)
Matbench Discovery -- A framework to evaluate machine learning crystal
stability predictions [2.2] Matbench Discoveryは、安定した無機結晶探索における機械学習(ML)エネルギーモデルの展開をシミュレートする。
i) 熱力学的安定性と生成エネルギーの分離と, (ii) ドメイン内と分布外性能の分離に対処する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:12:47 GMT)
Increasing Trust in Language Models through the Reuse of Verified
Circuits [2.1] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に規定されたフレームワークを使用して構築すれば,トランスフォーマーモデルをこの標準を満たすように訓練できることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:33:18 GMT)
A Safe Reinforcement Learning driven Weights-varying Model Predictive
Control for Autonomous Vehicle Motion Control [2.1] モデル予測制御(MPC)の最適コスト関数パラメータを決定するための新しい手法を提案する。
連続した空間で学習するのではなく、今後の制御タスクを積極的に予測するRLエージェントを考案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:09:28 GMT)
A Hyper-Transformer model for Controllable Pareto Front Learning with
Split Feasibility Constraints [2.1] SFCを用いたCPFL用超変圧器(Hyper-Trans)モデルを開発した。
計算実験において,Hyper-TransモデルによりMED誤差がHyper-MLPモデルよりも小さくなることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:21:03 GMT)
The Developmental Landscape of In-Context Learning [2.0] 本稿では,言語モデルや線形回帰タスクで学習した場合に,コンテクスト内学習が個別発達段階のトランスフォーマーに現れることを示す。
パラメータ空間と関数空間の両方において、人口損失の幾何学を探索することにより、これらの段階を分離するマイルストーンを検出する2つの方法を提案する。
本研究は, これらの手法を用いて, 行動指標と構造指標を用いて, それらの妥当性を検証した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:23:05 GMT)
Unification of Symmetries Inside Neural Networks: Transformer,
Feedforward and Neural ODE [2.0] 本研究では,ゲージ対称性(ゲージ対称性)の原理をニューラルネットワークアーキテクチャに適用することにより,新しいアプローチを提案する。
数理的にニューラルネットワークのパラメトリックな冗長性を定式化し、それらのゲージ対称性が時空微分同相によって与えられることを確かめる。
ニューラルネットワークをフィードフォワードニューラルネットワークの連続的なバージョンと見なすと、フィードフォワードニューラルネットワークのパラメトリック冗長性は、実際にニューラルネットワークの微分同相性へと持ち上げられることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:11:54 GMT)
"What's my model inside of?": Exploring the role of environments for
grounded natural language understanding [1.9] この論文では、自然言語理解(NLU)研究に対する生態学的アプローチを採用する。
我々は,テキストベースのゲーム環境に基づく手続き的テキスト理解のための新しいトレーニングとアノテーションアプローチを開発した。
我々は,科学者のような知識労働者を対象とした,AIを活用した「社会的思考環境」の設計を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:52:46 GMT)
Framework-Based Qualitative Analysis of Free Responses of Large Language
Models: Algorithmic Fidelity [1.8] 大規模生成言語モデル(LLM)は、質的研究手法を用いて伝統的に分析されたようなインタビュー質問に対する自由応答をシミュレートすることができる。
本稿では, LLMが生成する人工シリコン参加者について, 定性的手法を用いて生産的に研究できるかどうかを考察する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:46:38 GMT)
History of generative Artificial Intelligence (AI) chatbots: past,
present, and future development [1.6] この研究は、ChatGPTやGoogle Bardといった、今日の高度な会話エージェントに繋がる重要なイノベーションをトレースする。
この論文は、自然言語処理と機械学習が、より高度な機能のために現代のチャットボットにどのように統合されたかを強調している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:01:38 GMT)
Data-driven algorithm design using neural networks with applications to
branch-and-cut [1.6] 我々は、この研究の行において、最高のパフォーマンスを持つ1つのアルゴリズムを選択する代わりに、そのインスタンスに基づいてアルゴリズムを選択することができるというアイデアを導入することによって、最近の研究の上に構築する。
我々は、このアイデアを形式化し、データ駆動アルゴリズム設計における最近の研究の精神の中で、この学習問題に対する厳密なサンプル複雑性を導出する。
言い換えれば、ニューラルネットワークは混合整数最適化インスタンスを入力として取り、そのインスタンスの小さな分岐とカットツリーをもたらす決定を出力する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:03:27 GMT)
COMPRER: A Multimodal Multi-Objective Pretraining Framework for Enhanced Medical Image Representation [1.6] COMPRERは、新しいマルチモーダル、マルチオブジェクト事前トレーニングフレームワークである。
医学的イメージ表現、診断的推論、および疾患の予後を高める。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 08:05:58 GMT)
Improved Hardness Results for the Guided Local Hamiltonian Problem [1.5] 局所ハミルトニアンの基底状態エネルギーを推定することは量子化学における中心的な問題である。
BQP完全性は2-局所ハミルトニアンにおいても持続することを示す。
また、これらのハミルトニアンの励起状態のエネルギーを推定する場合、BQP硬さが持続することを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:29:11 GMT)
Assumption-lean and Data-adaptive Post-Prediction Inference [1.5] 本稿では,POP-Inf(Massor-lean and data-adaptive Post-Prediction Inference)手法を提案する。
その「推定リーン」特性は、ML予測に関する仮定なしで信頼できる統計的推測を保証する。
シミュレーションと大規模ゲノムデータを用いて,本手法の優位性と適用性を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:26:08 GMT)
Predicting Machine Translation Performance on Low-Resource Languages:
The Role of Domain Similarity [1.5] 本稿では,微調整コーパスのサイズ,微調整コーパスとテストコーパスのドメイン類似度,およびソース言語とターゲット言語の言語類似度について検討する。
結果から,ドメインの類似性は機械翻訳モデルの性能予測に最も重要な影響を及ぼすことが示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:56:56 GMT)
M$^3$Face: A Unified Multi-Modal Multilingual Framework for Human Face
Generation and Editing [1.2] M3Faceは、制御可能な顔生成と編集のための統合マルチモーダル多言語フレームワークである。
我々は、フレームワークの顔生成と編集機能を示すために、広範囲な定性的かつ定量的な実験を行う。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:56:23 GMT)
GIRT-Model: Automated Generation of Issue Report Templates [1.2] 我々は、開発者の指示に基づいてIRTを自動的に生成するアシスタント言語モデルであるGIRT-Modelを紹介する。
我々は、GIRT-Instructを使って、GIRT-Modelを作成するために、T5ベースモデルをインストラクション-チューニングします。
GIRT-Modelは、ROUGE、BLEU、METEOR、人的評価において、極めて高いスコアを達成し、IRT世代における一般的な言語モデルより優れている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:53:38 GMT)
A Fast Method for Lasso and Logistic Lasso [1.1] 本稿では,圧縮センシング,ラッソ回帰,ロジスティックラッソ回帰問題を高速に解く手法を提案する。
我々は、複数の解決者の1回の呼び出しで大きなスピードアップを達成するアクティブセットを更新する戦略を設計する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:24:52 GMT)
Multi-Robot Relative Pose Estimation in SE(2) with Observability
Analysis: A Comparison of Extended Kalman Filtering and Robust Pose Graph
Optimization [1.0] 本研究では,相対的なポーズ推定の協調的局所化と可観測性分析に着目する。
ROS/Gazeboシミュレーションでは,4つのセンシング・通信構造について検討する。
ハードウェア実験では、UWBモジュールを備えた2つのTurtlebot3がロボット間の相対的なポーズ推定に使用される。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:51:59 GMT)
Role of Momentum in Smoothing Objective Function in Implicit Graduated
Optimization [0.8] 運動量を持つ勾配降下(SGD)は、高速収束と優れた一般化性を有する。
運動量を持つSGDは、学習速度、バッチサイズ、運動量係数、勾配のばらつき、勾配ノルムの上界によって決定される目的関数を滑らかにすることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 02:48:28 GMT)
PixelGen: Rethinking Embedded Camera Systems [0.8] 組込みカメラシステムを再想像するPixelGenについて紹介する。
具体的には、PixelGenはセンサー、トランシーバー、低解像度の画像と赤外線の視覚センサーを組み合わせて、より広い世界表現を捉えている。
PixelGenの機能は従来の写真を超えて、音波のような従来のカメラには見えない現象の可視化を可能にする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:41:56 GMT)
Uncovering hidden geometry in Transformers via disentangling position
and context [0.6] トレーニングされた変換器の隠れ状態(または埋め込み)を解釈可能なコンポーネントに簡易に分解する。
一般的なトランスフォーマーアーキテクチャや多様なテキストデータセットでは、経験的に広範に数学的構造が見つかる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:49:07 GMT)
On the performance of phonetic algorithms in microtext normalization [0.6] マイクロテキスト正規化(microtext normalization)は、非標準マイクロテキストのための前処理ステップである。
音声アルゴリズムは、マイクロテキストを標準テキストに変換するのに使える。
本研究の目的は,候補生成の文脈における最適な音声アルゴリズムを決定することである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:54:44 GMT)
Adaptive aggregation of Monte Carlo augmented decomposed filters for
efficient group-equivariant convolutional neural network [0.3] グループ等価畳み込みニューラルネットワーク(G-CNN)は、CNNのデータ効率と性能を向上させるためにパラメータ共有に大きく依存している。
群同変ニューラルネットワークに対する非パラメータ共有手法を提案する。
パラメータ共有グループ同変ネットワークよりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:22:29 GMT)
Obstacle Avoidance Deep Reinforcement Learning-Based Trajectory Planner
with Robust Low-Level Control for Robotic Manipulators [0.3] ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では,障害物のない深部強化学習(DRL)トラジェクトリプランナと,新しい低レベルかつ高レベルな自動制御戦略を統合することを提案する。
このアプローチは計算の複雑さを回避し、非反復的およびランダムな障害物回避タスクにも対処する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:54:03 GMT)
Modeling of learning curves with applications to pos tagging [0.3] トレーニングベース全体の学習曲線の進化を推定するアルゴリズムを導入する。
学習手法とは無関係に,所望のタイミングで探索値を反復的に近似する。
本提案は, 作業仮説に関して正式に正しいことを証明し, 信頼性の高い近接条件を含む。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:00:52 GMT)
Adaptive scheduling for adaptive sampling in POS taggers construction [0.3] 音声タグ作成における機械学習の新たな手法として適応的サンプリングのための適応的スケジューリングを提案する。
本研究では,関数モデルとともに幾何学的に学習曲線の形状を分析し,任意のタイミングで学習曲線を増減する。
また,評価の一時的なインフレーションを受けるトレーニングデータベースの領域に注意を払い,サンプリングの堅牢性も向上する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:02:17 GMT)
Absolute convergence and error thresholds in non-active adaptive
sampling [0.3] 非アクティブ適応サンプリングは、トレーニングベースから機械学習モデルを構築する方法である。
絶対収束と誤差しきい値を計算するための提案について述べる。
テストは私たちの期待に応え、自然言語処理の領域における提案を説明する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:10:34 GMT)
Surfing the modeling of PoS taggers in low-resource scenarios [0.2] 我々は,学習曲線の早期推定を,非深層学習者の利用を特徴とするシナリオにおいて,最も適切なモデルを選択するための実践的なメカニズムとして評価する。
我々は、このようなアプローチの信頼性を、異なる、より要求の高い運用環境において研究する。
西部イベロロマンスグループに属する言語であるガリシア語に対するPoSタグ生成のケーススタディとして、実験結果は我々の期待と一致している。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:38:12 GMT)
Early stopping by correlating online indicators in neural networks [0.2] 本稿では,学習者の学習において過度に適合する現象を識別する新しい手法を提案する。
提案手法は,オンライン指標の収集における時間的相関を利用したものである。
一つの基準に焦点をあてた従来のアプローチとは対照的に、独立性評価の助成を生かしている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:57:20 GMT)
Optimizing for periodicity: a model-independent approach to flux
crosstalk calibration for superconducting circuits [0.2] フラックス可変超伝導回路に基づく大規模量子コンピュータはフラックスクロストークの問題に直面している。
本稿では,基礎となる回路モデルに依存しないフラックスクロストークのキャリブレーション手法を提案する。
本手法を超伝導束量子ビットに基づく小型量子アニール回路上で実証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:39:51 GMT)
Operating critical machine learning models in resource constrained
regimes [0.2] 本研究では,資源消費とディープラーニングモデルの性能のトレードオフについて検討する。
ディープラーニングモデルは、クリニックのようなクリティカルな環境で使用される。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:11:08 GMT)
Deep Supervision by Gaussian Pseudo-label-based Morphological Attention
for Abdominal Aorta Segmentation in Non-Contrast CTs [0.1] 本稿では, フォロジカル・アテンション(MA)向上を実現するため, 従来の深層学習モデルに統合されたガウス的擬似ラベルを提案する。
様々な2D/3D深層学習モデルで導入され,5749個のCTスライスからなる30個の非コントラストCTボリュームの局所データセット上で検証された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:59:31 GMT)
Navigating the Peril of Generated Alternative Facts: A ChatGPT-4 Fabricated Omega Variant Case as a Cautionary Tale in Medical Misinformation [0.1] 本研究はOmega variantと呼ばれるSARS-CoV-2変異株について,S遺伝子領域で31の変異が認められた。
しかし、この物語の本当の過小評価は、AI、特にChatGPT-4が、説得力がありながら完全にフィクション的な科学データを作成できることの証明である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:21:19 GMT)
Using remotely sensed data for air pollution assessment [0.0] この研究の主な目的は、観測データがない場所で汚染物質濃度を推定できるモデルを作成することである。
2019年、イベリア半島の5種類の汚染物質の濃度を予測する機械学習モデルが開発された。
平均値が少し高くなる$O_3$と$PM10$を除いて、全てのモデルでRMSEを許容するクロスバリデーションを提示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:27:28 GMT)
Topologically protected Casimir effect for lattice fermions [0.0] 電磁カシミール効果は、トポロジカル絶縁体においてフェルミオン性を持つ。
最近発達したユークリッド作用の局所的な離散化は、ハミルトニアンの局所的な離散化のフェルミオン二重化の障害に悩まされないことを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:15:52 GMT)
The Shifting Landscape of Cybersecurity: The Impact of Remote Work and
COVID-19 on Data Breach Trends [0.0] この研究は、リモートワーク開始から2年と2年を経たデータ漏洩を分析してトレンドを特定する。
この結果から,遠隔作業環境におけるサイバーセキュリティ対策のベストプラクティスが示唆された。
リモートワークが進化を続けるにつれ、組織はサイバーセキュリティ戦略に適応し、警戒し続けなければなりません。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:07:28 GMT)
Tangential Casimir force in the misaligned system: Magnetic media, real
conductors, and a torque [0.0] この効果における磁気応答の役割について考察する。
等方性媒質からなる平行平板間のカシミールトルクについて論じる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:40:27 GMT)
Survival and grade of the glioma prediction using transfer learning [0.0] 本研究では,トランスファーラーニング技術を用いた新しい手法を提案する。
EfficientNet、ResNet、VGG16、Inceptionなど、事前訓練されたネットワークがテストされた。
実験の結果、生存予測では65%の精度を示し、患者を短期、中長期、長期の生存カテゴリーに分類した。
低次グリオーマ (LGG) と高次グリオーマ (HGG) を正確に区別した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:07:07 GMT)
Schr\"odinger's Cheshire Cat: A tabletop experiment to measure the
Di\'osi-Penrose collapse time and demonstrate Objective Reduction (OR) [0.0] Lajos Di'osi と Roger Penrose は、2つの非互換な時空を記述するため、波動関数の崩壊を提案する。
低質量で低エネルギーの亜原子粒子は数年で崩壊し、重畳された猫はほぼ瞬時に崩壊する。
2つの小さな鏡を重ね合わせ、ダイオシ・ペンローズモデルと整合した時間で崩壊する様子を観察するテーブルトップ実験を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:29:14 GMT)
Ricci flow-guided autoencoders in learning time-dependent dynamics [0.0] 時間的非線形力学、特に偏微分方程式(PDE)を学習するための多様体に基づくオートエンコーダ法を提案する。
これは、物理学的インフォームドな設定でリッチフローをシミュレートすることで実現でき、また、リッチフローが経験的に達成されるように、多様体の量と一致させることができる。
本稿では,周期性やランダム性などの望ましい特徴を包含するPDEを用いた数値実験について述べる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:31:48 GMT)
Review of multimodal machine learning approaches in healthcare [0.0] 臨床医は、情報的な判断をするために、さまざまなデータソースに依存しています。
機械学習の最近の進歩は、より効率的なマルチモーダルデータの取り込みを促進する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:21:38 GMT)
Ransomware threat mitigation through network traffic analysis and
machine learning techniques [0.0] 本稿では,コンピュータネットワークにおけるランサムウェアの認識と識別方法に焦点を当てる。
このアプローチは、機械学習アルゴリズムの使用と、ネットワークトラフィックのパターンの分析に依存する。
本手法の実装により,ネットワークトラフィックに基づいて,機械学習アルゴリズムが効果的にランサムウェアを特定できることが示唆された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:52:09 GMT)
R-C-P Method: An Autonomous Volume Calculation Method Using Image
Processing and Machine Vision [0.0] 2台のカメラを用いて、矩形物体の寸法をリアルタイムで測定した。
画像処理とエッジ検出を用いてR-C-P法を開発した。
表面積に加えて、R-C-P法は不連続エッジや体積も検出する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 01:43:07 GMT)
Quantum teleportation based on the elegant joint measurement [0.0] エレガントな関節計測(EJM)に基づく量子テレポーテーションの探索
これは望ましくない非単位量子進化によって引き起こされる確率的テレポーテーションである。
現在のシナリオを実現するために、実現可能な量子回路を詳細に示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:24:11 GMT)
Quantum reversal: a general theory of coherent quantum absorbers [0.0] コヒーレント量子吸収器は 他の系から放出される光子を吸収できる その系との絡み合いを維持しながら
この研究は、2つのシステムに対していわゆる逆条件を提案することによって、この概念を一般化する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 14:26:44 GMT)
Quantum panprotopsychism and the combination problem [0.0] 我々は、ハッサールと同様の意識の現象論的分析は、現象的品質の影響が世界に対する認識を形作ることを示していると論じる。
また、物理的および数学的科学の動作の仕方も示しており、観測された規則を通信可能な数学的法則で正確に記述することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:17:28 GMT)
Quantum Mechanics in Phase Space: An introduction [0.0] 位相空間および基本ガウス量子力学に量子力学を導入する音符のインフォーマルコレクション。
位相空間および基本ガウス量子力学における量子力学の入門ノート
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:32:48 GMT)
Position bias in features [0.0] 文書固有の履歴クリックスルーレートは、動的ランキングシステムにおいて重要な特徴である。
本稿では, それらの特徴について述べるとともに, 制御実験で検証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:15:30 GMT)
On the development of an application for the compilation of global sea
level changes [0.0] 提案された解決策は、研究者が直面している問題のいくつかを解決するWebアプリケーションを開発することである。
このアプリケーションは、テーブルの作成、マップの表示、グラフの描画によって、データのクエリ、処理、視覚化を支援する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:45:33 GMT)
On probabilities in quantum mechanics [0.0] 私はまずQBist学派で確率の概念を取り上げ、量子確率を計算するためのBorn公式についての私の自身の議論を参照する。
その関係において、量子論の基礎と解釈への私のアプローチのいくつかの結果もスケッチします。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:51:29 GMT)
On Minimum Trace Factor Analysis -- An Old Song Sung to a New Tune [0.0] 本稿では,1940年のリーダーマンの研究にさかのぼる根を持つ凸最適化法であるMTFA(Minimum Trace Factor Analysis)の緩和版を紹介する。
提案手法は,結果の低階部分空間の精度と,その行列を計算するアルゴリズムの収束率に関する理論的保証を提供する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:15:56 GMT)
Noise mitigation in quantum teleportation [0.0] ノイズによって引き起こされるデコヒーレンスは、量子テレポーテーションの実践的実現に挑戦する。
本稿では,離散型および連続型量子テレポーテーション方式の両方に適用可能なノイズ低減機構を提案する。
この結果は、ノイズ耐性量子テレポーテーションの実用化への道を開くものである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:56:32 GMT)
MonoPIC -- A Monocular Low-Latency Pedestrian Intention Classification
Framework for IoT Edges Using ID3 Modelled Decision Trees [0.0] 本稿では,2次元のフレーム内の任意の歩行者の意図を論理状態に分類するアルゴリズムを提案する。
これにより、比較的レイテンシの高いディープラーニングアルゴリズムを使用する必要がなくなる。
平均テスト精度は83.56%で信頼性は0.0042で、平均レイテンシは48ミリ秒であった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 03:53:34 GMT)
Malware Detection in IOT Systems Using Machine Learning Techniques [0.0] 本研究では、IoTマルウェア識別のためのCNN-LSTMハイブリッドモデルを導入し、その性能を確立された手法に対して評価する。
提案手法は95.5%の精度で既存の手法を上回りました。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:01:04 GMT)
Leveraging Continuously Differentiable Activation Functions for Learning
in Quantized Noisy Environments [0.0] 実世界のアナログシステムは、様々なディープラーニングモデルにおけるモデル収束と精度を妨げるノイズに本質的に苦しむ。
GELUやSiLUのような微分可能なアクティベーションは、勾配の堅牢な伝播を可能にし、アナログ量子化誤差を軽減することを実証する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 20:01:22 GMT)
Learning Style Identification Using Semi-Supervised Self-Taught Labeling [0.0] 教育は、パンデミックや戦争、気候変動に関連する自然災害などによる急激な変化や破壊に適応しなければならない。
学習管理システムは教師の生産性と創造性をサポートするが、通常はコース内のすべての学習者に同じコンテンツを提供する。
データマイニング技術を用いて,学生の学習スタイルを検出する半教師付き機械学習手法を提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 11:56:49 GMT)
Large Malaysian Language Model Based on Mistral for Enhanced Local
Language Understanding [0.0] 大規模言語モデルであるMistral 7Bの事前学習の進歩を示す。
コンテクスト長4096と32768のトークンを持つモデルをリリースし、16384のコンテクスト長調整モデルでさらなる性能向上を図る。
マレーシアのミストラルがタタバハサ(マレー文法)テストセットで優れていることを示す説得力のある結果を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 06:52:28 GMT)
LLM-SAP: Large Language Model Situational Awareness Based Planning [0.0] この研究は、大規模言語モデルにおける状況認識に基づく創発的計画能力の評価の先駆者である。
i) 標準化された評価のための新しいベンチマークとメトリクス、(ii) 進捗を加速するためのユニークなデータセット、(iii) 状況に敏感な計画タスクにおいて計画性能を著しく向上させるマルチエージェントスキームの実証に寄与する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:50:11 GMT)
Interplay between tie strength and neighbourhood topology in complex
networks: Granovetter's theory and beyond [0.0] グラノヴェッターの弱い関係理論は、エッジウェイトとネットワークのトポロジーの間の相関が存在するべきであることを述べている。
実際のソーシャルネットワークには負の相関性を示すものもある。
グラノベッターのような重み-トポロジー相関が他の複雑なネットワークに存在することを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:27:27 GMT)
Impact of PSF misestimation and galaxy population bias on precision
shear measurement using a CNN [0.0] 本稿では,畳み込みニューラルネットワーク(CNN)の高精度せん断推定への応用について検討する。
我々は、ノイズの多い円盤と楕円銀河の人口をシミュレートし、ユークリッドのようなサーベイを表すPSFを採用する。
推定されたせん断値と真のせん断値との線形関係を仮定して,CNNが達成した精度を定量化する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:06:39 GMT)
HAT-CL: A Hard-Attention-to-the-Task PyTorch Library for Continual
Learning [0.0] 本稿では,ユーザフレンドリでPyTorch互換なHAT-CLについて紹介する。
また,HATのための新しいマスク操作手法を導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:26:06 GMT)
Fast and interpretable Support Vector Classification based on the
truncated ANOVA decomposition [0.0] サポートベクタマシン(SVM)は、散在するデータの分類を行うための重要なツールである。
三角関数やウェーブレットに基づく特徴写像を用いて,SVMを原始形式で解くことを提案する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:27:42 GMT)
Enhancing Robustness in Biomedical NLI Models: A Probing Approach for
Clinical Trials [0.0] 大規模言語モデルは、会話AI、コンテンツ生成、情報検索、ビジネスインテリジェンス、医療など、さまざまな分野や産業に革命をもたらした。
ここでは,Sci-5モデルの検討にmnestic probing(mnestic probing)を用いた。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:18:01 GMT)
Efficient Numerical Wave Propagation Enhanced by an End-to-End Deep
Learning Model [0.0] 本稿では,数値解法と深層学習の要素をエンドツーエンドのフレームワークに統合する新しい統合システムを提案する。
その結果,凝集構造は速度を犠牲にすることなく性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:07:05 GMT)
Efficient Market Dynamics: Unraveling Informational Efficiency in UK
Horse Racing Betting Markets Through Betfair's Time Series Analysis [0.0] Betfairの時系列データを用いて、イギリスの競馬市場の分析は興味深いパラドックスを明らかにしている。
短い尾を持ち、急速に崩壊する自己相関を持ち、長期記憶のない市場。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 21:54:25 GMT)
Digital Distractions from the Point of View of Higher Education Students [0.0] 本研究の目的は,学生の立場から,主要なデジタル障害を特定することである。
学生は、デジタルな気晴らしが実験室での成績に大きな影響を及ぼすと考えた。
教員は、生徒がデジタル的注意散らしがパフォーマンスに有意な悪影響を及ぼすことに対する意識を高めるための戦略を実施すべきである。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:28:20 GMT)
Density dependent gauge field inducing emergent SSH physics, solitons
and condensates in a discrete nonlinear Schr\"odinger equation [0.0] 動的、密度差依存的なゲージ場を持つ離散非線形シュリンガー方程式について検討する。
平面波凝縮状態から局所ソリトン状態への基底状態遷移は、ゲージ結合が変化するにつれて起こる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 12:50:09 GMT)
Custom IMU-Based Wearable System for Robust 2.4 GHz Wireless Human Body
Parts Orientation Tracking and 3D Movement Visualization on an Avatar [0.0] この研究は、複数の身体部位の方向追跡を同時に行うことを目的とした、手頃な価格のカスタムソリューションを構築する可能性を示している。
提案システムは、最大10個のカスタムセンサーで、少なくとも50Hzの無線リアルタイム人体部品の方向追跡に使用できる。
BluetoothとWi-Fiの混在環境において、より信頼性の高いモーションデータ取得を提供する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:08:34 GMT)
Cryptographically Assured Information Flow: Assured Remote Execution [0.0] デバイス上の保証されたリモート実行は、承認された関係者が既知のプロセスでセキュアなチャネルを構築するのに適した能力である。
本稿では,CAIF (Cryptographically Assured Information Flow) と呼ばれる単純なハードウェアレベルの機構により,アセットされたリモート実行が可能となることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:47:03 GMT)
Controller Synthesis from Noisy-Input Noisy-Output Data [0.0] 線形システムのための動的出力フィードバックコントローラを合成する問題を考える。
入力出力データを処理するために、元のシステムの補助的な表現を導入する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:22:26 GMT)
Comparative Analysis of Kinect-Based and Oculus-Based Gaze Region
Estimation Methods in a Driving Simulator [0.0] 運転シミュレータに統合された2つの視線領域推定モジュールを提案する。
1つは3D Kinectデバイス、もう1つはバーチャルリアリティーのOculus Riftだ。
Oculus Riftモジュールは、運転シミュレータデータを強化し、マルチモーダル運転性能分析を可能にする。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:02:58 GMT)
Coherent all-optical control of a solid-state spin via a double
$\Lambda$-system [0.0] 全光制御は、色中心スピン上の高速量子演算を可能にする。
Lambda$-system による制御は他の色中心、特にダイヤモンドのグループ-IV欠陥にも適用できる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 23:58:52 GMT)
Closed-form expressions for smeared bi-distributions of a massless
scalar field: non-perturbative and asymptotic results in relativistic quantum
information [0.0] 時空領域の量子場と相互作用する局所量子系について検討する。
ガウス時空領域で相互作用するプローブによって得られる絡み合いを見つける。
2つの隙間のない検出器の場合を再検討し、相互作用領域間に2つのスミアドウェイ信号が存在する場合、検出器が絡み合うことができることを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 00:16:49 GMT)
Classification of Tennis Actions Using Deep Learning [0.0] 本研究では,深層学習によるテニス行動の分類の可能性と課題について検討する。
テニスデータセットTheTISを用いて,異なる大きさの3つのモデルを訓練し,評価した。
最高のモデルは74 %の一般化精度を達成し、テニスアクション分類に優れた性能を示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 15:48:20 GMT)
Brain-Body-Task Co-Adaptation can Improve Autonomous Learning and Speed
of Bipedal Walking [0.0] 脳と体を協調して環境と相互作用させる動物にインスパイアされた私たちは、腱駆動で過剰に作動する二足歩行ロボットを提示する。
本研究は, 植物のバックドライブ可能な特性に根ざした連続的な物理的適応によって, 連続的な物理的適応がいかに駆動されるかを示す。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 07:57:52 GMT)
BanglaNet: Bangla Handwritten Character Recognition using Ensembling of
Convolutional Neural Network [0.0] 本稿では,複数の畳み込みニューラルネットワーク(CNN)のアンサンブルに基づく分類モデルを提案する。
Inception、ResNet、DenseNetといった最先端CNNモデルのアイデアに基づいた3つの異なるモデルが、拡張入力と非拡張入力の両方でトレーニングされている。
CMATERdb(英語版)、BanglaLekha-Isolated(英語版)、Ekush(英語版)の3つのベンチマークによる厳密な実験は、かなりの認識精度を示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:39:07 GMT)
An adaptive network-based approach for advanced forecasting of
cryptocurrency values [0.0] 本稿では,Adaptive Network Fuzzy Inference System (ANFIS) を用いて,今後7日間の暗号価格を予測するアーキテクチャについて述べる。
データを教えるために使われる方法は、グリッド分割、減算クラスタリング、ファジィC平均クラスタリング(FCM)アルゴリズムと同様に、ハイブリッドおよびバックプロパゲーションアルゴリズムである。
提案手法は,デジタル通貨の価格を短時間で予測できる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 04:18:44 GMT)
Adolescent relational behaviour and the obesity pandemic: A descriptive
study applying social network analysis and machine learning techniques [0.0] Aim: グループのノードの属性間の類似性を探ることで,サブグループの存在を研究する。
Aim: SNAと人工知能技術による類似性の観点から,グループ間の接続性を分析する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:19:56 GMT)
A new approach for imprecise probabilities [0.0] 我々は、区間確率測度の幅広いクラスを特徴付け、それらの特性を定義する。
副産物として、世紀のケインズ=ラムゼー論争の正式な解決法が提示される。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 16:09:04 GMT)
A generalized decision tree ensemble based on the NeuralNetworks
architecture: Distributed Gradient Boosting Forest (DGBF) [0.0] 本稿では,木間の分散表現学習を自然に行うグラフ構造木アンサンブルアルゴリズムを提案する。
我々は、この新しいアプローチを分散グラディエントブースティングフォレスト(DGBF)と呼び、RandomForestとGradientBoostingの両方がDGBFの特定のグラフアーキテクチャとして表現できることを実証する。
最後に、分散学習は、9つのデータセットのうち7つでRandomForestとGradientBoostingの両方に優れています。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 09:22:52 GMT)
A comparative study on wearables and single-camera video for upper-limb
out-of-thelab activity recognition with different deep learning architectures [0.0] IMU(High-end Inertial Measurement Unit)は、臨床および研究環境での身体活動の評価において、ますます人気が高まっている。
アウト・オブ・ザ・ラブ環境における患者追跡の実現可能性を高めるためには,移動獲得のためのデバイス数を減らす必要がある。
臨床関連データを認識・消化できる機械学習システムの開発が必要である。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 19:45:59 GMT)
A Survey on Blockchain in E-Government Services: Status and Challenges [0.0] テクノロジーは、あらゆるデジタル資産の歴史を記録する非常にセキュアで分散台帳と呼ばれる。
多くの国で政府や民間の機関で使用されている。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 13:21:29 GMT)
A Physiological Sensor-Based Android Application Synchronized with a
Driving Simulator for Driver Monitoring [0.0] Androidアプリはドライバーを監視し、それらのパラメータを使って生理状態と運転性能の関係を分析することができる。
このアプリは、慢性疾患の患者やアスリートなど、他のユーザーへの微妙な適応で適用することができる。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 18:55:24 GMT)
A Paradigm for Potential Model Performance Improvement in Classification
and Regression Problems. A Proof of Concept [0.0] この手法では、属性間の関係を相互の関数として捉える複数の補助モデルを生成する。
このような情報は、ターゲット予測を強化する可能性があるデータセットに付加的な情報列を生成するのに役立つ。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 05:37:37 GMT)
A Momentum Accelerated Algorithm for ReLU-based Nonlinear Matrix
Decomposition [0.0] 本稿では,Tikhonov正規化ReLU-NMDモデル(ReLU-NMD-T)を提案する。
本稿では,ReLU-NMD-Tモデルを扱うための運動量加速アルゴリズムを提案する。
実世界のデータセットに関する数値実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 10:43:35 GMT)
A Deep Learning Approach for Brain Tumor Classification and Segmentation
Using a Multiscale Convolutional Neural Network [0.0] 本稿では,Deep Convolutional Neural Networkを用いた完全自動脳腫瘍分割分類モデルを提案する。
腫瘍の分類精度は0.973で, 同一のデータベースを用いた他の手法よりも高い値を示した。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 17:47:03 GMT)
A Comprehensive Review of YOLO Architectures in Computer Vision: From
YOLOv1 to YOLOv8 and YOLO-NAS [0.0] YOLOは、ロボット工学、無人運転車、およびビデオ監視アプリケーションのための中心的なリアルタイムオブジェクト検出システムとなっている。
本稿では,YOLOの進化を包括的に分析し,元のYOLOからYOLOv8,YOLO-NAS,YOLOをトランスフォーマーとしたYOLOまでの各イテレーションにおけるイノベーションとコントリビューションについて検討する。
論文参考訳(メタデータ) (Sun, 4 Feb 2024 22:38:15 GMT)