Eliminating Position Bias of Language Models: A Mechanistic Approach [119.3] 位置バイアスは現代言語モデル (LM) の一般的な問題であることが証明されている。
我々の力学解析は、ほぼ全ての最先端のLMで使われている2つのコンポーネント(因果的注意と相対的位置エンコーディング)に位置バイアスが関係している。
位置バイアスを排除することによって、LM-as-a-judge、検索強化QA、分子生成、数学推論など、下流タスクのパフォーマンスと信頼性が向上する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:09:53 GMT)
Gemma 2: Improving Open Language Models at a Practical Size [118.0] Gemma 2は、軽量で最先端のオープンモデルであるGemmaファミリの新しい追加である。
我々はTransformerアーキテクチャにいくつかの技術的変更を適用し、例えば、ローカル・グローバル・アテンションをインターリーブする。
結果として得られたモデルは、そのサイズで最高のパフォーマンスを提供し、さらに2~3倍の大きさのモデルに対して、競争力のある代替手段を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:22:49 GMT)
Law of the Weakest Link: Cross Capabilities of Large Language Models [102.9] 我々は,Large Language Models (LLMs) が "Law of the Weakest Link" を示すことを示した。
これらの結果は, クロスキャパビリティタスクにおけるLLMの低性能化を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:24:44 GMT)
Law of the Weakest Link: Cross Capabilities of Large Language Models [102.9] 我々は,Large Language Models (LLMs) が "Law of the Weakest Link" を示すことを示した。
これらの結果は, クロスキャパビリティタスクにおけるLLMの低性能化を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:24:44 GMT)
SciEx: Benchmarking Large Language Models on Scientific Exams with Human Expert Grading and Automatic Grading [100.0] LLM(Large Language Models)の一般的な用途は、科学的トピックに関するタスクを実行することである。
そこで本稿では,大学生のこのような課題に対する評価方法に着想を得たSciExを提案する。
我々は,新しいベンチマークを用いて,最先端のLLMの性能評価を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:20:50 GMT)
Samba: Synchronized Set-of-Sequences Modeling for Multiple Object Tracking [97.3] 協調ダンスパフォーマンスやチームスポーツ、動的動物グループといった複雑なシナリオにおける複数のオブジェクト追跡は、ユニークな課題を提示します。
複数トラックレットを共同処理するために設計された新しい線形時間集合列モデルであるSambaを紹介する。
Sambaは、同期した長期メモリ表現を維持しながら、各シーケンスの将来のトラッククエリを自動的に予測する。
本研究では、不確実な観測(MaskObs)を扱うための効果的な手法と、より長いシーケンスにSambaMOTRをスケールするための効率的なトレーニングレシピを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:59:57 GMT)
EgoGaussian: Dynamic Scene Understanding from Egocentric Video with 3D Gaussian Splatting [95.4] エゴガウスアン(EgoGaussian)は、3Dシーンを同時に再構築し、RGBエゴセントリックな入力のみから3Dオブジェクトの動きを動的に追跡する手法である。
動的オブジェクトと背景再構築の品質の両面で,最先端技術と比較して大きな改善が見られた。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 04:00:01 GMT)
KnowTuning: Knowledge-aware Fine-tuning for Large Language Models [83.6] 本研究では,LLMの微粒で粗粒な知識認識を改善するための知識認識ファインタニング(KnowTuning)手法を提案する。
KnowTuningは、きめ細かい事実評価の下で、より少ない事実エラー率で多くの事実を生成する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:20:29 GMT)
Scaling Optimal LR Across Token Horizons [81.3] LLMトレーニングにおいて,最適な学習速度がトークン水平線に依存することを示す。
また,LLama-1が高LRを多用した証拠も提示し,その性能を推定した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:03:25 GMT)
Scaling Optimal LR Across Token Horizon [81.3] LLMトレーニングにおいて,最適な学習速度がトークン水平線に依存することを示す。
また,LLama-1が高LRを多用した証拠も提示し,その性能を推定した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:03:25 GMT)
Moshi: a speech-text foundation model for real-time dialogue [78.9] 現在の音声対話システムは、パイプラインの独立した音声活動検出と音声合成に依存している。
そこで本研究では,Moshi Moshiが音声認識と音声合成を実現する方法を紹介する。
得られたモデルは、初めてリアルタイムな全音声大言語モデルモダリティである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:11:45 GMT)
Adaptive teachers for amortized samplers [76.9] 償却推論(英: Amortized inference)とは、ニューラルネットワークなどのパラメトリックモデルをトレーニングし、正確なサンプリングが可能な所定の非正規化密度で分布を近似するタスクである。
オフ・ポリティクスのRLトレーニングは多様でハイ・リワードな候補の発見を促進するが、既存の手法は依然として効率的な探索の課題に直面している。
そこで本研究では,高次領域の優先順位付けにより,初等補正標本作成者(学生)の指導を指導する適応学習分布(教師)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:33:13 GMT)
Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.1] Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:14:26 GMT)
Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking [73.1] オープンな語彙的3Dトラッキングを導入し、3Dトラッキングの範囲を広げて、定義済みのカテゴリを超えてオブジェクトを含める。
本稿では,オープン語彙機能を3次元トラッキングフレームワークに統合し,オブジェクトクラスが見えないように一般化する手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:48:42 GMT)
Bellman Diffusion: Generative Modeling as Learning a Linear Operator in the Distribution Space [72.5] 本稿では,MDPの線形性を維持する新しいDGMフレームワークであるBellman Diffusionを紹介する。
この結果から,ベルマン拡散は分布RLタスクにおける従来のヒストグラムベースベースラインよりも1.5倍高速に収束し,精度の高い画像生成装置であることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:53:23 GMT)
Theory on Mixture-of-Experts in Continual Learning [72.4] 継続学習(CL)は、時間とともに現れる新しいタスクに適応する能力のため、大きな注目を集めている。
モデルが新しいタスクに適応するにつれて、(古いタスクの)破滅的な忘れがCLの大きな問題として認識されるようになった。
MoEモデルは近年,ゲーティングネットワークを用いることで,CLの破滅的忘れを効果的に軽減することが示されている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 05:48:49 GMT)
Don't Just Say "I don't know"! Self-aligning Large Language Models for Responding to Unknown Questions with Explanations [70.6] 自己調整法は,回答を拒否するだけでなく,未知の質問の解答不能を説明できる。
我々は, LLM自体を微調整し, 未知の質問に対する応答を所望の通りに調整するために, 偏差駆動による自己計算を行い, 有資格データを選択する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 02:09:37 GMT)
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data [69.7] 音声分類データセットを合成データで拡張する新しい手法であるSynthioを提案する。
最初の課題を克服するために、好みの最適化を用いて、T2Aモデルの世代と小規模データセットを整列する。
2つ目の課題に対処するために,大規模言語モデルの推論能力を活用する新しいキャプション生成手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:05:36 GMT)
Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy [68.5] GemBenchは視覚言語ロボット操作ポリシーの一般化能力を評価するための新しいベンチマークである。
LLMのタスク計画機能と3D-LOTUSの動作計画機能を統合するフレームワークである3D-LOTUS++を提案する。
3D-LOTUS++はGemBenchの新しいタスクで最先端のパフォーマンスを実現し、ロボット操作の一般化のための新しい標準を設定している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:02:34 GMT)
Can We Further Elicit Reasoning in LLMs? Critic-Guided Planning with Retrieval-Augmentation for Solving Challenging Tasks [68.5] 最先端の大規模言語モデル(LLM)は、目覚ましい問題解決能力を示すが、複雑な推論と事実の正しさに苦慮する可能性がある。
既存の手法では、チェーン・オブ・ソートと検索強化生成(RAG)の強みを利用して、複雑な問題をより単純なステップに分解し、検索を適用して事実の正しさを向上させる。
CR-Planner(CR-Planner, CR-Planner, CR-Planner)は, 微調整された批判モデルを利用して, 推論と検索の両方のプロセスを計画を通してガイドする新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:26:02 GMT)
Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.1] プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 02:02:56 GMT)
VinePPO: Unlocking RL Potential For LLM Reasoning Through Refined Credit Assignment [66.8] VinePPOは不偏のモンテカルロ推定を計算するための簡単な手法である。
我々は、VinePPOが、MATHおよびGSM8Kデータセット間でPPOや他のRLフリーベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:49:30 GMT)
Unleashing the Power of Task-Specific Directions in Parameter Efficient Fine-tuning [65.3] 本稿では,タスク固有の方向性 (TSD) の概念に着目し,大規模モデルを事前学習状態からPEFTにおけるタスク固有の拡張へ移行させる。
本稿では,微調整過程におけるTSDの影響を最大化し,目標タスクにおけるモデル性能を向上させることを目的とした新しいアプローチであるLoRA-Dashを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:20:31 GMT)
Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.1] 拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では、DBPプロセスの本質が、その堅牢性の主要な要因であると主張している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:28:38 GMT)
RMLR: Extending Multinomial Logistic Regression into General Geometries [64.2] 我々のフレームワークは、最小限の幾何学的性質しか必要とせず、広い適用性を示す。
SPD MLRの5つのファミリーを5種類のパワー変形測定値に基づいて開発する。
回転行列上では、人気のある双不変計量に基づいてリー MLR を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:53:48 GMT)
RMLR: Extending Multinomial Logistic Regression into General Geometries [64.2] 我々のフレームワークは、最小限の幾何学的性質しか必要とせず、広い適用性を示す。
SPD MLRの5つのファミリーを5種類のパワー変形測定値に基づいて開発する。
回転行列上では、人気のある双不変計量に基づいてリー MLR を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:53:48 GMT)
Deep learning for action spotting in association football videos [64.1] SoccerNetイニシアチブは毎年の課題を組織し、世界中の参加者が最先端のパフォーマンスを達成するために競う。
本稿では,スポーツにおけるアクションスポッティングの歴史を,2018年の課題の創出から,現在の研究・スポーツ産業における役割まで遡る。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:56:15 GMT)
FlipAttack: Jailbreak LLMs via Flipping [63.9] 本稿では,ブラックボックスLSMに対するFlipAttackという単純なジェイルブレイク攻撃を提案する。
LLMは、左から右へテキストを理解する傾向があり、ノイズが左に付加されたときにテキストを理解するのに苦労している。
これらの知見に感化されて、我々はプロンプト自体に基づいて左側のノイズを合成し、これを4つのフリップモードに一般化することで有害なプロンプトを偽装することを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:41:23 GMT)
TuBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning [63.5] 多言語大言語モデル(LLM)に対する言語間バックドア攻撃は未調査である。
本研究は, 教育指導データが有毒でない言語に対して, 教育指導データの有毒化がアウトプットに与える影響について検討した。
本手法は,mT5 や GPT-4o などのモデルにおいて,高い攻撃成功率を示し,12言語中7言語以上で90%以上を突破した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:47:40 GMT)
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models [63.1] 大規模言語モデル(LLM)の論理的推論能力を評価・拡張するための新しいアプローチであるLogicAskerを紹介する。
提案手法は, LLMが論理規則を学習する際の大きなギャップを明らかにし, 異なるモデル間で29%から90%の推論失敗を識別する。
GPT-4oのようなモデルにおける論理的推論を最大5%向上させることで、これらの知見を活用して、ターゲットとなる実演例と微調整データを構築した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:30:34 GMT)
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation [61.0] テキスト, 単一画像, スパース画像から高品質な3Dコンテンツを生成するための新しいフレームワークFlex3Dを提案する。
我々は、微調整された多視点画像拡散モデルとビデオ拡散モデルを用いて、候補視のプールを生成し、ターゲット3Dオブジェクトのリッチな表現を可能にする。
第2段階では、キュレートされたビューは、任意の数の入力を効果的に処理できるトランスフォーマーアーキテクチャ上に構築されたフレキシブルリコンストラクションモデル(FlexRM)に入力されます。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:47:34 GMT)
On exploring the potential of quantum auto-encoder for learning quantum systems [60.9] そこで我々は,古典的な3つのハードラーニング問題に対処するために,QAEに基づく効果的な3つの学習プロトコルを考案した。
私たちの研究は、ハード量子物理学と量子情報処理タスクを達成するための高度な量子学習アルゴリズムの開発に新たな光を当てています。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:20:22 GMT)
Improving Zero-Shot ObjectNav with Generative Communication [60.8] ゼロショットObjectNavの改良手法を提案する。
私たちのアプローチは、接地エージェントが制限され、時には障害のあるビューを持つ可能性があることを考慮に入れています。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:13:22 GMT)
Automated Knowledge Concept Annotation and Question Representation Learning for Knowledge Tracing [59.5] 自動知識概念アノテーションと質問表現学習のためのフレームワークであるKCQRLを提案する。
実世界の2つの学習データセット上で、15KTアルゴリズムにまたがるKCQRLの有効性を実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:37:19 GMT)
A Study of Posterior Stability for Time-Series Latent Diffusion [59.4] まず,後部崩壊により可変オートエンコーダ(VAE)への潜伏拡散が減少し,表現性が低下することを示す。
次に、入力変数に対するリカレントデコーダの感度を定量化する、依存性測度という原則的手法を導入する。
理論的および実証的研究に基づいて,潜伏拡散を延長し,後部が安定な新しい枠組みを導入する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:40:47 GMT)
CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.8] 我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。
CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。
ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:37:01 GMT)
Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.7] 非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:11:31 GMT)
Not All LLM Reasoners Are Created Equal [58.2] 小学校数学におけるLLMの解答能力の深さについて検討する。
既存の数式語問題に対して,それらの性能を併用して評価する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:01:10 GMT)
Variance-Reducing Couplings for Random Features [57.7] ランダム機能(RF)は、機械学習においてカーネルメソッドをスケールアップする一般的なテクニックである。
ユークリッド空間と離散入力空間の両方で定義されるRFを改善するための結合を求める。
パラダイムとしての分散還元の利点と限界について、驚くほどの結論に達した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:02:27 GMT)
AgentStudio: A Toolkit for Building General Virtual Agents [57.0] 一般的な仮想エージェントは、マルチモーダルな観察、複雑なアクション空間のマスター、動的でオープンなドメイン環境における自己改善を扱う必要がある。
AgentStudioは、非常に汎用的な観察とアクション空間を備えた軽量でインタラクティブな環境を提供する。
オンラインベンチマークタスクの作成、GUI要素の注釈付け、ビデオ内のアクションのラベル付けといったツールを統合する。
環境とツールに基づいて、GUIインタラクションと関数呼び出しの両方を効率的な自動評価でベンチマークするオンラインタスクスイートをキュレートします。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:56:21 GMT)
LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits [56.9] 本稿では,複数のリワードモデル(RM)を用いてLLMを反復的に学習するLASeRを紹介する。
以上の結果から,複数のRMを最適化することにより,LASeRの繰り返しLLM最適化を向上できることが示唆された。
また、LASeRを用いて緩和可能な複数のRMからの相反する選好の存在を検証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:46:38 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9] 本研究は、応答における2つの重要なスタイル的要素、すなわち言語形式と意味的前提を同定する。
これに触発されて、スタイル一貫性対応対応ランキング(SCAR)を導入する。
SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:46:54 GMT)
Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.9] 我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:46:34 GMT)
Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models [56.8] 現実世界のアプリケーションは、複数のオーディオストリームを同時に処理することが多い。
11のマルチオーディオタスクから20のデータセットからなる最初のマルチオーディオ評価ベンチマークを提案する。
本稿では,複数の類似した音声間の音声コンテキストをキャプチャするマルチオーディオLLM(MALLM)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:45:40 GMT)
FabricDiffusion: High-Fidelity Texture Transfer for 3D Garments Generation from In-The-Wild Clothing Images [56.6] ファブリックディフュージョン(FabricDiffusion)は、織物のテクスチャを1枚の衣服画像から任意の形状の3D衣服に転送する方法である。
FabricDiffusionは、テクスチャパターン、材料特性、詳細な印刷物やロゴを含む、単一の衣料品画像から様々な特徴を伝達できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:57:12 GMT)
Concept-skill Transferability-based Data Selection for Large Vision-Language Models [56.1] 視覚言語モデルを学習するための効果的でスケーラブルなデータ選択手法であるCOINCIDEを紹介する。
我々は,目標LVLMに必要な概念スキル構成を識別する小型モデルからの内部アクティベーションを用いて,トレーニングデータをクラスタ化する。
実験により、COINCIDEは8つの強いベースラインに対して、優れた性能とデータ選択効率を実現することが示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:20:28 GMT)
EMMA: Efficient Visual Alignment in Multi-Modal LLMs [56.0] EMMAは、視覚的およびテキスト的エンコーディングを効率的に融合するために設計された軽量なクロスプラットフォームモジュールである。
EMMAは複数のタスクのパフォーマンスを最大9.3%向上させ、幻覚に対する堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:00:31 GMT)
Spec-Gaussian: Anisotropic View-Dependent Appearance for 3D Gaussian Splatting [55.7] Spec-Gaussian は球面調和の代わりに異方性球面ガウス場を利用するアプローチである。
実験結果から,本手法はレンダリング品質の面で既存の手法を超越していることが示された。
この改良は、3D GSの適用性を高めて、特異面と異方面の複雑なシナリオを扱う。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:07:13 GMT)
AniSDF: Fused-Granularity Neural Surfaces with Anisotropic Encoding for High-Fidelity 3D Reconstruction [55.7] AniSDF(AniSDF)は,高忠実度3次元再構成のための物理に基づく符号化による融合粒度ニューラルサーフェスを学習する新しいアプローチである。
本手法は, 幾何再構成と新規ビュー合成の両面において, SDF法の品質を飛躍的に向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:10:38 GMT)
Leveraging the Context through Multi-Round Interactions for Jailbreaking Attacks [55.6] 大規模言語モデル(LLM)は、脱獄攻撃の影響を受けやすい。
脱獄攻撃は、攻撃クエリを微調整することで有害な情報を抽出することを目的としている。
我々は、コンテキストインタラクションアタックと呼ばれる新しい攻撃形式に焦点を当てる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:43:07 GMT)
On the Convergence of FedProx with Extrapolation and Inexact Prox [55.2] 我々は、各クライアントが特定の演算子を正確に計算するという仮定なしに、FedExProxの挙動を調査する。
不完全性は解の近傍に収束することを示す。
我々の理論的洞察は総合的な数値実験によって検証される。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:42:27 GMT)
Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2] 因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:01:38 GMT)
Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.2] 生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:26:52 GMT)
Generative Diffusion-based Contract Design for Efficient AI Twins Migration in Vehicular Embodied AI Networks [55.2] Embodied AIは、サイバースペースと物理空間のギャップを埋める、急速に進歩する分野だ。
VEANETでは、組み込まれたAIツインが車載AIアシスタントとして機能し、自律運転をサポートするさまざまなタスクを実行する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:20:42 GMT)
CUTE: Measuring LLMs' Understanding of Their Tokens [54.7] 大きな言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示す。
LLMはどの程度の間、正書法情報を学ぶことができるのか?
LLMの正書法知識をテストするために設計されたタスクの集合を特徴とする新しいベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:35:40 GMT)
Interpolating Video-LLMs: Toward Longer-sequence LMMs in a Training-free Manner [53.7] ビデオ-LLMはショートビデオの処理のために事前訓練されており、長いビデオコンテンツを理解するための幅広いアプリケーションを制限する。
固定ビデオエンコーダとアライメントプロジェクタの制約を回避するための代替ビデオトークン再構成手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:56:08 GMT)
Interpolating Video-LLMs: Toward Longer-sequence LMMs in a Training-free Manner [53.7] ビデオ-LLMはショートビデオの処理のために事前訓練されており、長いビデオコンテンツを理解するための幅広いアプリケーションを制限する。
固定ビデオエンコーダとアライメントプロジェクタの制約を回避するための代替ビデオトークン再構成手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:56:08 GMT)
VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.6] 柔軟な芸術的タイポグラフィーを実現するために,二枝・無訓練の手法であるVitaGlyphを導入する。
VitaGlyphは入力文字を被写体と周囲からなるシーンとして扱い、次に幾何変換の度合いでそれらをレンダリングする。
実験結果から、VitaGlyphは芸術性や可読性の向上だけでなく、複数のカスタマイズ概念を表現できることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:48:47 GMT)
Facial Action Unit Detection by Adaptively Constraining Self-Attention and Causally Deconfounding Sample [53.2] 顔行動単位(AU)検出は、AUの微妙さ、ダイナミクス、多様性のため、依然として困難な課題である。
本稿では,自己注意重み分布を適応的に制限することで,AC2Dと呼ばれる新しいAU検出フレームワークを提案する。
提案手法は,最先端のAU検出手法と比較して,挑戦的なベンチマークによる競合性能を実現する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:51:24 GMT)
3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.7] 医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:19:33 GMT)
Optimal Learners for Realizable Regression: PAC Learning and Online Learning [52.4] 本研究では,PAC学習環境とオンライン学習環境の両方において,実現可能な回帰の統計的複雑さを特徴付けることを目的とする。
まず,再現可能な回帰のためのミニマックスインスタンス最適学習器を導入し,実数値予測器のどのクラスが学習可能であるかを質的かつ定量的に特徴付ける新しい次元を提案する。
オンライン学習の文脈では、最小の最適インスタンス最適累積損失を一定要素まで特徴付ける次元を提供し、再現可能な回帰のための最適オンライン学習者を設計する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:31:03 GMT)
Unveiling the Achilles' Heel of NLG Evaluators: A Unified Adversarial Framework Driven by Large Language Models [52.4] 我々は,NLG評価器に対する新しいブラックボックス対逆フレームワークであるAdvEvalを紹介する。
AdvEvalは、人間と被害者の評価者との強い意見の相違をもたらすデータを生成するために特別に調整されている。
我々は,12名の被害者評価者と11名のNLGデータセットを用いて,対話,要約,質問評価などのタスクを分散した実験を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 01:47:34 GMT)
CLIP-Guided Generative Networks for Transferable Targeted Adversarial Attacks [52.3] トランスファー可能な敵攻撃は、ブラックボックスのシナリオで敵が特定した予測を出力するモデルを誤解させることを目的としている。
textitsingle-target 生成攻撃は、高い転送可能な摂動を生成するために、各ターゲットクラスのジェネレータを訓練する。
textbfCLIP-guided textbfGenerative textbfNetwork with textbfCross-attention module (CGNC) to enhance multi-target attack。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:16:06 GMT)
Learning to Extract Structured Entities Using Language Models [52.3] 機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:21:43 GMT)
Multiple Heads are Better than One: Mixture of Modality Knowledge Experts for Entity Representation Learning [51.8] 高品質なマルチモーダル実体表現を学習することは、マルチモーダル知識グラフ(MMKG)表現学習の重要な目標である。
既存の手法は、エレガントなエンティティワイドマルチモーダル融合戦略の構築に重点を置いている。
適応型マルチモーダルな実体表現を学習するために,Mixture of Modality Knowledge Expert (MoMoK) を用いた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:42:10 GMT)
HOPE for a Robust Parameterization of Long-memory State Space Models [51.7] 線形時間不変(LTI)システムを利用する状態空間モデル(SSM)は、長いシーケンスの学習において有効であることが知られている。
我々は,ハンケル作用素内のマルコフパラメータを利用するLTIシステムに対して,HOPEと呼ばれる新しいパラメータ化手法を開発した。
我々の新しいパラメータ化は、固定時間ウィンドウ内に非遅延メモリを付与し、パッドドノイズのあるシーケンシャルCIFAR-10タスクによって実証的に相関する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:56:09 GMT)
Affordance-Guided Reinforcement Learning via Visual Prompting [51.4] Keypoint-based Affordance Guidance for Improvements (KAGI) は、視覚言語モデル(VLM)によって形成される報酬を自律的なRLに活用する手法である。
自然言語記述によって指定された実世界の操作タスクにおいて、KAGIは自律的なRLのサンプル効率を改善し、20Kのオンライン微調整ステップでタスク完了を成功させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:40:38 GMT)
Affordance-Guided Reinforcement Learning via Visual Prompting [51.4] Keypoint-based Affordance Guidance for Improvements (KAGI) は、視覚言語モデル(VLM)によって形成される報酬を自律的なRLに活用する手法である。
自然言語記述によって指定された実世界の操作タスクにおいて、KAGIは自律的なRLのサンプル効率を改善し、20Kのオンライン微調整ステップでタスク完了を成功させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:40:38 GMT)
Complex-valued Federated Learning with Differential Privacy and MRI Applications [51.3] 複雑な値を持つガウスのメカニズムを導入し、その振る舞いは$f$-DP、$(varepsilon, delta)$-DP、R'enyi-DPで特徴づけられる。
本稿では,DPと互換性のある複雑なニューラルネットワークプリミティブを提案する。
実験では,実世界の課題に対して,DPを用いた複合数値ニューラルネットワークを訓練することで概念実証を行う。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:54:32 GMT)
Longhorn: State Space Models are Amortized Online Learners [51.1] ステートスペースモデル(SSM)は、トレーニング中に並列性を維持しながら線形デコード効率を提供する。
本研究では、オンライン学習のレンズを通してSSM設計を探求し、特定のオンライン学習問題のメタモジュールとしてSSMを概念化する。
我々は、オンライン連想的リコール問題を解決するためのクローズドフォームソリューションに類似した、新しいディープSSMアーキテクチャであるLonghornを紹介した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:32:59 GMT)
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models [50.5] 量子化対応トレーニング(QAT)は、低ビット表現によるメモリ消費を最小限の精度で削減することで、ソリューションを提供する。
より有効なQATアルゴリズムであるEfficient QAT(Efficient Quantization-Aware Training)を提案する。
効率的なQATは、全てのパラメータのブロックワイドトレーニング(Block-AP)と量子化パラメータのエンドツーエンドトレーニング(E2E-QP)の2つのフェーズを含む。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:44:30 GMT)
Loki: An Open-Source Tool for Fact Verification [49.5] Lokiは、誤情報の増加に対処するために設計されたオープンソースのツールだ。
長いテキストを個々のクレームに分割し、チェックの信頼性を評価し、クエリを生成し、エビデンスを取得し、クレームを検証する。
LokiはMITライセンスでリリースされており、GitHubから入手できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:52:41 GMT)
Opponent Shaping for Antibody Development [49.3] 抗ウイルス療法は通常、ウイルスの現在の株を標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、変異株の出現を促進するためにウイルス抗原に作用する。
ウイルス抗原と抗体の結合の計算モデルを構築した。
このようなウイルスの進化的脱出の遺伝的シミュレーションを実装した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:50:36 GMT)
Opponent Shaping for Antibody Development [49.3] 抗ウイルス療法は通常、ウイルスの現在の株を標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、変異株の出現を促進するためにウイルス抗原に作用する。
ウイルス抗原と抗体の結合の計算モデルを構築した。
このようなウイルスの進化的脱出の遺伝的シミュレーションを実装した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:50:36 GMT)
Opponent Shaping for Antibody Development [49.3] 抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
治療によって誘導される選択的圧力はウイルスに作用し、変異株の出現を誘導し、初期治療が効果を低下させる。
我々は、ウイルスの進化的脱出の遺伝的シミュレーションを実装するために、抗体とウイルス抗原の結合の計算モデルを構築した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:50:36 GMT)
Learning Physics From Video: Unsupervised Physical Parameter Estimation for Continuous Dynamical Systems [49.1] ビデオからの自動パラメータ推定の最先端は、大規模データセット上で教師付きディープネットワークをトレーニングすることによって解決される。
単一ビデオから, 既知, 連続制御方程式の物理パラメータを推定する手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:44:54 GMT)
A Watermark for Black-Box Language Models [48.7] LLMからシーケンスをサンプリングする機能のみを必要とする原則的な透かし方式を提案する。
性能保証を提供し、ホワイトボックスアクセスが利用可能である場合にどのように活用できるかを実証し、包括的実験によって既存のホワイトボックススキームよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:39:19 GMT)
Tuning Frequency Bias of State Space Models [48.6] 状態空間モデル(SSM)は、線形時間不変(LTI)システムを利用して、長距離依存のシーケンスを学習する。
その結果,SSMは低周波成分を高周波成分よりも効果的に捕捉する傾向を示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:04:22 GMT)
LaGeM: A Large Geometry Model for 3D Representation Learning and Diffusion [46.8] 本稿では3次元モデルを圧縮された潜在空間にマッピングする新しい階層型オートエンコーダを提案する。
このモデルは,高分解能な幾何学的詳細を忠実に表現しながら,広範囲な3次元モデルを表現するために使用できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:42:20 GMT)
Bayes' Power for Explaining In-Context Learning Generalizations [46.2] 本稿では、この時代のニューラルネットワークの振る舞いをより有用な解釈は、真の後部の近似であると論じる。
トレーニングデータから知識を効果的に構築することにより,モデルがコンテキスト内学習者に対して堅牢になることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:01:34 GMT)
Seeing Eye to AI: Human Alignment via Gaze-Based Response Rewards for Large Language Models [46.1] 暗黙のフィードバック(特に眼球追跡(ET)データ)をReward Model(RM)に統合する新しいフレームワークであるGazeRewardを紹介します。
提案手法は、確立された人間の嗜好データセット上でのRMの精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:24:56 GMT)
Inference-Time Alignment of Diffusion Models with Direct Noise Optimization [45.8] 拡散モデルのサンプリング過程において, 直接雑音最適化 (DNO) と呼ばれる新しいアライメント手法を提案する。
設計上、DNOは推論時に動作し、チューニングが不要で、即席で、アライメントは世代毎にオンラインに行われる。
我々は,いくつかの重要な報酬関数について広範な実験を行い,提案したDNOアプローチが,適切な時間予算で,最先端の報酬スコアを達成できることを実証した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 05:22:07 GMT)
Depth Pro: Sharp Monocular Metric Depth in Less Than a Second [45.7] ゼロショット距離単眼深度推定のための基礎モデルを提案する。
我々のモデルであるDepth Proは、非並列のシャープネスと高周波の詳細で高分解能深度マップを合成する。
標準GPUで0.3秒で2.25メガピクセルの深度マップを生成する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:42:20 GMT)
Newton Meets Marchenko-Pastur: Massively Parallel Second-Order Optimization with Hessian Sketching and Debiasing [45.5] 我々は,作業者間のコミュニケーションが制限されるような,凸関数を極めて並列に最小化する問題を考える。
本稿では、中央ノード(サーバ)がニュートン法を効果的に実行し、その高コストをオフロードする手法を提案する。
提案手法では, 適応的スケッチ手法を用いて, 作業者は独立に粗いが, 低バイアスで逆ヘッセン推定を行う。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:38:04 GMT)
FastCLIP: A Suite of Optimization Techniques to Accelerate CLIP Training with Limited Resources [45.4] 我々は、高度な合成最適化技術に基づいて構築された一般的なCLIPトレーニングフレームワークであるFastCLIPを紹介する。
我々のフレームワークは、通信オーバーヘッドを低減するための効率的な勾配低減戦略を備えている。
我々は、FastCLIPと最先端のトレーニングベースラインのパフォーマンスを、異なる計算スケールでベンチマークする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:34:06 GMT)
Effective Tuning Strategies for Generalist Robot Manipulation Policies [45.4] 汎用ロボット操作ポリシー(GMP)は、幅広いタスク、デバイス、環境にまたがって一般化する可能性がある。
ファインチューニングは、新しいドメインやタスクに限られたサンプルで迅速に適応する実用的な方法であるが、その結果のGMPの性能は、ファインチューニング戦略の設計選択に関して大きく異なる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:00:25 GMT)
A Spark of Vision-Language Intelligence: 2-Dimensional Autoregressive Transformer for Efficient Finegrained Image Generation [45.2] 本研究は,ベクトル量子化(VQ)自己回帰画像生成における情報損失ボトルネックに対処し,2次元自己回帰変換器(DnD)と呼ばれる新しいモデルアーキテクチャを導入する。
DnD-Transformerは、新しい自己回帰方向、テクトモデル深さとシーケンス長方向を導入することで、画像のより多くのコードを予測する。
リッチなテキストとグラフィカルな要素を自己監督的に生成し、これらの組み合わせのモダリティの理解を実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:10:05 GMT)
Visual Context Window Extension: A New Perspective for Long Video Understanding [45.1] 我々は、コンテキストウィンドウの観点から、長いビデオ理解の課題に取り組む。
視覚的コンテキストウィンドウを拡張し,LMMを長時間の映像理解タスクに適用することを提案する。
ビデオフレーム数の増加に伴い,本手法は連続的に性能を向上する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:34:11 GMT)
HelpSteer2-Preference: Complementing Ratings with Preferences [45.0] リワードモデルは、指示に従うためにモデルを整列させるのに不可欠である。
データに適切にマッチする場合、どちらのアプローチも他方よりも優れているという証拠が不足している。
そこで我々はBradley-huggingとRegression reward Modelingを組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:05:52 GMT)
Unified space-time description of pulsed twin beams [45.0] ここでのモデルは、非線形結晶中の量子場の3D+1伝播方程式から導かれる。
これは過去20年間に行われた異なる実験的な観察の統一的な記述を可能にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:05:21 GMT)
Towards Model Discovery Using Domain Decomposition and PINNs [45.0] 物理インフォームドニューラルネットワーク(PINN)と有限基底物理インフォームドニューラルネットワーク(FBPINN)の2つの手法の性能評価を行った。
バニラPINN法と比較して,準定常時間領域のみのデータがほとんどない場合であっても,FBPINN法の方が優れた性能を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:38:37 GMT)
TypedThinker: Typed Thinking Improves Large Language Model Reasoning [44.9] 大規模言語モデルの問題解決能力を高めるフレームワークであるTypedThinkerを提案する。
TypedThinkerは、与えられた問題に対して適切な推論型を選択し、特定の推論型を効果的に実装する、という2つの主要な課題に対処する。
実験の結果、Mistral 7Bは3.4%、LLaMA3 8Bは16.7%の精度でベースラインモデルよりも大幅に改善された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:54:45 GMT)
Backdooring Vision-Language Models with Out-Of-Distribution Data [44.4] 視覚言語モデル(VLM)は視覚入力から詳細なテキスト記述を生成する。
重要性は増しているが、特にバックドア攻撃に対するVLMの安全性は検討中である。
VLOOD(Backdooring Vision-Language Models with Out-of-Distribution Data)は、2つの重要なコントリビューションを持つ新しいアプローチである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:21:00 GMT)
Learning To Solve Differential Equation Constrained Optimization Problems [44.3] 本稿では、プロキシ最適化とニューラル微分方程式の手法を組み合わせたDECの学習に基づく最適化手法を提案する。
結果は、システムの動的方程式を明示的にモデル化しない他の方法の25倍の精度で生成される。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:42:16 GMT)
SegEarth-OV: Towards Traning-Free Open-Vocabulary Segmentation for Remote Sensing Images [44.3] リモートセンシングコンテキストにセマンティックセグメンテーションを導入しようと試みる。
低解像度の特徴に対するリモートセンシング画像の感度のため、予測マスクには歪んだターゲット形状と不適合境界が示される。
トレーニング不要なスタイルで深部特徴の空間情報を復元する,シンプルで汎用的なアップサンプラーSimFeatUpを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:25:31 GMT)
OneGen: Efficient One-Pass Unified Generation and Retrieval for LLMs [44.1] ワンパス生成・検索フレームワーク(OneGen)
OneGenは、自動回帰的に生成された検索トークンを組み込むことで、生成と検索のための従来の別々のトレーニングアプローチを橋渡しする。
その結果,LLMの生成能力を維持しつつ,検索性能の向上を図っている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:02:02 GMT)
Pre-training Cross-lingual Open Domain Question Answering with Large-scale Synthetic Supervision [44.0] 言語間のオープンドメイン質問応答は複雑な問題である。
CLQAは単一エンコーダデコーダモデルを用いて処理可能であることを示す。
ウィキペディア内の言語間リンク構造を利用した自己教師型手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 07:51:47 GMT)
Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization [44.0] 時間的行動ローカライゼーション(OV-TAL)のためのラベルなしYouTubeビデオによる自己学習のスケーラビリティについて検討する。
提案手法は,(1)分類に依存しない行動ローカライザを人間のラベル付きtalデータセット上でトレーニングし,未ラベル付きビデオの擬似ラベルを生成し,(2)大規模擬似ラベル付きデータセットを用いてローカライザのトレーニングを行う。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:37:58 GMT)
Unveiling the Invisible: Captioning Videos with Metaphors [43.5] 本稿では,VL(Vision-Language)タスクについて紹介する。
この作業を容易にするために,705の動画と2115の人書きキャプションでデータセットを構築し,リリースする。
また,提案課題における SoTA ビデオ言語モデルに匹敵する性能を持つ低リソースなビデオメタファキャプションシステム GIT-LLaVA を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:40:10 GMT)
Instruction Tuning With Loss Over Instructions [42.9] インストラクション・モデリング(IM)は、出力部のみではなく、インストラクションとプロンプト部に損失関数を適用してLMを訓練する。
多くのシナリオにおいて、IMはNLPタスクとオープン・エンド・ジェネレーション・ベンチマークの両方でのLM性能を効果的に改善できることを示す。
注目すべきは、最も有利な場合、IMはAlpacaEval 1.0のモデルパフォーマンスを100%以上向上させることだ。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:36:11 GMT)
The Labyrinth of Links: Navigating the Associative Maze of Multi-modal LLMs [42.7] MLLM(Multi-modal Large Language Models)は印象的な能力を示す。
MLLMの欠陥の多くは、人間の知性(例えば$textite.g.$)と比較して見出されている。
観察と事前の実践記憶をリンクする人間の基本的な能力であるtextbfassociation$。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:58:54 GMT)
PHI-S: Distribution Balancing for Label-Free Multi-Teacher Distillation [42.4] 本研究は,教師のアクティベーション統計の影響を調査し,その基盤を築き上げている。
統計正規化手法の標準ツールキットを探索し,各分布の整合性を向上する。
実験により,研究対象の手法にまたがって,最高の学生モデルを生成することを実証的に実証した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:50:35 GMT)
Generative Reward Models [42.3] RLHF(Reinforcement Learning from Human Feedback)は、現代の大規模言語モデル(LLM)の性能を大幅に改善した。
近年の研究では、合成選好ラベルは人間の選好判断とうまく一致していないことが示されている。
本稿では RLHF と RLAIF の方法論を統一するハイブリッド手法を提案する。
以上の結果から,RLHFとRLAIFの強度を組み合わせることで,合成選好ラベルの品質向上が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:58:39 GMT)
On The Adaptation of Unlimiformer for Decoder-Only Transformers [42.0] GPT-4とClaude 2は、それぞれ8k/32kと100kの長いコンテキスト長を導入した。
LLama-2のような一般的なモデルはコンテキスト長が4k以下である。
Unlimiformerは、クロスアテンション計算をkNNインデックスにオフロードする一般的なベクトル検索拡張手法である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:08:12 GMT)
Saliency-Guided DETR for Moment Retrieval and Highlight Detection [41.9] 既存のビデオモーメント検索とハイライト検出のアプローチでは、テキストとビデオの機能を効率的に調整することはできない。
このようなアライメントのために設計された最近の基礎的ビデオモデルを利用する新しいアーキテクチャを提案する。
さらに改良するために,大規模かつ高品質なプレトレーニングデータセットであるInterVid-MRを開発した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:53:45 GMT)
Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference [41.9] 大規模言語モデル(LLM)は様々なタスクで顕著な成功を収めた。
推論プロセスは、デコードの各ステップにおける単一トーケン生成により、相当な時間とエネルギー要求によって妨げられる。
MTJD を高速化する新しいフレームワークである Multi-token Assisted Decoding (MTAD) を導入する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:14:09 GMT)
Gold Panning in Vocabulary: An Adaptive Method for Vocabulary Expansion of Domain-Specific LLMs [41.3] 本稿では,あるドメイン語彙から価値ある単語を自動的に識別する適応的手法であるVEGADを紹介する。
拡張のための最適なサブセットの選択は、ドメイン固有のタスクと一般的なタスクの両方のパフォーマンスを向上させることが示されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:47:39 GMT)
Just ASR + LLM? A Study on Speech Large Language Models' Ability to Identify and Understand Speaker in Spoken Dialogue [41.1] SpeechLLMは、ガオカオのようなベンチマークで印象的な音声対話質問応答(SQA)性能を示した。
本研究では,音声からの話者認識に制限があり,音声のない会話の書き起こしからLLMに類似した振る舞いを示す。
我々は,SQAにおけるSpeechLLMのより正確な評価フレームワークとして,アイデンティティクリティカルな質問に焦点をあてたタスクを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:58:56 GMT)
Just ASR + LLM? A Study on Speech Large Language Models' Ability to Identify and Understand Speaker in Spoken Dialogue [41.1] SpeechLLMは、ガオカオのようなベンチマークで印象的な音声対話質問応答(SQA)性能を示した。
本研究では,音声からの話者認識に制限があり,音声のない会話の書き起こしからLLMに類似した振る舞いを示す。
我々は,SQAにおけるSpeechLLMのより正確な評価フレームワークとして,アイデンティティクリティカルな質問に焦点をあてたタスクを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:58:56 GMT)
Comparing and Contrasting Deep Learning Weather Prediction Backbones on Navier-Stokes and Atmospheric Dynamics [41.0] 私たちは、最も顕著なディープラーニング天気予報モデルと背骨を比較し、対比します。
合成2次元非圧縮性ナビエストークスと実世界の気象動態を予測してこれを達成した。
365日間の長距離気象観測では、球面データ表現を定式化するアーキテクチャにおいて、優れた安定性と物理的健全性を観察する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:42:29 GMT)
Transferability Bound Theory: Exploring Relationship between Adversarial Transferability and Flatness [40.9] 一般的な信念は、対向例の平坦度が高ければ高いほど、モデル間移動性が向上するということである。
そこで本研究では, クラフト逆数例に対する導出のサロゲートを最適化する, 理論的に予測可能な攻撃であるTPAを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:50:05 GMT)
On Using Certified Training towards Empirical Robustness [40.6] 認定されたトレーニングアルゴリズムは、単一ステップ攻撃における壊滅的な過度なオーバーフィッティングを防ぐことができる。
また,ネットワークオーバー近似のための新たな正規化器を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:56:21 GMT)
More Than Catastrophic Forgetting: Integrating General Capabilities For Domain-Specific LLMs [40.5] 大言語モデル(LLM)がドメイン固有のタスクに微調整された後に、一般的なタスクのパフォーマンスが低下する。
本稿では,一般能力統合(GCI)と呼ばれる,CFを越えたドメイン固有LLMの実適用に向けた課題について述べる。
GCIの目的は、新たに獲得した汎用能力を、新しいドメイン知識と共に保持するだけでなく、両方のスキルセットを結合的に調和して利用して、ドメイン固有のタスクのパフォーマンスを高めることである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 02:31:04 GMT)
Learning Explainable and Better Performing Representations of POMDP Strategies [40.3] L*-アルゴリズムの修正を用いて戦略のオートマトン表現を学習する手法を提案する。
POMDPから直接オートマトンを合成するアプローチとは対照的に、我々のアプローチは比較にならないほどスケーラブルである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:12:31 GMT)
Boosting Weakly-Supervised Referring Image Segmentation via Progressive Comprehension [40.2] 本稿では、画像とテキストのペアから直接ターゲットのローカライゼーションを学習する、困難な設定に焦点を当てる。
そこで本研究では,対象対象対象の局所化にターゲット関連テキストキューを活用する新しいプログレッシブネットワーク(PCNet)を提案する。
本手法は3つのベンチマークでSOTA法より優れている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:30:32 GMT)
Suri: Multi-constraint Instruction Following for Long-form Text Generation [40.2] 長文生成のためのマルチ制約命令について検討する。
Suri は LLM 生成した逆転写命令と組み合わせて,20K 個の人書き長文からなるデータセットである。
我々は,SFTモデルとI-ORPOモデルの両方がほとんどの制約を満たす一方で,Suri-I-ORPO世代は制約の一貫性と情報化に好適であることを示した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 01:01:57 GMT)
ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [39.6] ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。
様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。
我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:56:38 GMT)
One-shot Active Learning Based on Lewis Weight Sampling for Multiple Deep Models [39.6] 複数のターゲットモデルに対するアクティブラーニング(AL)は、ラベル付きデータクエリの削減と、複数のモデルを並列に効果的にトレーニングすることを目的としている。
既存のALアルゴリズムは、しばしば計算コストのかかる反復的なモデルトレーニングに依存している。
本稿では,この課題に対処する一発AL手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:28:42 GMT)
Mining Your Own Secrets: Diffusion Classifier Scores for Continual Personalization of Text-to-Image Diffusion Models [39.5] 現実の世界では、ユーザーは複数の概念のモデルを一度に1つずつパーソナライズしたいと考えるかもしれない。
ほとんどのパーソナライズ手法は、新しい概念の獲得と以前の概念の維持のバランスを見つけることができない。
本稿では,テキスト・画像拡散モデルのパラメータ空間と関数空間の正規化を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:13:56 GMT)
Efficient Long-range Language Modeling with Self-supervised Causal Retrieval [39.2] Grouped Cross-Attentionは、レトリバーと因果LMの協調事前トレーニングを可能にする新しいモジュールである。
トップ$kの検索を統合することで、コンテキスト長を最大64Kのトークンでスクラッチから効率的に事前トレーニングすることが可能になります。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:18:34 GMT)
AutoPal: Autonomous Adaptation to Users for Personal AI Companisonship [39.0] 本稿では、パーソナルAIコンパニオンにおける自律的適応の必要性を強調する。
エージェントのペルソナを制御可能かつ真正に調整できる階層型フレームワークであるAutoPalを考案する。
実験はAutoPalの有効性を示し、AIコンパニオンにおける自律的適応性の重要性を強調している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:59:40 GMT)
A Little Goes a Long Way: Efficient Long Context Training and Inference with Partial Contexts [38.9] LongGenは、事前訓練されたLLMを、長さ拡張中に効率的なアーキテクチャに微調整する。
LongGenはトレーニングのスピードアップを1.55倍にし、フルアテンションベースラインに比べてウォールタイム時間を36%短縮する。
推論中、LongGenはKVキャッシュメモリを62%削減し、1.67倍のプリフィルスピードアップと1.41倍のデコードスピードアップを達成した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:35:53 GMT)
Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning [37.5] 大規模言語モデル(LLM)を用いたパイプラインベースのデータ拡張手法を提案する。
データ多様性の低い問題に対処するため、私たちのパイプラインは知識グラフ(KG)を使用してエンティティや量を取り出す。
高いデータノイズに対処するため、GCSEモデルは偽硬陰性サンプルの影響を制限するためにガウス分解関数を使用する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:24:50 GMT)
Computing Ex Ante Equilibrium in Heterogeneous Zero-Sum Team Games [37.5] 政策空間対応Oracleフレームワークにシーケンシャルな相関機構を組み込んだ異種チームゲームのための新しいフレームワークを提案する。
我々は,ヘテロジニアスなチームゲームにおいて,H-PSROがチームPSROよりも低いエクスプロイザビリティを実現することを証明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:12:00 GMT)
Uncertainty-Guided Enhancement on Driving Perception System via Foundation Models [37.4] 本研究では、基礎モデルを利用して既存の駆動知覚モデルから予測を洗練させる手法を開発した。
本手法では,予測精度が10~15%向上し,基礎モデルのクエリ数を50%削減する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:46:19 GMT)
A Federated Learning Platform as a Service for Advancing Stroke Management in European Clinical Centers [37.3] 本稿では,FLプロセスの構成,監視,管理を支援するための新しいFLプラットフォームを提案する。
臨床環境に固有の生産感度を考慮し,提案するFLアーキテクチャの安全性を強調した。
このプラットフォームは、公開データセットを使用して、さまざまな運用環境でのテストに成功している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:24:05 GMT)
Long-range gene expression prediction with token alignment of large language model [37.1] 本稿では,遺伝子配列の特徴を自然言語トークンと整合させる遺伝子配列Token Alignment(GTA)を提案する。
GTAは規制文法を学習し、遺伝子特異的な人間のアノテーションをプロンプトとして組み込むことができる。
GTAは、事前訓練された言語モデルを利用して、遺伝子発現予測に対する強力で斬新なクロスモーダルなアプローチを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:42:29 GMT)
SciSafeEval: A Comprehensive Benchmark for Safety Alignment of Large Language Models in Scientific Tasks [37.0] 大規模言語モデル(LLM)は、生物学、化学、医学、物理学など、様々な分野の科学的なタスクに変化をもたらした。
既存のベンチマークは主にテキストの内容に焦点を当て、分子、タンパク質、ゲノム言語などの重要な科学的表現を見渡す。
SciSafeEvalは, LLMの安全アライメントを, 様々な科学的タスクで評価するためのベンチマークである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:34:48 GMT)
Transformers are Minimax Optimal Nonparametric In-Context Learners [36.3] 大規模言語モデルのコンテキスト内学習は、いくつかの実証的な例から新しいタスクを学ぶのに驚くほど効果的な方法であることが証明されている。
我々は,ディープニューラルネットワークと1つの線形アテンション層からなる変圧器の近似および一般化誤差境界を開発する。
十分に訓練されたトランスフォーマーは、文脈における最小推定リスクを達成し、改善できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:58:37 GMT)
Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models [36.1] 本稿では,影響関数と外乱勾配検出による有害トレーニングサンプルの同定とを橋渡しする。
まず, 合成データセットにおける外乱勾配解析手法の仮説を検証した。
次に、視覚モデルにおける誤ラベルサンプルの検出と、自然言語処理トランスフォーマーモデルの性能向上のためのデータサンプル選択の有効性を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 01:38:15 GMT)
Upcycling Instruction Tuning from Dense to Mixture-of-Experts via Parameter Merging [36.0] Upcycling Instruction Tuning (UpIT) は、密度の高い事前学習されたモデルをMoE命令モデルにチューニングするためのデータ効率のよいアプローチである。
MoEモデルの各専門家が期待通りに機能するように、我々は、ルータを事前最適化するために、各専門家が抽出する少数のシードデータを選択する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:48:22 GMT)
DeFine: Enhancing LLM Decision-Making with Factor Profiles and Analogical Reasoning [36.0] 複雑なシナリオから確率的因子プロファイルを構築する新しいフレームワークであるDeFineを紹介する。
DeFineは、これらのプロファイルを類似の推論と統合し、同様の過去の経験からの洞察を活用する。
このアプローチは医療相談、交渉、政治討論などの分野で特に有用である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:29:34 GMT)
RLEF: Grounding Code LLMs in Execution Feedback with Reinforcement Learning [35.4] エージェントとしてデプロイされる大規模言語モデル(LLM)は、必要な手動のエンゲージメントを最小限に抑えながら、複数のステップでユーザ指定タスクを解決する。
コード合成の領域における実行フィードバックを活用するためのモデル学習のためのエンドツーエンド強化学習手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:25:17 GMT)
Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning [35.4] マルチモーダルタスク仕様はロボットの性能向上に不可欠である。
実データに豊富な一元的命令を活用することで,ロボットにマルチモーダルタスク仕様の学習を効果的に教えることができることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:23:02 GMT)
AgriCLIP: Adapting CLIP for Agriculture and Livestock via Domain-Specialized Cross-Model Alignment [35.4] AgriCLIPは、農業と家畜の分野に特化したビジョン言語基盤モデルである。
私たちのALiveデータセットは、作物、家畜、漁業をカバーしています。
AgriCLIPフレームワークは、平均ゼロショット分類精度で7.8%の絶対ゲインを達成する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:33:49 GMT)
Training-Free Message Passing for Learning on Hypergraphs [35.4] ハイパーグラフニューラルネットワーク(HNN)は、メッセージパッシングによってハイパーグラフ構造を効果的に利用し、ノードの特徴を生成する。
モデル学習段階からハイパーグラフ構造情報の利用を分離する手法を提案する。
これにより、TF-MP-Moduleと呼ばれる新しいトレーニング不要のメッセージパッシングモジュールが作成され、データ前処理の段階でプリ計算される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:57:32 GMT)
Speculative Coreset Selection for Task-Specific Fine-tuning [35.2] タスク固有の微調整は、大規模言語モデル(LLM)の展開に不可欠である
本稿では,投機的コアセット選択法であるSTAFFを紹介する。
STAFFは,SOTA法の性能を最大54.3%向上し,選択オーバーヘッドを70.5%低減することを示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:42:25 GMT)
Knowledge-Driven Feature Selection and Engineering for Genotype Data with Large Language Models [35.1] FREEFORM, Free-flow Reasoning, Ensembling for Enhanced Feature Output and Robust Modeling。
https://github.com/PennShenLab/FREEFORM.com/FreeFORMはGitHubのオープンソースフレームワークとして利用可能だ。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:53:08 GMT)
FactAlign: Long-form Factuality Alignment of Large Language Models [35.1] 大規模言語モデルは次世代の情報アクセスエンジンとして大きな可能性を示している。
本稿では,FactAlignを提案する。FactAlignは,長文応答の現実性を高めるために設計された,新しいアライメントフレームワークである。
オープンドメインのプロンプトと情報検索に関する実験により、FactAlignはLLM応答の事実精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:03:13 GMT)
Knowledge Entropy Decay during Language Model Pretraining Hinders New Knowledge Acquisition [34.9] 本研究では,モデルがパラメトリック知識を広く統合する傾向が,事前学習を通じてどのように進化するかを検討する。
モデルが関与するメモリ源の範囲を定量化する知識エントロピーの概念を導入する。
知識のエントロピーの低下は、モデルの知識獲得と保持能力を損なうことがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:49:45 GMT)
BordIRlines: A Dataset for Evaluating Cross-lingual Retrieval-Augmented Generation [34.7] 本稿では,言語間RAGの課題について検討し,既存のシステムの堅牢性を検討するためのデータセットを提案する。
以上の結果から,既存のRAGシステムは多言語で競合する情報を提供する場合の整合性の欠如に悩まされ続けていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:59:07 GMT)
Transformers Handle Endogeneity in In-Context Linear Regression [34.5] インストゥルメンタル変数(IV)を用いて内在性を効果的に扱うメカニズムをトランスフォーマーが本質的に持っていることを示す。
提案手法では,事前学習損失の最小化が最小限の余剰損失を達成できることを示す理論的保証を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:21:04 GMT)
Motion meets Attention: Video Motion Prompts [34.4] フレーム差分マップからの動き信号を変調するアテンション機構として,学習可能な傾きとシフトパラメータを持つ修正シグモイド関数を提案する。
このアプローチは、モーション関連ビデオコンテンツの処理を強化するアテンションマップのシーケンスを生成する。
SlowGymやX3D、Timeformerといったモデルに、当社の軽量でプラグアンドプレイのモーションプロンプト層がシームレスに統合されていることが分かりました。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:32:56 GMT)
Exploring Multilingual Concepts of Human Value in Large Language Models: Is Value Alignment Consistent, Transferable and Controllable across Languages? [34.4] 本稿では,AIの安全性の重要性から,人間の価値観に関する概念(すなわち,価値の概念)に焦点を当てる。
我々はまず,LLMにおける価値概念の存在を多言語形式で実証的に確認した。
これらの概念の言語間特性に関するさらなる分析は、言語資源の相違から生じる3つの特徴を明らかにしている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:34:25 GMT)
A Real Benchmark Swell Noise Dataset for Performing Seismic Data Denoising via Deep Learning [34.2] 本稿では, 実データ上に実装されたフィルタリングプロセスから抽出したノイズにより, 合成地震データからなるベンチマークデータセットを提案する。
地震探査のための新しいソリューションの開発を加速するためのベンチマークとして提案されている。
その結果, DLモデルは地震探査に有効であることがわかったが, 未解決の問題も残されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:06:18 GMT)
Detect Everything with Few Examples [33.7] 少数のサンプル画像のみに与えられる新しいカテゴリを検出することを目的としている。
近年の手法は、より広範な適用を禁じる複雑な手順による微調整戦略に重点を置いている。
我々は、微調整を必要とせず、数発の物体検出器であるDE-ViTを導入する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:26:18 GMT)
Latent Diffusion Models for Controllable RNA Sequence Generation [33.4] RNAはDNAとタンパク質の間の重要な中間体であり、高い配列の多様性と複雑な3次元構造を示す。
可変長の離散RNA配列の生成と最適化のための潜時拡散モデルを開発した。
実験の結果、RNA拡散は様々な生物学的指標の自然な分布と一致した非コードRNAを生成することが確認された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:42:46 GMT)
WatChat: Explaining perplexing programs by debugging mental models [33.2] 私たちは、JavaScriptの型強制とGitのバージョン管理システムの2つのドメインで説明のためのシステムを構築します。
We show that WatChat's explanations exhibit key features of human-written explanation, different of a state-of-the-art language model。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:05:24 GMT)
Learning Fair Models without Sensitive Attributes: A Generative Approach [33.2] 本研究では,関係する特徴を探索することにより,重要属性を含まないフェアモデル学習の新たな課題について検討する。
トレーニングデータから感度特性を効果的に推定する確率的生成フレームワークを提案する。
実世界のデータセットを用いた実験結果から,本フレームワークの有効性が示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:15:09 GMT)
"No Matter What You Do!": Mitigating Backdoor Attacks in Graph Neural Networks [33.1] GNNのバックドア攻撃は、攻撃者がトリガーを埋め込むことでグラフデータの一部を修正したという事実にある。
GNNにおける最初のバックドア緩和手法であるGCleanerを提案する。
GCleanerは、クリーンデータのわずか1%でバックドア攻撃の成功率を10%に下げることができ、ほぼ無視できるモデル性能の低下がある。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:30:49 GMT)
Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts [33.0] キーフレーズ生成モデルを新しいドメインに適応させるには、通常、ドメイン内のラベル付きデータによる微調整をほとんど必要としない。
そこで本論文では,銀標準キーフレーズを引用文脈から抽出し,ドメイン適応のための合成ラベル付きデータを生成することにより,この問題に対処するための教師なし手法である絹について述べる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:11:59 GMT)
Unsupervised Domain Adaptation for Keyphrase Generation using Citation Contexts [33.0] キーフレーズ生成モデルを新しいドメインに適応させるには、通常、ドメイン内のラベル付きデータによる微調整をほとんど必要としない。
そこで本論文では,銀標準キーフレーズを引用文脈から抽出し,ドメイン適応のための合成ラベル付きデータを生成することにより,この問題に対処するための教師なし手法である絹について述べる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:11:59 GMT)
Scaling Manipulation Learning with Visual Kinematic Chain Prediction [33.0] 本研究では,多様な環境下でのロボット学習における準静的動作の高精度かつ普遍的な表現として,視覚キネマティクス連鎖を提案する。
我々は,Calvin,RLBench,Open-X,および実際のロボット操作タスクにおいて,BC変換器に対するVKTの優れた性能を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:43:07 GMT)
DataSculpt: Crafting Data Landscapes for Long-Context LLMs through Multi-Objective Partitioning [32.9] 長期的なパフォーマンスを改善する鍵は、効果的なデータ組織と管理戦略にある。
長文学習用に設計された新しいデータ管理フレームワークであるDataSculptを紹介する。
評価の結果,DataSculptは長期学習性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:18:55 GMT)
Conditional Diffusion on Web-Scale Image Pairs leads to Diverse Image Variations [32.9] 現在の画像変化技術では、同じ画像に条件付けされた入力画像の再構成にテキスト・ツー・イメージ・モデルを適用する。
凍結した埋め込み画像から入力画像の再構成を訓練した拡散モデルにより,小さなバリエーションで画像の再構成が可能であることを示す。
本稿では,画像ペアの集合を用いて画像の変動を生成するための事前学習手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:34:09 GMT)
MeanSparse: Post-Training Robustness Enhancement Through Mean-Centered Feature Sparsification [32.7] MeanSparseは、敵の例に対する畳み込みと注意に基づくニューラルネットワークの堅牢性を改善する方法である。
実験の結果,MeanSparseは75.28%の新しいロバストネス記録を達成した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:01:07 GMT)
Empirical Guidelines for Deploying LLMs onto Resource-constrained Edge Devices [32.6] 資源制約のある計算環境がパーソナライズされたLLMの設計選択にどのように影響するかを検討する。
いくつかの重要な設計要因のトレードオフと、学習効率と正確性に対するそれらの相互干渉の影響を考察する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 04:14:21 GMT)
A Novel Framework of Horizontal-Vertical Hybrid Federated Learning for EdgeIoT [32.6] このレターでは、モバイルエッジコンピューティング対応モノのインターネット(Edge IoT)のためのハイブリッド水平-垂直連合学習(HoVeFL)が紹介されている。
特定のEdgeIoTデバイスは、同じデータサンプルを使用してローカルモデルをトレーニングするが、異なるデータ機能を分析する。
提案したHoVeFLは、グローバル損失関数を最小限に抑えるために、局所モデルとグローバルモデルのトレーニングを定式化している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:13:26 GMT)
ArtVLM: Attribute Recognition Through Vision-Based Prefix Language Modeling [32.6] 属性認識のための文生成に基づく検索定式化を提案する。
画像上で認識される各属性に対して、短い文を生成する視覚条件付き確率を測定する。
生成的検索が2つの視覚的推論データセットのコントラスト的検索を一貫して上回ることを示す実験を通して実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:48:44 GMT)
ArtVLM: Attribute Recognition Through Vision-Based Prefix Language Modeling [32.6] 属性認識のための文生成に基づく検索定式化を提案する。
画像上で認識される各属性に対して、短い文を生成する視覚条件付き確率を測定する。
生成的検索が2つの視覚的推論データセットのコントラスト的検索を一貫して上回ることを示す実験を通して実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:48:44 GMT)
Getting Free Bits Back from Rotational Symmetries in LLMs [32.3] 回転対称トランスフォーマー重みを記憶するためのビットバック符号化方式を提案する。
SliceGPTによるLarge Language Models (LLM) の評価を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:03:47 GMT)
Foldable SuperNets: Scalable Merging of Transformers with Different Initializations and Tasks [32.0] Foldable SuperNet Merge (FS-Merge) は単純でデータ効率が良く、様々な幅のモデルをマージできる。
FS-Mergeは既存のメソッドを一貫して上回り、特に限られたデータシナリオにおいてSOTA結果を達成する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:34:32 GMT)
DITTO: Demonstration Imitation by Trajectory Transformation [31.9] そこで本研究では,RGB-Dビデオ録画による実演映像のワンショット模倣の問題に対処する。
本稿では,2段階のプロセスを提案する。第1段階では実演軌道をオフラインに抽出し,操作対象のセグメンテーションと,容器などの二次物体に対する相対運動を決定する。
オンライン軌道生成段階では、まず全ての物体を再検出し、次にデモ軌道を現在のシーンにワープし、ロボット上で実行します。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:41:50 GMT)
Posterior sampling via Langevin dynamics based on generative priors [31.8] 生成モデルを用いた高次元空間における後方サンプリングは、様々な応用に有望である。
既存の手法では、新しいサンプルごとに生成プロセス全体を再起動する必要があるため、計算コストがかかる。
事前学習した生成モデルの雑音空間におけるランゲヴィンダイナミクスをシミュレーションし,効率的な後部サンプリングを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:57:47 GMT)
Unveiling Language Skills under Circuits [31.6] メモリ回路は、言語モデルのメモリ読み取り機能を完全かつ独立に操作する最小単位である。
我々は,3つの重要な言語スキルに責任を負う,スキルパスと命名された有能な回路パスを同定する。
各種データセットに対する実験により,認識されたスキルパスと言語スキルの対応性を確認した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:52:58 GMT)
Evidence-based Match-status-Aware Gait Recognition for Out-of-Gallery Gait Identification [31.3] Evidence-based Match-status-Aware Gait Recognition frameworkを提案する。
Evidential Deep Learning (EDL)にインスパイアされたEMA-GRは、認識の一致状況に関連する不確実性を定量化するように設計されている。
我々の手法は既存の最先端手法をかなり上回ります。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:54:14 GMT)
LIONs: An Empirically Optimized Approach to Align Language Models [31.2] 教師付き微調整,オフライン選好学習,オンライン選好学習からなる3段階学習パイプライン上で厳密な分析を行う。
我々は、シーケンスパッキング、SFTにおける損失マスキング、DPOにおける嗜好データセットサイズの増加、オンラインDPOトレーニングなどの手法を用いることで、言語モデルの性能が大幅に向上することを発見した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:47:13 GMT)
PhyMPGN: Physics-encoded Message Passing Graph Network for spatiotemporal PDE systems [31.0] 我々は物理符号化されたメッセージパッシンググラフネットワーク(PhyMPGN)という新しいグラフ学習手法を提案する。
我々は,GNNを数値積分器に組み込んで,与えられたPDEシステムに対する時間的時間的ダイナミクスの時間的行進を近似する。
PhyMPGNは、粗い非構造メッシュ上での様々なタイプの時間的ダイナミクスを正確に予測することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:54:18 GMT)
Locret: Enhancing Eviction in Long-Context LLM Inference with Trained Retaining Heads [30.7] Locretは、単一のNvidia 4090 GPU上でのLLM推論のためのフレームワークである。
推論中、チャンクされたプリフィルパターンとともに低重要キャッシュユニットを排除し、GPUのピークメモリ使用量を大幅に削減した。
我々の知る限り、Locretは単一のNvidia 4090 GPU上にLlama-3.1-8Bまたは同様のモデルをデプロイできる最初のフレームワークである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:59:52 GMT)
Segment as You Wish -- Free-Form Language-Based Segmentation for Medical Images [30.7] フリーフォームなテキストプロンプトを処理する新しい医用画像セグメンテーションモデルであるFLanSを紹介する。
FLanSは、7つの公開データセットから100万以上の医療画像の大規模なデータセットでトレーニングされている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:34:32 GMT)
Open-Set Graph Anomaly Detection via Normal Structure Regularisation [30.6] Open-set Graph Anomaly Detection (GAD)は、少数の正規ノードと異常ノードを使用して検出モデルをトレーニングすることを目的としている。
現在の監督型GAD法は、目に見えない異常を正常なノードとして検出する多くの誤りを招き、その異常を過度に強調する傾向にある。
本稿では,新しいオープンセットGAD手法,すなわち正規構造正規化(NSReg)を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:15:25 GMT)
Large Language Model Confidence Estimation via Black-Box Access [30.5] そこで我々は,新しい特徴を設計し,信頼度を推定するために(解釈可能な)モデルを訓練する,シンプルなフレームワークを提案する。
我々は,Flan-ul2,-13b, Mistral-7bの4つのベンチマークQ&Aタスクに対する信頼度を推定する上で,我々のフレームワークが有効であることを示す。
私たちの解釈可能なアプローチは、信頼の予測可能な機能に関する洞察を与え、興味深く有用な発見につながります。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:49:18 GMT)
SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging [30.3] あらゆる方言に対して高品質な合成学習データを生成するためのフレームワークを提案する。
本稿では,方言間の共有知識を活用する新しいMixture-of-Experts(MoE)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:19:15 GMT)
CryoSPIN: Improving Ab-Initio Cryo-EM Reconstruction with Semi-Amortized Pose Inference [30.2] Cryo-EMは、高分子錯体の原子分解能3次元構造を決定する方法として人気が高まっている。
近年のCryo-EMの進歩は、アモートされた推論がポーズを予測するために使われている深層学習に焦点が当てられている。
本稿では,半アモタイズ法であるCryoSPINを提案する。この手法では,復元はアモタイズされた推論から始まり,自動デコードに切り替える。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:20:59 GMT)
Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models [29.9] 本稿では,文書レベルのインコンテクスト・イン・ショット関係抽出のための新しいフレームワークを提案する。
ドキュメントレベルの関係抽出用データセットとして最大であるDocREDを用いて,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:35:45 GMT)
Frozen Large Language Models Can Perceive Paralinguistic Aspects of Speech [29.8] 大きな言語モデル(LLM)は、ユーザーの感情や会話スタイルを考慮に入れられる。
本研究では,音声エンコーダを用いたエンドツーエンドシステムを提案する。
このトレーニングフレームワークにより,音声中の意味的情報とパラ言語的情報の両方をキャプチャするトークンをエンコーダが生成できることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:32:47 GMT)
FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation [29.6] 微調整は「微調整による誤校正」により、まだ満足のいく信頼性には程遠い
本稿では,教師の知識のごく一部を有効活用して,信頼性の高い言語モデルを低コストで得るための信頼に値する蒸留(FIRST)を提案する。
実験の結果, 精度が2.3%, 誤校正率が10%以下となる手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:34:51 GMT)
Stochastic Online Conformal Prediction with Semi-Bandit Feedback [29.3] 実例が時間とともに現れるオンライン学習環境について検討し、その目標は予測セットを動的に構築することである。
本稿では,この設定を対象とする新しい共形予測アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:46:53 GMT)
Tool-Planner: Task Planning with Clusters across Multiple Tools [29.3] ツールキットに基づくタスク処理フレームワークであるTool-Plannerを提案する。
Tool-Plannerは、同じ関数を持つAPI関数に基づいたツールをツールキットにグループ化し、LLMがさまざまなツールキットで計画を実装することを可能にする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:00:39 GMT)
Don't flatten, tokenize! Unlocking the key to SoftMoE's efficacy in deep RL [29.0] SoftMoEsは最近、オンライン強化学習の問題を緩和する約束を見せている。
我々は、複数の専門家ではなく、エンコーダ出力のトークン化が、SoftMoEsの有効性の裏にあることを発見した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:22:45 GMT)
Auction-Based Regulation for Artificial Intelligence [28.9] 本稿では,AIの安全性を規制するオークションベースの規制機構を提案する。
我々は、各参加エージェントの最善の戦略は、所定の最小限の安全閾値よりも安全なモデルを送ることであることを確実に保証する。
その結果,我々の規制オークションは,安全率と参加率を20%,参加率を15%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:57:02 GMT)
Learning and teaching biological data science in the Bioconductor community [28.7] Bioconductorプロジェクトは、オミクスデータ分析に焦点を当てたオープンソースのソフトウェアコミュニティである。
このガイドは、この分野の学習者と教育者の両方にとって貴重な参考資料となっている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:07:48 GMT)
Time-Uniform Confidence Spheres for Means of Random Vectors [28.4] 全ての試料サイズで高い確率のランダムベクトルの平均を含む時間一様信頼球—信頼球列 -- について検討する。
本研究の結果は,対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対数対
私たちの研究はPAC-ベイジアン理論に基づいており、カトーニとジュリーニのアプローチに触発されている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:15:02 GMT)
Pruning Multilingual Large Language Models for Multilingual Inference [28.4] 本研究では,非英語言語におけるMLLMのゼロショット性能を向上させる方法について検討する。
まず、翻訳を行う際のMLLMの挙動を分析し、翻訳過程において重要な役割を果たす大きな特徴があることを明らかにする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:52:56 GMT)
Uncertainty-aware Human Mobility Modeling and Anomaly Detection [28.3] 本研究では,効率的な異常検出に向けて,人間のエージェントの移動行動のモデル化方法について検討する。
我々はGPSデータを時系列の静止点イベントとして使用し、それぞれに時間的特徴を特徴付ける。
数万のエージェントによる大規模専門家シミュレーションデータセットの実験は、我々のモデルの有効性を実証している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:57:08 GMT)
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding [28.2] 大規模言語モデル(LLM)の性能向上を目的としたLong Question Coreference Adaptation (LQCA) 手法を提案する。
このフレームワークは、長いコンテキストに合わせて調整されたコア参照解決に焦点を当てており、モデルが参照を効果的に識別し、管理することができる。
このフレームワークはLLMの扱いやすいパーティションを提供し、理解を深める。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:39:55 GMT)
NTK-DFL: Enhancing Decentralized Federated Learning in Heterogeneous Settings via Neural Tangent Kernel [27.9] Decentralized Federated Learning (DFL) は、中央サーバや生のデータ交換なしで参加者間でモデルをトレーニングするための、協調的な機械学習フレームワークである。
近年の研究では、集中型フレームワークにおけるフェデレーション学習に適用されたニューラルタンジェントカーネル(NTK)アプローチが、パフォーマンスの向上につながることが示されている。
本稿では,NTKベースの進化とモデル平均化の相乗効果を導入しながら,分散環境でクライアントモデルを訓練するためにNTKを活用するアプローチを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:19:28 GMT)
MGDA Converges under Generalized Smoothness, Provably [27.9] 多目的最適化(MOO)はマルチタスク学習など様々な分野で注目を集めている。
最近の研究は、理論解析を伴う効果的なアルゴリズムを提供しているが、それらは標準の$L$-smoothあるいは有界勾配仮定によって制限されている。
一般化された$ell$-smooth損失関数のより一般的で現実的なクラスについて研究し、$ell$は勾配ノルムの一般非減少関数である。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:51:01 GMT)
Fair Class-Incremental Learning using Sample Weighting [27.8] 本研究は,現在行われている課題のすべてのサンプルを鼻で使用することにより,クラスを含む特定のセンシティブなグループに対して不当な破滅的忘れを生じさせることを示す。
平均勾配ベクトルの方向を変えるために,現在のタスクサンプルのトレーニング重みを調整する,公平なクラス増分学習フレームワークを提案する。
実験により、FSWは実際のデータセットに対する最先端のアプローチよりも精度・公正なトレードオフ結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:32:21 GMT)
VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters [27.8] 本稿では,リッチで高品質な自然画像からTSFファンデーションモデルを構築するための新しい道を探る。
画像再構成タスクとしてTSFを再構成することにより、画像事前学習とTSF下流タスクのギャップを埋める。
提案されたVisionTSは、既存のTSFファンデーションモデルよりも優れたゼロショット予測性能を実現することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:21:47 GMT)
SAFE: Semantic Adaptive Feature Extraction with Rate Control for 6G Wireless Communications [27.7] 本稿では,SAFEフレームワーク全体の性能を最適化する3つの高度な学習アルゴリズムを提案する。
我々は,SAFEフレームワークが,異なるチャネル帯域条件下でのセマンティクスを効果的かつ適応的に抽出し,伝達できることを実証した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:34:45 GMT)
Question-guided Knowledge Graph Re-scoring and Injection for Knowledge Graph Question Answering [27.4] KGQAは知識グラフに格納された構造化情報を活用することで自然言語の質問に答える。
本稿では,Q-KGR(Q-Guided Knowledge Graph Re-scoring method)を提案する。
また,大規模言語モデルに再認識された知識グラフを注入するパラメータ効率の高い手法であるKnowformerを導入し,事実推論を行う能力を高める。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:27:07 GMT)
ChartInsights: Evaluating Multimodal Large Language Models for Low-Level Chart Question Answering [27.2] マルチモーダルな大言語モデル (MLLM) は、高レベルなChartQAタスクにおいて有望であるが、低レベルなChartQAタスクにおけるそれらの有効性はまだ未定である。
本稿では, MLLMを低レベルチャートQA上で新たにキュレートしたデータセットであるChartInsightsを用いて評価する。
低レベルのChartQAタスクに適した新しいテキストプロンプト戦略であるChain-of-Chartsを提案し、パフォーマンスを14.41%向上させ、83.58%の精度を達成する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:46:22 GMT)
Attention Score is not All You Need for Token Importance Indicator in KV Cache Reduction: Value Also Matters [27.1] 本稿では,トークンの重要性を評価するために,注目スコアと$ ell_1 $ 値ベクトルのノルムを併用したバリューアウェアトークンプルーニング(VATP)を提案する。
LLaMA2-7B-chatとVicuna-v1.5-7Bの16のLongBenchタスクに対する実験により、VATPは12以上のタスクにおいて注目スコアのみのベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:19:13 GMT)
CALF: Benchmarking Evaluation of LFQA Using Chinese Examinations [27.0] LFQA(Long-Form Question Answering)とは、オープンエンドの質問に対して、詳細な段落レベルの回答を生成することを指す。
LFQA評価の標準ベンチマークは今のところ存在しない。
LFQA評価のための中国語exAmination(英語版)(CALF)という、よく構築された参照ベースのベンチマークを最初に提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:44:10 GMT)
AHP-Powered LLM Reasoning for Multi-Criteria Evaluation of Open-Ended Responses [26.9] 本研究では,大規模言語モデルを用いたオープンエンド質問に対する回答評価手法を提案する。
また,ChatGPT-3.5-turbo と GPT-4 の2つのデータセットについて実験を行った。
以上の結果から,本研究のアプローチは4つの基準線よりも人間の判断と密接に一致していることが示唆された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:22:07 GMT)
Explainable Molecular Property Prediction: Aligning Chemical Concepts with Predictions via Language Models [26.8] 言語モデルに基づく分子特性予測のためのフレームワークを開発し,これをLamoleと呼ぶ。
文字列ベースの分子表現 -- Group SELFIES -- を入力トークンとして、事前にトレーニングし、Lamoleを微調整します。
我々はLamoleが同等の分類精度を達成でき、説明精度を最大14.3%向上させることができることを示した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:52:50 GMT)
NEAT: Nonlinear Parameter-efficient Adaptation of Pre-trained Models [26.8] 微調整された事前訓練されたモデルは、リソース集約的で厳しい。
広く採用されているPEFT技術であるLoRA(Lo-Rank Adaptation)は、事前訓練されたモデルの重量を凍結する。
NEATは、トレーニング済みの重みを入力として取り込んだ軽量ニューラルネットワークを導入し、近似累積重み更新のための非線形変換を学習する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:29:23 GMT)
Image Copy Detection for Diffusion Models [26.4] Diffusion-Replication (D-Rep)は40,000のイメージ-レプリカのデータセットである。
D-Repは最先端拡散モデル(Stable Diffusion V1.5)を使用して40,000の画像-レプリカペアを生成する。
本手法は,各画像複製ペアの複製レベルを,教師信号として確率密度関数(PDF)に変換する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:26:06 GMT)
Image Copy Detection for Diffusion Models [26.4] Diffusion-Replication (D-Rep)は40,000のイメージ-レプリカのデータセットである。
D-Repは最先端拡散モデル(Stable Diffusion V1.5)を使用して40,000の画像-レプリカペアを生成する。
本手法は,各画像複製ペアの複製レベルを,教師信号として確率密度関数(PDF)に変換する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:26:06 GMT)
GSLoc: Efficient Camera Pose Refinement via 3D Gaussian Splatting [25.8] 本稿では,新しいテストタイムカメラ・ポーズ・リファインメントフレームワークGSLocを提案する。
このフレームワークは、最先端の絶対ポーズ回帰とシーン座標回帰法の局所化精度を高める。
GSLocは、RGBイメージを直接操作することで、特徴抽出器や記述器をトレーニングする必要がなくなる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:35:15 GMT)
Tackling GenAI Copyright Issues: Originality Estimation and Genericization [25.7] 本稿では、生成モデルの出力を一般化し、著作権を侵害しにくくする汎用化手法を提案する。
そこで本研究では,ジェネリゼーション手法と既存の緩和手法を組み合わせたPrepreGenを紹介する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:53:19 GMT)
Debiasing Federated Learning with Correlated Client Participation [25.5] 本稿では,FLのクライアント参加をマルコフ連鎖としてモデル化する理論的枠組みを紹介する。
すべてのクライアントは、再参加する前に最低限の$R$ラウンド(最小分離)を待たなければならない。
我々は、不偏の最適解に確実に収束するFedAvgの効果的な脱バイアスアルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:30:53 GMT)
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts [25.5] Time-MoEは、より大きく、より有能な基礎モデルを予測するために設計された、スケーラブルで統一されたアーキテクチャである。
Time-MoEは、予測毎にネットワークのサブセットだけを活性化することで、計算効率を向上させる。
時系列基礎モデルを24億のパラメータに拡張し,予測精度を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:08:21 GMT)
Time-Dependent VAE for Building Latent Representations from Visual Neural Activity with Complex Dynamics [25.5] TiDeSPL-VAEは複雑な視覚神経活動を効果的に分析し、自然な方法で時間的関係をモデル化することができる。
結果から,本モデルは自然主義的なシーン/ムーブメントにおいて最高の復号性能を得るだけでなく,明示的なニューラルダイナミクスを抽出することがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:26:17 GMT)
PASS:Test-Time Prompting to Adapt Styles and Semantic Shapes in Medical Image Segmentation [25.4] テストタイム適応(TTA)は、医用画像のテスト時にドメインシフトを処理するための有望なパラダイムとして登場した。
本稿では2種類のプロンプトを共同で学習するPASS(Prompting to Adapt Styles and Semantic shapes)を提案する。
複数の医用画像セグメンテーションデータセットにおける最先端手法よりもPASSの方が優れた性能を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:11:26 GMT)
Trained Transformer Classifiers Generalize and Exhibit Benign Overfitting In-Context [25.4] 線形回帰タスクにおいて、線形変圧器がランダムなインスタンス上で事前学習されている場合、通常の最小二乗法と同様のアルゴリズムを用いて予測を行うことを示す。
いくつかの設定では、これらの訓練されたトランスフォーマーは「コンテキスト内の良性オーバーフィット」を示すことができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:30:21 GMT)
Judging the Judges: A Systematic Investigation of Position Bias in Pairwise Comparative Assessments by LLMs [25.3] 本研究は, 対比較における位置バイアスを検討するための体系的枠組みを提案する。
MTBenchとDevBenchにまたがる12のLLM審査員による実験を行い,22のタスクと約40のソリューション生成モデルについて検討した。
以上の結果から, 有能なLLM裁判官の位置バイアスは, ランダムな確率や, 有意な判断や課題の違いによるものではないことが確認された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:08:43 GMT)
T2Vs Meet VLMs: A Scalable Multimodal Dataset for Visual Harmfulness Recognition [24.8] 既存の有害なデータセットは、限られた範囲の有害なオブジェクトの存在によってキュレートされる。
これにより、そのようなデータセットに基づいたメソッドの一般化が妨げられ、誤判断につながる可能性がある。
我々は,インターネットからクロールして4つの生成モデルによって生成された1万枚の画像と1,000本の動画からなる包括的有害データセットを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:44:40 GMT)
T2Vs Meet VLMs: A Scalable Multimodal Dataset for Visual Harmfulness Recognition [24.8] 既存の有害なデータセットは、限られた範囲の有害なオブジェクトの存在によってキュレートされる。
これにより、そのようなデータセットに基づいたメソッドの一般化が妨げられ、誤判断につながる可能性がある。
我々は,インターネットからクロールして4つの生成モデルによって生成された1万枚の画像と1,000本の動画からなる包括的有害データセットを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:44:40 GMT)
NuwaTS: a Foundation Model Mending Every Incomplete Time Series [24.8] textbfNuwaTSは,事前学習型言語モデルを用いて時系列計算を行う新しいフレームワークである。
NuwaTSは、任意のドメインにまたがる欠落したデータをインプットするために適用することができる。
我々はNuwaTSが予測などの他の時系列タスクに一般化していることを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:34:08 GMT)
How Reliable Is Human Feedback For Aligning Large Language Models? [24.7] 我々は総合的な研究を行い、人間のフィードバックデータの詳細な分析を行う。
誤ラベル,主観的嗜好,異なる基準と無害性のしきい値など,信頼性の低い6つの要因を同定する。
本稿では,データ品質を著しく向上させるために,定性解析の洞察に導かれる自動データクリーニング手法である Source-Aware Cleaning を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:03:42 GMT)
Visual Perception in Text Strings [24.6] 本研究では,ASCIIアートを代表的アーティファクトとして選択し,各概念を表現するための線と明るさを文字で表現する。
評価データセットを構築することにより,このタスクにおけるモデル性能をベンチマークし,モデルの視覚的知覚能力を引き出すためのトレーニングセットを収集する。
その結果、人間は100%近い精度を達成できるが、最先端のLSMとMLLMははるかに遅れていることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:46:01 GMT)
Harnessing the Latent Diffusion Model for Training-Free Image Style Transfer [24.5] スタイル転送タスクは、スタイルイメージの視覚的属性を他のコンテンツイメージに転送する課題の1つである。
我々は、事前訓練された潜在拡散モデル(LDM)のための学習不要なスタイル伝達アルゴリズム、スタイルトラッキング逆拡散プロセス(STRDP)を提案する。
本アルゴリズムは, LDMの逆拡散過程において, 適応インスタンス正規化(AdaIN)関数を異なる方法で適用する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:28:21 GMT)
Towards Dynamic Graph Neural Networks with Provably High-Order Expressive Power [24.3] 動的グラフニューラルネットワーク(DyGNN)は、進化するグラフに関する学習表現に対して、研究の注目を集めている。
その効果にもかかわらず、既存のDyGNNの表現力の制限は、動的グラフの重要な進化パターンを捉えるのを妨げる。
我々はDyGNNの表現力を高めるために高次表現力を持つ動的グラフニューラルネットワーク(HopeDGN)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:28:59 GMT)
PersonaMath: Enhancing Math Reasoning through Persona-Driven Data Augmentation [24.1] 我々は、PersonaMathモデルをトレーニングする、MATHとGSM8Kから派生したデータセットであるPersonaMathQAを紹介する。
私たちのデータセットには、MetaMathQAの17.8%とMathInstructの27%の70.3Kのデータポイントしか含まれていません。
我々は、PersonaMathQAデータセット、PersonaMathモデル、およびパブリック利用のためのコードをオープンソース化した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:57:12 GMT)
Open-RAG: Enhanced Retrieval-Augmented Reasoning with Open-Source Large Language Models [23.7] Retrieval-Augmented Generation (RAG) は,Large Language Models (LLMs) の実際の精度を高めることが示されている。
既存の手法は、抽出された証拠を効果的に活用する際の限定的な推論能力に悩まされることが多い。
我々は,オープンソースLLMを用いたRAGにおける推論能力の向上を目的とした,新しいフレームワークであるOpen-RAGを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:37:18 GMT)
Imaging foundation model for universal enhancement of non-ideal measurement CT [23.7] NICT(Non-ideal measured compute tomography)は、CT画像の新しい利点として最適な画像標準を犠牲にしている。
画像基準の引き下げにより、画像の質も低下し、臨床受容性が制限された。
画像品質の劣化を最小限のデータコストで橋渡しするマルチスケール統合トランスフォーマーAMP (TAMP) を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:25:02 GMT)
Benign overfitting in leaky ReLU networks with moderate input dimension [23.5] 二元分類タスクにおけるヒンジ損失を訓練した2層リークReLUネットワークにおけるベニグオーバーフィッティングについて検討した。
モデルパラメータの信号対雑音比 (SNR) の条件を特徴付け, ベニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグナグニグニグニグニグニグナグニグニグニグニグナグニグニグニグニ
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:52:14 GMT)
PCQPR: Proactive Conversational Question Planning with Reflection [23.4] 結論駆動型会話質問生成(CCQG)として会話質問生成タスクを再定義する
自己改善型対話型質問計画(PCQPR)という新しい手法を提案する。
評価の結果,PCQPRは既存のCQG手法をはるかに上回り,結論指向の対話型質問応答システムへのパラダイムシフトを示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:23:07 GMT)
Information-Theoretical Principled Trade-off between Jailbreakability and Stealthiness on Vision Language Models [23.3] 本稿では,視覚言語モデル(VLM)におけるジェイルブレイク可能性とステルスネスのトレードオフについて検討する。
本研究では,非スティルシージェイルブレイク攻撃を検知し,モデルロバスト性を高める新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:40:49 GMT)
Windowed MAPF with Completeness Guarantees [23.2] 完全性を実現するウインドウドMAPFのためのフレームワークWinC-MAPFを紹介する。
また,CBSに新たな変更を加えて,この枠組みを即時化するシングルステップCBS (SS-CBS) も開発した。
単一のステップとアップデートしか計画していないSS-CBSが、既存のウィンドウ化アプローチが失敗する難しいシナリオを効果的に解決できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:55:46 GMT)
Efficient Streaming LLM for Speech Recognition [23.2] SpeechLLM-XLは、ストリーミング音声認識のための線形スケーリングデコーダのみのモデルである。
訓練発話の10倍の長文発声に対して品質劣化を生じさせない。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:54:35 GMT)
A GPU-accelerated Large-scale Simulator for Transportation System Optimization Benchmarking [23.0] トランスポートシステムのシミュレーションと最適化のための,初のオープンソースGPU加速型大規模顕微鏡シミュレータを提案する。
シミュレータは84.09Hzで反復可能で、2,464,950台の車両で大規模シナリオで88.92倍の計算加速を達成している。
5つの代表的なシナリオを選択し、古典的なルールベースのアルゴリズム、強化学習アルゴリズム、ブラックボックス最適化アルゴリズムをベンチマークする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:43:58 GMT)
Circuit Compositions: Exploring Modular Structures in Transformer-Based Language Models [22.9] 言語モデル内で10個のモジュール型文字列編集処理を行う回路を同定・比較する。
以上の結果から,機能的に類似した回路は,ノード重なりとクロスタスク忠実度の両方を示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:36:45 GMT)
FlashMask: Efficient and Rich Mask Extension of FlashAttention [22.8] FlashMaskはFlashAttentionの拡張であり、アテンションマスクのカラム単位のスパース表現を導入している。
この新しい表現を採用することで、FlashMaskは長いコンテキストシーケンスのモデリングに適した線形メモリ複雑性$O(N)$を達成する。
SFT, LoRA, DPO, RMなどのLLMの微調整およびアライメント訓練におけるFlashMaskの性能を評価する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:17:26 GMT)
Deep Separable Spatiotemporal Learning for Fast Dynamic Cardiac MRI [22.7] MRIは心臓診断において欠かせない役割を担っている。高速イメージングを可能にするため、k空間データをアンサンプすることができる。
この課題は、ディープラーニング再構築手法における広範なトレーニングデータを必要とする。
本研究では,高度に制限された学習データであっても,例外的に良好に動作可能な次元分離型学習手法を活用する,新規で効率的な手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:42:35 GMT)
Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations [22.6] 汎用インテリジェンスには、タスク間の迅速な適応が必要です。
本稿では,分布だけでなく,環境空間も変化するシナリオを幅広く検討する。
我々はCSRと呼ばれる因果性誘導型自己適応表現に基づく手法を導入し、エージェントを効果的に一般化させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:32:21 GMT)
ScenicNL: Generating Probabilistic Scenario Programs from Natural Language [22.3] 自然言語からシナリオプログラムを作成するためのAIシステムであるScenarioNLを提案する。
我々はこれらのプログラムを警察の事故報告から作成する。
我々は過去5年間にカリフォルニアで利用可能な自動運転車の事故報告について、我々のシステムを評価してきた。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 22:58:42 GMT)
shapiq: Shapley Interactions for Machine Learning [21.9] Shapley Value(SV)とShapley Interactions(SI)を効率的に計算するために、最先端のアルゴリズムを統一したオープンソースのPythonパッケージであるshapiqを紹介する。
実践者にとって、Shapiqは、視覚変換器、言語モデル、XGBoost、TreeShap-IQによるLightGBMなど、モデルの予測において、任意の順序のフィーチャーインタラクションを説明および視覚化することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:16:53 GMT)
Differentially Private Bootstrap: New Privacy Analysis and Inference Strategies [21.7] 差分的プライベート(DP)メカニズムは、統計的解析手順においてランダム性によって個人レベルの情報を保護する。
サンプリング分布を推定し、信頼区間(CI)を構築するために、複数のプライベートブートストラップ推定を解放するDPブートストラップ手順を検討する。
我々は、人口平均推定、ロジスティック回帰、量子回帰といったタスクのためのCIを導出し、2016年のカナダ国勢調査データにおけるシミュレーションと実世界の実験を用いて既存の手法と比較した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:43:43 GMT)
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling [21.7] コントラスト言語-画像事前学習(CLIP)はマルチモーダルインテリジェンスの基礎となっている。
DMUは、異なる特徴空間をキャプチャする一連のCLIPモデルを効率的に微調整する。
様々なゼロショット検索、ゼロショット画像分類タスクにおけるCLIP-MoEの顕著な性能を示す実験を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:50:58 GMT)
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling [21.7] コントラスト言語-画像事前学習(CLIP)はマルチモーダルインテリジェンスの基礎となっている。
DMUは、異なる特徴空間をキャプチャする一連のCLIPモデルを効率的に微調整する。
様々なゼロショット検索、ゼロショット画像分類タスクにおけるCLIP-MoEの顕著な性能を示す実験を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:50:58 GMT)
Rethinking the Expressiveness of GNNs: A Computational Model Perspective [21.7] 本稿では,資源制限型CONGEST(RL-CONGEST)モデルを導入し,任意の前処理と後処理を導入し,GNN表現性を解析するためのフレームワークを形成する。
我々のフレームワークは、WLテストにおけるハッシュ関数の計算硬度や、ネットワーク容量の削減における仮想ノードの役割など、計算面に光を当てている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:01:50 GMT)
Denoising with a Joint-Embedding Predictive Architecture [21.4] 私たちはD-JEPA(Joint-Embedding Predictive Architecture)でDenoisingを紹介します。
本稿では,JEPAをマスク画像モデリングの一形態として認識することにより,一般化した次世代予測戦略として再解釈する。
また,拡散損失を利用して確率分布をモデル化し,連続空間におけるデータ生成を可能にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:57:10 GMT)
Differentially Private Parameter-Efficient Fine-tuning for Large ASR Models [21.1] 大型のASRモデルは、機密情報を不注意に漏洩させ、差分プライバシー(DP)のような正式なプライバシー対策によって緩和することができる。
本研究は,ASRモデルにおいて,より少ない計算と性能コストでプライバシーリスクを軽減する手段として,DPパラメータ効率の微調整を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:49:15 GMT)
GADFA: Generator-Assisted Decision-Focused Approach for Opinion Expressing Timing Identification [21.1] 現実の状況では、個人はテキストを連続的に生成したり、意見を述べることはない。
本研究は、タイミングを表すニューストリガーによる意見の識別という革新的な課題を紹介する。
我々のアプローチは意思決定に重点を置いており、テキスト生成モデルを利用して分類モデルを操る。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:54:46 GMT)
Distilling Analysis from Generative Models for Investment Decisions [21.1] 専門家の意思決定過程をシミュレートする新しいデータセットA3を導入する。
現在のモデルでは,プロフェッショナルの行動を予測する上での課題が指摘されているが,提案したChain-of-Decisionアプローチは,有望な改善を示すものだ。
意見生成システムを統合し,各ニュース項目に基づいて主観的分析を行い,提案課題の性能をさらに向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:39:42 GMT)
Elaborative Subtopic Query Reformulation for Broad and Indirect Queries in Travel Destination Recommendation [21.1] 大規模言語モデルに基づくQR手法であるEQR(Elaborative Subtopic Query Reformulation)を導入する。
EQRは、潜在的なクエリサブトピックと情報豊富なエラボレーションを生成することで、幅と深さを兼ね備えている。
また、クエリ駆動の旅行先RSのための新しいデータセットであるTravelDestをリリースする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:36:18 GMT)
Unleashing the Power of Large Language Models in Zero-shot Relation Extraction via Self-Prompting [21.0] 本稿では,大規模言語モデルに組み込まれたRE知識を十分に活用する新しい手法であるSelf-Promptingフレームワークを紹介する。
我々のフレームワークは3段階の多様性アプローチを用いてLSMを誘導し、スクラッチから特定の関係をカプセル化する複数の合成サンプルを生成する。
ベンチマークデータセットを用いた実験により,既存のLCMベースのゼロショットRE法よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:12:54 GMT)
Improving Fairness and Mitigating MADness in Generative Models [21.0] 我々は、意図的に設計されたハイパーネットワークで生成モデルをトレーニングすると、マイノリティクラスに属するデータポイントを生成する際により公平なモデルが得られることを示す。
本稿では,実データと自己合成データとの差分を正規化する手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:01:49 GMT)
Towards Native Generative Model for 3D Head Avatar [20.8] 限られた3Dヘッドデータセットから360$circ$フルヘッドのネイティブ生成モデルを学習する方法を示す。
具体的には,360ドル周の人体頭部を生成するために,様々な表現を効果的に活用する方法について検討した。
提案されたモデルとアーティストが設計したデータセットが、限られた3Dデータセットからネイティブな生成3Dヘッドモデルを学習するための将来の研究を刺激することを期待しています。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:04:10 GMT)
Learning Dynamics of LLM Finetuning [20.7] 各種ファインタニングにおける大規模言語モデルの学習力学について検討する。
我々のフレームワークは、命令チューニングと選好チューニングの両方のための一般的なアルゴリズムのトレーニングに関する多くの興味深い観察を均一に解釈することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:47:30 GMT)
On the Statistical Efficiency of Mean-Field Reinforcement Learning with General Function Approximation [20.7] 平均フィールド制御(MFC)および平均フィールドゲーム(MFG)における強化学習の基本統計的効率を一般モデルに基づく関数近似を用いて検討する。
我々は平均場モデルクラス固有の複雑さを特徴付ける平均場モデルベースエルダー次元(MF-MBED)という新しい概念を導入する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:22:34 GMT)
HRTF Estimation using a Score-based Prior [20.6] 本稿では,スコアベース拡散モデルに基づく頭部伝達関数推定手法を提案する。
HRTFは人間の発話などの自然な励起信号を用いて残響環境で推定される。
HRTFにおける高周波コンテンツの大きなばらつきを,拡散前の拡散が考慮できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:00:41 GMT)
Almost Sure Convergence of Average Reward Temporal Difference Learning [20.5] タブラル平均報酬 一時学習(TD)はおそらく最も単純かつ最も基本的な政策評価アルゴリズムである。
非常に穏やかな条件下では、平均報酬 TD はサンプルパス依存の固定点にほぼ確実に収束することを示すのはこれが初めてである。
この成功の鍵となるのは、マルコフ的および加法的雑音を伴う非拡大写像に関する新しい一般差分近似結果である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:57:57 GMT)
Almost Sure Convergence of Average Reward Temporal Difference Learning [20.5] タブラル平均報酬 一時学習(TD)はおそらく最も単純かつ最も基本的な政策評価アルゴリズムである。
非常に穏やかな条件下では、平均報酬 TD はサンプルパス依存の固定点にほぼ確実に収束することを示すのはこれが初めてである。
この成功の鍵となるのは、マルコフ的および加法的雑音を伴う非拡大写像に関する新しい一般差分近似結果である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:57:57 GMT)
Almost Sure Convergence of Average Reward Temporal Difference Learning [20.5] タブラル平均報酬 一時学習(TD)はおそらく最も単純かつ最も基本的な政策評価アルゴリズムである。
非常に穏やかな条件下では、平均報酬 TD はサンプルパス依存の固定点にほぼ確実に収束することを示すのはこれが初めてである。
この成功の鍵となるのは、マルコフ的および加法的雑音を伴う非拡大写像に関する新しい一般差分近似結果である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:57:57 GMT)
Approximate Nearest Neighbour Search on Dynamic Datasets: An Investigation [20.4] 近似k-Nearest Neighbour (ANN) 法は情報マイニングや大規模高次元データセットでの機械学習支援によく用いられる。
静的なデータセットを持つアプリケーションでは、ランタイム制約とデータセットプロパティを使用して、適切な操作特性を持つANNメソッドを経験的に選択することができる。
従来の評価手法は、インデックス構造を更新する際の計算コストや、インデックス更新の率とサイズを考慮していない。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 07:30:02 GMT)
Gaussian-Det: Learning Closed-Surface Gaussians for 3D Object Detection [20.3] マルチビューに基づく3次元物体検出のための表面表現としてガウススプラッティングを利用するガウス・デットを提案する。
ガウススプラッティングによって本質的に導入された多くの外れ値に対処するため、我々はクロージャ推論モジュールを考案する。
合成データセットと実世界のデータセットの両方の実験では、ガウス・デットが既存のアプローチより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:31:10 GMT)
CANVAS: Commonsense-Aware Navigation System for Intuitive Human-Robot Interaction [20.0] 本稿では,コモンセンス認識ナビゲーションのための視覚的および言語的指示を組み合わせたフレームワークであるCANVASを提案する。
その成功は模倣学習によって引き起こされ、ロボットは人間のナビゲーション行動から学ぶことができる。
実験の結果,CANVASはすべての環境において,強力なルールベースシステムであるROS NavStackよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:34:45 GMT)
HyperBrain: Anomaly Detection for Temporal Hypergraph Brain Networks [19.5] HyperBrainは、時間的ハイパーグラフ脳ネットワークのための教師なしの異常検出フレームワークである。
新しくカスタマイズされた側頭歩行(BrainWalk)とニューラルエンコーディングを使用して、脳領域間の異常なコアクティベーションを検出する。
HyperBrainから得られた結果は、これらの脳疾患に関する臨床研究と一致している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:20:13 GMT)
SonicSim: A customizable simulation platform for speech processing in moving sound source scenarios [19.2] 移動音源データを生成する合成ツールキットであるSonicSimを紹介する。
シーンレベル、マイクレベル、ソースレベルを含むマルチレベル調整をサポートする。
合成データと実世界のデータの違いを検証するため,残響のない生データの5時間をランダムに選択した。
その結果,SonicSimが生成した合成データは実世界のシナリオに効果的に一般化できることが示唆された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:33:59 GMT)
dMel: Speech Tokenization made Simple [19.2] メル-フィルターバンクチャネルを離散強度ビンに分割すると、単純な表現(dMel)が生成されることを示す。
本結果は,dMelが統合されたフレームワーク内の両方のタスクにおいて高い性能を実現する上で有効であることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:38:27 GMT)
TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation [19.1] パラメータと計算コストを大幅に削減した音声分離モデルを提案する。
TIGERは事前の知識を活用して周波数帯域を分割し、周波数情報を圧縮する。
我々は、TIGERが、最先端(SOTA)モデルTF-GridNetを上回る性能を達成することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:21:06 GMT)
Entity or Relation Embeddings? An Analysis of Encoding Strategies for Relation Extraction [19.0] 関係抽出は、本質的にはテキスト分類問題であり、事前学習言語モデル(LM)を微調整することで取り組める。
既存のアプローチでは、LMを微調整して頭と尾のエンティティの埋め込みを学習し、それらのエンティティの埋め込みから関係を予測する。
本稿では,より直接的な方法で関係を捉えることにより,関係抽出モデルを改善することができるという仮説を立てる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:26:30 GMT)
COSMIC: Compress Satellite Images Efficiently via Diffusion Compensation [19.0] 衛星画像の送信を行うための簡易かつ効果的な圧縮ソリューションであるCOSMICを提案する。
まず,衛星間リンクを保存するために,高圧縮率を実現するために,衛星上に軽量エンコーダを設計する。
そこで,地上での再構成のために,デコード時に画像の詳細を補償する拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:05:15 GMT)
FeelAnyForce: Estimating Contact Force Feedback from Tactile Sensation for Vision-Based Tactile Sensors [18.9] 視覚に基づく触覚センサを用いて3次元接触力を推定する問題に対処する。
我々のゴールは、様々な視覚ベースの触覚センサーにまたがって、あらゆる物体の接触力(最大15N)を推定することである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:28:19 GMT)
Why context matters in VQA and Reasoning: Semantic interventions for VLM input modalities [18.9] 画像とテキストのモダリティからの情報の統合が視覚言語モデル(VLM)予測の性能と振舞いに与える影響について検討する。
本稿では,VQAタスクの解決に視覚的内容が不可欠である様々な構成において,テキストと画像のモダリティの相互作用について検討する。
この結果から,モダリティ間の相補的な情報によって解答や推論の質が向上し,矛盾する情報がモデルの性能や信頼性を損なうことが明らかとなった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:02:02 GMT)
DECOR: Improving Coherence in L2 English Writing with a Novel Benchmark for Incoherence Detection, Reasoning, and Rewriting [18.7] 我々は,L2英語文における不整合を検出するための専門家アノテーションを含む新しいベンチマークであるDECORを紹介する。
DECORは、L2英語の文章を改善するために特別に設計された最初のコヒーレンスアセスメントデータセットである。
学生エッセイにおける不整合を自動的に検出および書き直しするために、モデルを微調整した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:11:34 GMT)
Knowledge-Based Domain-Oriented Data Augmentation for Enhancing Unsupervised Sentence Embedding [18.7] 本研究では,パイプラインに基づく新しいデータ拡張手法を提案する。
正のサンプルと負のサンプルの両方を、エンティティと量認識の増強によって生成する。
次に,Gaussian-decayed gradient-assisted Contrastive Sentence Embedding (GCSE)モデルを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:24:50 GMT)
3M-Diffusion: Latent Multi-Modal Diffusion for Language-Guided Molecular Structure Generation [18.6] 3M拡散は、新しいマルチモーダルな分子グラフ生成法である。
望ましい性質を持つ多様な、理想的には新しい分子構造を生成する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:09:18 GMT)
Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design [18.3] オンラインモンテカルロ推定器のデータ効率を向上させる新しい手法を提案する。
まず,オンラインモンテカルロ推定器のばらつきを確実に低減する閉形式行動ポリシーを提案する。
次に、以前に収集したオフラインデータから、このクローズドフォームの動作ポリシーを学習するための効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:41:22 GMT)
Learning Molecular Representation in a Cell [18.2] 本稿では,細胞内情報ボトルネック法を用いて分子表現を学習するための情報アライメント(InfoAlign)手法を提案する。
我々は、分子と細胞応答データをノードとしてコンテキストグラフに統合し、化学、生物学的、計算基準に基づいて重み付けされたエッジと接続する。
提案手法は,既存のエンコーダをベースとしたコントラスト法よりも,アライメントの効率向上を目標としている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:26:46 GMT)
The MLE is minimax optimal for LGC [18.1] 我々は、最近導入されたローカルGlivenko-Cantelliセッティングを再考し、最大空力推定器(MLE)の均一対流速度について研究する。
厳格に大きな尺度が学べるか?よりリスクの高い崩壊率が得られるか?
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:51:29 GMT)
Breaking Language Barriers: Cross-Lingual Continual Pre-Training at Scale [18.0] 本稿では,既存のLLMから連続的に事前学習(CPT)を行うことにより,大規模言語モデル構築のための代替手法を検討する。
CPTはより高速に収束し、拡張性のある方法で重要なリソースを節約できる。
スケールでの転送の有効性は、トレーニング期間と言語特性に影響され、データ再生に頑健である。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:32:10 GMT)
DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation [17.9] テキスト駆動3D編集作業において, スコア蒸留サンプリング(SDS)が有効なフレームワークとして登場した。
我々は,これらのサンプリングダイナミクスをSDSフレームワークで検討する新しいフレームワークであるDreamCatalystを提案する。
提案手法は,(1)現在最先端のNeRF編集手法の23倍の速さでシーンを編集する高速モード,(2)これらの手法の約8倍の速さで結果を生成する高品質モードの2つのモードを提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:28:14 GMT)
Reasoning Elicitation in Language Models via Counterfactual Feedback [17.9] 事実と反事実の質問において精度のバランスをとる新しい指標を導出する。
本稿では,より優れた推論機構を実現するための微調整手法を提案する。
各種現実シナリオにおける微調整言語モデルの性能評価を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:33:30 GMT)
SHAP-CAT: A interpretable multi-modal framework enhancing WSI classification via virtual staining and shapley-value-based multimodal fusion [17.9] 本稿では,SHAP-CAT という新しい解釈可能なマルチモーダルフレームワークを提案する。
有効マルチモーダル核融合にシェープリー値に基づく次元減少法を用いる。
実験結果から, SHAP-CATフレームワークに合成モダリティが組み込まれ, モデル性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:39:31 GMT)
ProxiMix: Enhancing Fairness with Proximity Samples in Subgroups [17.7] 線形ミックスアップのみを使用することで、バイアス軽減のためのデータ拡張テクニックは、データセットラベルにバイアスを保持することができる。
本稿では,既存の混合手法と新たなバイアス軽減アルゴリズムの両方を活用可能な,新しい前処理手法を提案する。
ProxiMixは、より公平なデータ拡張のために、ペアワイズと近接関係を保持します。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:47:03 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Unveiling AI's Potential Through Tools, Techniques, and Applications [17.6] この本は、ビッグデータ分析における彼らの応用に焦点を当てた、ディープラーニングと機械学習の紹介として機能する。
基本的な概念、ChatGPTやClaudeのようなツール、ハードウェアレコメンデーション、開発環境のセットアップに関する実践的なガイダンスなどだ。
初心者や高度なユーザー向けに設計されたもので、ステップバイステップの指示、ハンズオンプロジェクト、AIの未来に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:24:51 GMT)
On the expressiveness and spectral bias of KANs [17.4] 深層学習モデルであるMLP(Multi-layer perceptron)のアーキテクチャバックボーンの代替として,kanが提案されている。
カンは科学のためのAIの様々なタスクで成功しており、その経験的効率性と精度は、関数回帰、PDE解決、そして多くの科学的な問題で実証されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:57:38 GMT)
Cognition Transferring and Decoupling for Text-supervised Egocentric Semantic Segmentation [17.4] Egocentic Semantic (TESS)タスクは、画像レベルのラベルからテキストによって弱められたエゴセントリックなイメージにピクセルレベルのカテゴリを割り当てることを目的としている。
本稿では、まず、画像とテキストを関連づけて、自我中心の着用者オブジェクトの関係を学習する認知伝達デカップリングネットワーク(CTDN)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:58:34 GMT)
InfiniPot: Infinite Context Processing on Memory-Constrained LLMs [17.1] InfiniPotは、トレーニング済みの大規模言語モデルで広範囲のシーケンスを効率的に管理できるように設計された、新しいKVキャッシュ制御フレームワークである。
InfiniPotは、将来のコンテキストにアクセスしなくても、重要なデータを効果的に維持する。
この研究は、広範囲の現実世界のシナリオに適用できるようにするための大きな言語モデルの実現に向けた大きな進歩を示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:09:41 GMT)
Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise [17.0] 現代のディープニューラルネットワーク(NN)のトレーニング戦略は、層重みのヘビーテール(HT)経験スペクトル密度(ESD)を誘導する。
雑音のない2層NNのESDにおける重みの「加工」に関する理論的インフォームド解析を行った。
本研究は,2層NNの一般化を促進する訓練の初期段階において,ESDのバルク+スパイクおよびHT形状における学習速度の役割を強調した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:10:29 GMT)
OmniSR: Shadow Removal under Direct and Indirect Lighting [16.9] 間接照明からのシャドウ除去における重要な課題は、シャドウ除去ネットワークを訓練するためのシャドウフリー画像を取得することである。
直接的および間接的な照明下で影のない画像を生成するための新しいレンダリングパイプラインを提案する。
また,結合と注意機構を通じて意味的および幾何学的先行を明示的に統合する,革新的なシャドウ除去ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:30:10 GMT)
E2Map: Experience-and-Emotion Map for Self-Reflective Robot Navigation with Language Models [16.5] 大規模言語モデル(LLM)は、言語命令を実行するためのエンボディエージェントを誘導する大きな可能性を示している。
既存の手法は主に静的環境向けに設計されており、エージェント自身の経験を生かして初期計画を洗練しない。
本研究は,LLMの知識とエージェントの現実世界の経験を統合した経験・感情マップ(E2Map)を紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:50:27 GMT)
Anchors Aweigh! Sail for Optimal Unified Multi-Modal Representations [16.0] マルチモーダル学習は、機械学習モデルが多様なデータソースを融合し利用できるようにする上で重要な役割を果たす。
ImageBindのような最近のバインディング手法では、固定アンカーのモダリティを使用して、アンカーのモダル埋め込み空間内のマルチモーダルデータをアライメントする。
我々はCentroBindを提案する。CentroBindは、固定アンカーを必要としない、シンプルだが強力なアプローチである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:19:23 GMT)
Examining the Role of Relationship Alignment in Large Language Models [16.0] 本研究は、コメント者とポスターの性別、年齢、友情の近さの異なる組み合わせで意味音を予測できるLlama 3.0(70B)の能力を評価する。
その結果, 社会的関係情報を含めることで, 人間のコメントの意味的トーンを予測するモデルの有効性が向上することがわかった。
パートIIの結果は,社会文脈情報をインプロンプトに含まない場合でも,LLM生成コメントや人的コメントは社会的文脈に等しく敏感であることを示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:16:02 GMT)
DiffSSD: A Diffusion-Based Dataset For Speech Forensics [15.9] 拡散型音声生成装置はユビキタスであり, 高品質な合成音声を生成することができる。
このような誤用に対抗するため、合成音声検出器が開発された。
これらの検出器の多くは拡散ベースのシンセサイザーを含まないデータセットで訓練されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:04:02 GMT)
DiffSSD: A Diffusion-Based Dataset For Speech Forensics [15.9] 拡散型音声生成装置はユビキタスであり, 高品質な合成音声を生成することができる。
このような誤用に対抗するため、合成音声検出器が開発された。
これらの検出器の多くは拡散ベースのシンセサイザーを含まないデータセットで訓練されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:04:02 GMT)
Assisted Data Annotation for Business Process Information Extraction from Textual Documents [15.8] 自然言語のテキストプロセス記述から機械学習に基づくプロセスモデルの生成は、時間集約的で高価なプロセス発見フェーズのソリューションを提供する。
本稿では、データセット作成を支援する2つの支援機能、テキスト中のプロセス情報を特定するレコメンデーションシステム、すでに特定されているプロセス情報の現在の状態をグラフィカルなビジネスプロセスモデルとして可視化する2つの支援機能を提案する。
31人の参加者によるコントロールされたユーザスタディによると、データセット作成を支援するリコメンデーションは、ワークロードのすべての側面を最大51.0%$に下げ、アノテーションの品質を最大38.9%$に大幅に改善する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:14:39 GMT)
UW-GS: Distractor-Aware 3D Gaussian Splatting for Enhanced Underwater Scene Reconstruction [15.6] 3D Gaussian splatting (3DGS) はリアルタイムの高品質な3Dシーンレンダリングを実現する機能を提供する。
しかし、3DGSは、シーンが透明な中性環境にあると仮定し、水中のシーンで満足できる表現を生成するのに苦労している。
水中用途に特化して設計された新しいガウススプラッティング方式UW-GSを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:08:56 GMT)
MARPLE: A Benchmark for Long-Horizon Inference [15.5] マルチモーダルエビデンスを用いた長距離推論能力評価のためのベンチマークであるMARPLEを紹介する。
古典的なフードユニットのストーリーにインスパイアされた私たちは、AIモデルと人間の参加者に、実際に何が起きたかをステップバイステップで再現することで、どのエージェントが環境の変化を引き起こしたかを推測するように依頼します。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:20:51 GMT)
Fast and Sample Efficient Multi-Task Representation Learning in Stochastic Contextual Bandits [15.3] 本研究では,表現学習が文脈的包帯問題の学習効率を向上させる方法について検討する。
本稿では,予測勾配勾配(GD)と最小化推定器に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:30:29 GMT)
HiReview: Hierarchical Taxonomy-Driven Automatic Literature Review Generation [15.2] HiReviewは階層的な分類による自動文献レビュー生成のための新しいフレームワークである。
大規模な実験により、HiReviewは最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:02:03 GMT)
Zodiac: A Cardiologist-Level LLM Framework for Multi-Agent Diagnostics [15.1] 心臓科レベルの専門性を備えたLLMフレームワークであるZODIACを紹介する。
ZODIACは、患者データから臨床的に関連する特徴を抽出することにより、心臓科医を支援する。
ZODIACは心電図装置(ECG)にうまく統合されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:46:39 GMT)
Spiking-PhysFormer: Camera-Based Remote Photoplethysmography with Parallel Spike-driven Transformer [15.1] スパイキングネットワーク(SNN)は、エネルギー効率のよいディープラーニングの可能性を秘めている。
本稿では,消費電力削減を目的としたハイブリッドニューラルネットワーク(HNN)モデルであるSpking-PhysFormerを提案する。
提案モデルでは,PhysFormerと比較して12.4%の消費電力削減を実現している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:06:10 GMT)
ConServe: Harvesting GPUs for Low-Latency and High-Throughput Large Language Model Serving [15.0] 本稿では,オフラインLLM推論タスクのためのストランドGPUリソースの抽出を提案する。
我々は、オフラインタスクの実行をプリエンプトする実行エンジンを含むLLMサービスシステムであるConServeを構築した。
オンラインタスクとオフラインタスクの協調作業において,ConServeが強力なパフォーマンス分離を実現することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:12:13 GMT)
Linear Projections of Teacher Embeddings for Few-Class Distillation [15.0] 知識蒸留(KD)は、より大規模で複雑な教師モデルからより小さな学生モデルへ知識を移行するための有望なアプローチとして登場した。
学習埋め込み線形射影(LELP)と呼ばれる教師のモデル表現から知識を抽出する新しい手法を提案する。
Amazon ReviewsやSentiment140のような大規模NLPベンチマークの実験的な評価では、LELPはバイナリや少数クラスの問題に対する既存の最先端蒸留アルゴリズムと一貫して競合し、典型的には優れていることが示されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:36:30 GMT)
Takin-VC: Zero-shot Voice Conversion via Jointly Hybrid Content and Memory-Augmented Context-Aware Timbre Modeling [15.0] Takin-VCは、新しいゼロショットVCフレームワークである。
実験結果から,Takin-VC法は最先端のゼロショットVCシステムを上回ることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:07:33 GMT)
Evaluating Robustness of Reward Models for Mathematical Reasoning [15.0] 本稿では,報酬モデルの信頼性評価のための新しい設計を提案し,これを検証するためにRewardMATHを構築した。
RewardMATHのスコアは、最適化されたポリシーの結果と強く相関し、効果的に報酬過大評価を推定する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:39:58 GMT)
A Conditional Independence Test in the Presence of Discretization [14.9] 既存のテストメソッドは、離散化された観察しかできない場合、機能しない。
このような離散化の存在に対応するために特別に設計された条件付き独立テストを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:55:25 GMT)
Bayesian WeakS-to-Strong from Text Classification to Generation [14.9] この研究は、人間の意見の多様性をシミュレートする弱いモデルのアンサンブルを探索することで、Weak-to-StrongからWeakS-to-Strongに拡張する。
信頼性スコアは、WeakS-to-Strong一般化を導くベイズ的アプローチを用いて推定される。
その結果,提案手法の有効性を学生モデルの信頼性に示し,スーパーアライメントの可能性を示した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:45:32 GMT)
ACE: A LLM-based Negotiation Coaching System [14.9] LLMを用いたnEgotiation(ACE)支援支援システムの開発
ACEはユーザのための交渉パートナとして機能するだけでなく、改善のための目標とするフィードバックも提供する。
ACE生成したフィードバックの有効性を検証するために,2つの連続的な交渉実験を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:52:09 GMT)
Co-Representation Neural Hypergraph Diffusion for Edge-Dependent Node Classification [14.5] エッジ依存ノード分類(ENC)では、ノードは異なるハイパーエッジにまたがる異なるラベルを持つことができる。
このタスクの既存のソリューションは、メッセージパッシングとマルチインプット単一出力関数として、エッジ内およびノード内構造におけるモデル相互作用に基づいている。
我々は、エッジ内およびノード内相互作用をマルチインプットマルチアウトプット関数としてモデル化する新しいEMCソリューションであるCoNHDを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:21:55 GMT)
MONICA: Benchmarking on Long-tailed Medical Image Classification [14.5] 長期学習はデータ不均衡学習において極めて難しい問題であると考えられている。
医用OpeNソースLong-taIled ClassifiCAtion (MONICA) という,統一された構造を持つ。
関連する分野で開発された30以上のメソッドを実装し、6つの医療ドメインをカバーする12の長い尾の医療データセットで評価する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:21:46 GMT)
Sampling from Energy-based Policies using Diffusion [14.5] エネルギーベースの政策から拡散に基づくアプローチを導入し、負のQ関数がエネルギー関数を定義する。
提案手法は,連続制御タスクにおけるマルチモーダル動作の探索と捕捉を促進し,既存手法の重要な制約に対処することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:09:33 GMT)
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning [14.5] DeepProteinは、タンパク質関連のタスクに特化した、包括的でユーザフレンドリーなディープラーニングライブラリである。
これには、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、トランスフォーマー、グラフニューラルネットワーク(GNN)、グラフトランスフォーマー(GT)が含まれる。
ユーザフレンドリなインターフェースを提供し、ドメイン研究者がタンパク質データにディープラーニング技術を適用するのを容易にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:42:32 GMT)
Gaussian Splatting in Mirrors: Reflection-Aware Rendering via Virtual Camera Optimization [14.3] 3D-GSはしばしばリフレクションを仮想空間と誤解し、ミラー内の曖昧で一貫性のないマルチビューレンダリングをもたらす。
本稿では,リフレクションを物理ベース仮想カメラとしてモデル化することで,高品質なマルチビュー一貫したリフレクションレンダリングを実現する手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:53:24 GMT)
MM-LDM: Multi-Modal Latent Diffusion Model for Sounding Video Generation [14.3] 本稿では,新しい多モード潜在拡散モデル(MM-LDM)を提案する。
まず、音声とビデオデータの表現を、それらを1つか2つの画像に変換することによって統一する。
次に,階層型マルチモーダルオートエンコーダを導入し,各モダリティに対する低レベルの知覚潜在空間と共有高レベルの意味的特徴空間を構築する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:32:24 GMT)
TOPFORMER: Topology-Aware Authorship Attribution of Deepfake Texts with Diverse Writing Styles [14.2] 近年のLarge Language Models (LLM) の進歩により、人間の文章と区別しにくい、オープンエンドの高品質なテキストの生成が可能になった。
悪意のある意図を持つユーザは、これらのオープンソース LLM を使用して、有害なテキストや、大規模な偽情報を生成することができる。
この問題を軽減するために、与えられたテキストがディープフェイクテキストであるか否かを判定する計算方法を提案する。
そこで我々はTopFormerを提案し、より言語的なパターンをディープフェイクテキストに取り込み、既存のAAソリューションを改善する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:04:59 GMT)
Smaller Confidence Intervals From IPW Estimators via Data-Dependent Coarsening [14.0] Inverse propensity-score weighted (IPW) 推定器は、観察研究における平均治療効果を推定するための因果推論において一般的である。
本稿では,既存のIPW推定器とその変種をキャプチャするCIPW推定器のファミリーを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:25:26 GMT)
CreDes: Causal Reasoning Enhancement and Dual-End Searching for Solving Long-Range Reasoning Problems using LLMs [14.0] 大規模言語モデル(LLM)は、長距離推論を含む最適化問題に対処する際の限界を実証している。
本稿では、因果関係強化(CRE)機構と個別治療効果(ITE)を組み合わせて、因果関係の確固たる正当性を保証する。
実験により、CreDesは精度と時間効率の両方で既存のState-Of-The-Art(SOTA)ソリューションを著しく上回っていることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:05:01 GMT)
HAMLET: Graph Transformer Neural Operator for Partial Differential Equations [14.0] 本稿では、ニューラルネットワークを用いて偏微分方程式(PDE)を解く際の課題を解決するために、新しいグラフトランスフォーマーフレームワークHAMLETを提案する。
このフレームワークは、モジュラー入力エンコーダを備えたグラフトランスフォーマーを使用して、微分方程式情報をソリューションプロセスに直接組み込む。
特に、HAMLETは、データの複雑さとノイズを増大させ、その堅牢性を示すために、効果的にスケールする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:30:15 GMT)
Semi-Supervised Contrastive VAE for Disentanglement of Digital Pathology Images [13.9] 解離モデルは、潜在空間を解釈可能な部分空間に分解することで解釈可能性を高める。
そこで本研究では,病理画像の最初のアンタングル化法を提案する。
これにより,TIL検出深層学習モデルの解釈性や一般化能力も向上する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:25:40 GMT)
Perceptions of Moderators as a Large-Scale Measure of Online Community Governance [13.8] われわれは18ヶ月で1億9900万件の投稿とコメントをリツイートした。
モデレーターが特に肯定的かつ否定的に知覚されるコミュニティの種類を同定する。
厳格な規制執行は、ニュースコミュニティなど特定のトピックに特化しているコミュニティのモデレーターに対して、他のコミュニティよりも好意的な認識に結びついていることが示される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:59:36 GMT)
HybridFlow: A Flexible and Efficient RLHF Framework [13.8] 人間のフィードバックからの強化学習は、Large Language Model (LLM)アライメントで広く使われている。
従来のRLはデータフローとしてモデル化することができ、各ノードはニューラルネットワーク(NN)の計算を表す。
RLHFデータフローの柔軟な表現と効率的な実行を可能にするために,シングルコントローラとマルチコントローラのパラダイムをハイブリッド方式で組み合わせたHybridFlowを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:01:47 GMT)
HybridFlow: A Flexible and Efficient RLHF Framework [13.8] 人間のフィードバックからの強化学習は、Large Language Model (LLM)アライメントで広く使われている。
従来のRLはデータフローとしてモデル化することができ、各ノードはニューラルネットワーク(NN)の計算を表す。
RLHFデータフローの柔軟な表現と効率的な実行を可能にするために,シングルコントローラとマルチコントローラのパラダイムをハイブリッド方式で組み合わせたHybridFlowを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:01:47 GMT)
LLM-Based Test-Driven Interactive Code Generation: User Study and Empirical Evaluation [13.8] 本稿では,ガイド付き意図明確化のための対話型ワークフローTiCoderを提案する。
コード生成精度を向上させるためのワークフローの有効性を実証的に評価する。
我々は,5つのユーザインタラクション内において,データセットと全LLMのパス@1コード生成精度が平均45.97%向上したことを観察した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 22:34:45 GMT)
Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization [13.8] 本稿では,組込みのクラスワイドな分散に基づく新しいデバイアス正規化手法を提案する。
提案手法は属性ラベルを必要とせず,属性をターゲットとせず,既存のデバイアス手法の欠点に対処する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:15:11 GMT)
Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization [13.8] 本稿では,組込みのクラスワイドな分散に基づく新しいデバイアス正規化手法を提案する。
提案手法は属性ラベルを必要とせず,属性をターゲットとせず,既存のデバイアス手法の欠点に対処する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:15:11 GMT)
Unlabeled Debiasing in Downstream Tasks via Class-wise Low Variance Regularization [13.8] 本稿では,組込みのクラスワイドな分散に基づく新しいデバイアス正規化手法を提案する。
提案手法は属性ラベルを必要とせず,属性をターゲットとせず,既存のデバイアス手法の欠点に対処する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:15:11 GMT)
Polynomial-Time Preparation of Low-Temperature Gibbs States for 2D Toric Code [13.6] 任意の温度で2次元トーリック符号ハミルトニアンのギブス状態を作成するための時間アルゴリズムを提案する。
我々は、デジタル的に実装された低温局所デイヴィス発生器によるリンドブラッド力学が、量子状態を基底状態多様体へ効率的に駆動できることを証明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:18:15 GMT)
TAEGAN: Generating Synthetic Tabular Data For Data Augmentation [13.6] Tabular Auto-Encoder Generative Adversarial Network (TAEGAN)は、高品質な表データを生成するための改良されたGANベースのフレームワークである。
TAEGANは、マスク付きオートエンコーダをジェネレータとして採用し、自己監督型事前学習のパワーを初めて導入した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:33:06 GMT)
TPU as Cryptographic Accelerator [13.4] FHE(Fully Homomorphic Encryption)やZKP(Zero-Knowledge Proofs)のような暗号スキームは、計算の複雑さによってしばしば妨げられる。
本稿では,暗号乗算の高速化にTPU/NPUを活用する可能性について検討し,FHEおよびZKP方式の性能向上を図る。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 22:57:37 GMT)
Dynamical-generative downscaling of climate model ensembles [13.4] 本稿では,動的ダウンスケーリングと生成人工知能を組み合わせることで,コストを削減し,下降した気候予測の不確実性評価を改善する手法を提案する。
このフレームワークでは、RCMはESMの出力を中間分解能に動的にダウンスケールし、次いで生成拡散モデルにより、目標スケールへの分解能をさらに改善する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:31:01 GMT)
Which Algorithms Have Tight Generalization Bounds? [13.4] 我々は、どの機械学習アルゴリズムが厳密な一般化境界を持つかを研究する。
ある種の帰納バイアスが不安定なアルゴリズムは、厳密な一般化境界を認めないことを示す。
我々は、アルゴリズムの損失の条件的分散に、厳密な一般化境界の存在を関連づけた、簡単な特徴付けで結論付ける。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:24:57 GMT)
Adaptively Private Next-Token Prediction of Large Language Models [13.3] プライバシを損なう可能性のあるクエリをフィルタリングする,ノイズの多いスクリーニング機構を導入する。
AdaPMixEDは、元のPMixED上のユーティリティを保持しながら、プライバシ損失を16倍に削減できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:34:24 GMT)
Addition is All You Need for Energy-efficient Language Models [13.1] 浮動小数点乗算器は高い精度で1つの整数加算器で近似することができる。
浮動小数点数乗算と整数加算演算を近似した線形複雑度乗算L-Mulアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:34:12 GMT)
Efficient quantum Gibbs samplers with Kubo--Martin--Schwinger detailed balance condition [13.0] 有限個のジャンプ演算子を用いた効率的な量子ギブスサンプリング器群を開発する。
我々の量子ギブスサンプリングは、同等の量子シミュレーションコストを持つが、設計の柔軟性が向上し、実装とエラー解析がより簡単になる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:51:13 GMT)
Stable Offline Value Function Learning with Bisimulation-based Representations [13.0] 強化学習では、固定目標ポリシーに従って行動を行う際に、各状態から期待される割引リターンを推定するために、オフライン値関数学習を用いる。
状態-作用表現を明示的に形成することにより、値関数学習を安定させることが重要である。
我々は、オフラインポリシー評価(KROPE)のためのカーネル表現と呼ばれるシミュレーションベースのアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:13:25 GMT)
KeyVisor -- A Lightweight ISA Extension for Protected Key Handles with CPU-enforced Usage Policies [13.0] KeyVisorは軽量のISA拡張で、暗号化キーの処理をCPUに安全にオフロードする。
KeyVisorの直接CPU統合は、高速な暗号操作とハードウェア強化されたキー使用制限を可能にする。
Rocket ChipをベースとしてKeyVisor for RISC-Vを実装し,その性能を評価し,実世界のユースケースを実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:31:18 GMT)
Minimax Signal Detection in Sparse Additive Models [12.5] 信号検出問題について検討し、スパース加算信号検出のためのミニマックス分離率を確立する。
推定理論とは異なり、ミニマックス分離速度はスパーシティと関数空間の選択の間の非自明な相互作用を明らかにする。
疎度と滑らか度の両方への適応性は、ソボレフ空間の設定において研究される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:38:48 GMT)
Phase-coding quantum-key-distribution system based on Sagnac-Mach-Zehnder interferometers [12.5] そこで我々は,Sagnac-Mach-Zehnder干渉計に基づく分極非感光位相符号化QKDシステムを提案する。
QKDシステムの堅牢性と長期安定性は、12.6-dBチャネル上での10日間の連続運転によって確認される。
10dBの典型的なチャネル損失に対するQKDシステムの安全な鍵レートは6.89kbpsに達し、達成可能な最大伝送距離は125kmを超える。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:07:45 GMT)
Large Language Models as Zero-Shot Human Models for Human-Robot Interaction [12.5] 大型言語モデル(LLM)は、人間とロボットの相互作用のためのゼロショット人間モデルとして機能する。
LLMは目的のモデルに匹敵する性能を達成する。
シミュレーションされた信頼に基づくテーブルクリーニングタスクのケーススタディを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:57:37 GMT)
Extract, Define, Canonicalize: An LLM-based Framework for Knowledge Graph Construction [12.5] 抽出・デファイン・カノニケーズ(EDC)という3相フレームワークを提案する。
EDCはフレキシブルで、事前に定義されたターゲットスキーマが利用可能で、そうでない場合に適用される。
EDCがパラメータチューニングなしで高品質な三重項を抽出できることを実証する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 05:51:53 GMT)
Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models [12.4] 本研究では,非英語言語における目標課題に対するLLM(Large Language Models)の微調整の難しさに対処するモデルマージ手法を提案する。
我々は、英語の数学の命令データと対象言語の汎用的な命令データに「専門家」を微調整する。
我々は、数学の専門家の上位と下位のトランスフォーマー層を直接言語専門家の層に置き換え、それによって対象言語の数学性能が向上する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:53:07 GMT)
ENTP: Encoder-only Next Token Prediction [12.4] 次世代の予測モデルは、主に因果的注意を持つデコーダのみのトランスフォーマーに依存している。
この設計選択は、必要ではなく効率性に関するものだ、と私たちは主張する。
デコーダのみのトランスフォーマーは、実際的な理由から依然として良い選択だが、唯一の選択肢ではない。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:39:13 GMT)
TabKANet: Tabular Data Modeling with Kolmogorov-Arnold Network and Transformer [12.2] TabKANetは数値コンテンツから学習するモデルである。
ニューラルネットワーク(NN)と比較してパフォーマンスが優れている。
私たちのコードはGitHubで公開されています。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:22:48 GMT)
Provably Accurate Shapley Value Estimation via Leverage Score Sampling [12.2] 本稿では,Kernel SHAP の軽量な修正である Leverage SHAP を紹介する。
提案手法は,強力な回帰ツールであるレバレッジスコアサンプリングを用いて,シェープ値の推定とアクティブラーニングの関連性を利用する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:15:48 GMT)
Optimal Rates for $O(1)$-Smooth DP-SCO with a Single Epoch and Large Batches [12.2] 相関凸最適化(SCO)問題を再考する。
DP-SCO(ポリログ因子まで)の最適速度を1つのエポックで達成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:14:30 GMT)
Unlocking the Power of GANs in Non-Autoregressive Text Generation [12.2] NAR構造に基づく構築言語GANの先駆的研究を行う。
GANに基づく非自己回帰変換器(ANT)モデルを提案する。
実験の結果、ANTはメインストリームモデルと同等のパフォーマンスを単一のフォワードパスで達成できることが示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:35:36 GMT)
A Comprehensive Graph Pooling Benchmark: Effectiveness, Robustness and Generalizability [12.2] 我々は、17のグラフプーリング方法と28のグラフデータセットを含む包括的なベンチマークを構築した。
このベンチマークは3次元のグラフプーリング法の性能を体系的に評価する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:24:50 GMT)
3DGS-DET: Empower 3D Gaussian Splatting with Boundary Guidance and Box-Focused Sampling for 3D Object Detection [12.1] 本稿では,3DGSを初めて3DODに導入し,主な課題を2つ挙げる。
2次元境界ガイダンスを組み込んだエレガントで効率的なソリューションを提案する。
また,3次元空間におけるオブジェクトの確率分布を生成するために2次元ボックスを用いたBox-Focused Smpling戦略を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:15:52 GMT)
Augmenting Offline Reinforcement Learning with State-only Interactions [12.1] バッチオフラインデータは強化学習に非常に有用であることが示されている。
本稿では,環境との相互作用が可能であるが,観測に限られる新たな機会について考察する。
その結果、学習者はオフラインデータをよく理解し、状態遷移をクエリする効率的なスキームを合成する必要がある。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:24:50 GMT)
ShapeGraFormer: GraFormer-Based Network for Hand-Object Reconstruction from a Single Depth Map [11.9] そこで本研究では, 現実的な3次元物体形状に対する最初のアプローチを提案し, 一つの深度マップから復元する。
我々のパイプラインは、入力されたボキセル化深度に1対1のマッピングを持つ、ボキセル化ハンドオブジェクト形状も予測する。
さらに、手動オブジェクトの相互作用に基づいて再構成された形状を洗練する別のGraFormerコンポーネントを追加する影響を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 07:54:07 GMT)
SurgeoNet: Realtime 3D Pose Estimation of Articulated Surgical Instruments from Stereo Images using a Synthetically-trained Network [11.9] ステレオVRビューから手術器具を正確に検出・追跡するためのリアルタイムニューラルネットワークパイプラインであるSurgeoNetを提案する。
StoroNetは、YOLOやTransformersのような最先端のニューラルネットワークアーキテクチャ設計にインスパイアされている。
本稿では,SurgeoNetの現実シナリオにおける一般化能力を実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:40:27 GMT)
LLM-Augmented Symbolic Reinforcement Learning with Landmark-Based Task Decomposition [11.8] 強化学習(RL)の基本的な課題の1つは、複雑なタスクを受け取り、RLエージェントがより簡単に学習できるサブタスクに分解できることである。
本稿では,複雑なタスクを解くために,与えられた正の軌道と負の軌道を用いてサブタスクを識別する作業について報告する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:22:42 GMT)
ViC-MAE: Self-Supervised Representation Learning from Images and Video with Contrastive Masked Autoencoders [11.7] ViC-MAEはMasked AutoEncoders(MAE)とコントラスト学習を組み合わせたモデルである。
ViC-MAEで学習した視覚表現は、映像分類と画像分類の両方によく当てはまる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:58:04 GMT)
Advancing Event Causality Identification via Heuristic Semantic Dependency Inquiry Network [11.7] 事象因果同定(ECI)は、テキスト中の事象間の因果関係を抽出することに焦点を当てている。
ECIのためのシンプルで効果的なセマンティック依存問い合わせネットワークSemDIを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:14:17 GMT)
Advancing Event Causality Identification via Heuristic Semantic Dependency Inquiry Network [11.7] 事象因果同定(ECI)は、テキスト中の事象間の因果関係を抽出することに焦点を当てている。
ECIのためのシンプルで効果的なセマンティック依存問い合わせネットワークSemDIを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:14:17 GMT)
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization [11.6] オフライン強化学習(RL)は、事前に収集されたデータセットから効果的なポリシーを学習する能力において、大きな注目を集めている。
MARLは、大きな結合状態-作用空間とマルチエージェントの振る舞いの複雑さにより、さらなる課題を提起する。
定常分布空間に正規化器を導入し、分布シフトをよりよく処理する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:56:10 GMT)
EVA-Gaussian: 3D Gaussian-based Real-time Human Novel View Synthesis under Diverse Camera Settings [11.2] EVA-Gaussianは、多様なカメラ設定にまたがる3D人間の新しいビュー合成のためのリアルタイムパイプラインである。
本稿では,ソース画像から各3次元ガウスの位置を正確に推定するために,EVA (Efficient Cross-View Attention) モジュールを提案する。
我々は3次元ガウス属性と人間の顔のランドマークの両方に強力なアンカー損失関数を組み込んだ。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:23:08 GMT)
Toward a Holistic Evaluation of Robustness in CLIP Models [11.1] 対照的な言語-画像事前学習(CLIP)モデルは、ゼロショット分類において有意な可能性を示している。
この作業は、いくつかの新しい視点を導入することで、より包括的なCLIPの評価を提供することを目的としている。
それぞれの側面において、モデルアーキテクチャ、トレーニング配布、トレーニングセットサイズ、微調整、コントラスト損失、テストタイムプロンプトの6つの要因がCLIPモデルに与える影響を検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:26:17 GMT)
Panopticus: Omnidirectional 3D Object Detection on Resource-constrained Edge Devices [11.1] 全方位ビューによる3Dオブジェクト検出は、移動ロボットナビゲーションのような安全クリティカルなアプリケーションを可能にする。
Panopticusは、エッジデバイス上の全方位およびカメラベースの3D検出システムである。
Panopticusは33msの厳密な遅延目標から平均62%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:28:32 GMT)
Unifying the Scope of Bridging Anaphora Types in English: Bridging Annotations in ARRAU and GUM [10.9] 我々は,GUM,GENTLE,ARRAUコーパスに注釈付けされたブリッジインスタンスについて,ガイドラインと解釈可能な予測モデルを用いて比較を行った。
我々は,GUM,GENTLE,ARRAU Wall Street Journalの各テストセットの調和したサブカテゴリ化バージョンを公開し,ドメイン間のブリッジ解像度の有意義で信頼性の高い評価を促進する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:56:28 GMT)
Lost-in-Distance: Impact of Contextual Proximity on LLM Performance in Graph Tasks [10.9] 大規模言語モデルでは,意味のある文脈データを効率的に取得・処理する能力に障害のある盲点が示される。
本研究では, 損失-in-distance現象の定式化を提案し, 損失-in-distance現象と損失-in-the middle現象が独立に発生することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:45:19 GMT)
Joint Graph Rewiring and Feature Denoising via Spectral Resonance [10.9] グラフ学習では、グラフとノードの特徴の両方が、ノードラベルに関するノイズの多い情報を含んでいる。
本稿では,下流ノード分類の性能を向上させるJDR(Joint Denoising and Rewiring)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:45:53 GMT)
Collaborative Performance Prediction for Large Language Models [10.8] 我々は、新しいフレームワーク、協調的パフォーマンス予測を導入する。
様々なモデルの歴史的性能を活用することで予測精度を大幅に向上させる。
また、過去のパフォーマンスと追加設計要素の両方を含むオンラインプラットフォームからのコラボレーティブデータを収集する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:41:02 GMT)
Toward Zero-Shot Learning for Visual Dehazing of Urological Surgical Robots [10.8] 尿道下尿道外科ロボットでは、液体環境で働く必要がある。
これにより、せん断加熱時に液体が蒸発し、泡の微粒化が起こる。
外科手術用ロボットビジョンのための教師なしゼロショット脱ヘイズ法(RSF-Dehaze)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:16:42 GMT)
Scrutinize What We Ignore: Reining In Task Representation Shift Of Context-Based Offline Meta Reinforcement Learning [10.8] オフラインメタ強化学習(OMRL)は、相互作用回避と強力な一般化性能のための有望なアプローチとして登場した。
従来のコンテキストベースのアプローチは、コンテキストエンコーダとポリシーの最適化がパフォーマンス改善につながるという直感に依存しています。
タスク表現のシフトを抑えることで、パフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:40:06 GMT)
VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka [10.8] VoxHakka(ヴォックスハッカ、VoxHakka)は、台湾の言語であるHakka向けに設計された音声合成システムである。
VoxHakkaは音声合成における自然性と精度,低リアルタイム化を実現している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:25:30 GMT)
VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka [10.8] VoxHakka(ヴォックスハッカ、VoxHakka)は、台湾の言語であるHakka向けに設計された音声合成システムである。
VoxHakkaは音声合成における自然性と精度,低リアルタイム化を実現している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:25:30 GMT)
Spoken Grammar Assessment Using LLM [10.8] 音声言語評価システム(SLA: Spoken Language Assessment)は, 話者の発音と口頭流速を分析し, 読み上げ音声と自発音声をそれぞれ分析する。
ほとんどのWLAシステムは、キュレートされた有限サイズの文データベースから一連の文を表示し、テスト質問を予測し、自分自身を訓練することができる。
音声音声から言語文法を評価するための新しいエンドツーエンドSLAシステムを提案し、WLAシステムを冗長にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:15:13 GMT)
COMUNI: Decomposing Common and Unique Video Signals for Diffusion-based Video Generation [10.8] ビデオは連続して動く物体を記録するので、隣接するビデオフレームには共通点(類似物体の外観)と特異点(わずかに変化した姿勢)がある。
我々は,COMmon と UNIque の映像信号を分解して効率的な映像生成を実現する,COMUNI という新しい拡散型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:30:08 GMT)
Decorrelation-based Self-Supervised Visual Representation Learning for Writer Identification [10.6] 本稿では,自己教師型学習のデコリレーションに基づくパラダイムを探求し,著者識別のための不整合脳卒中の特徴の学習に適用する。
提案手法は,著者識別ベンチマークにおいて,現代の自己教師型学習フレームワークよりも優れていることを示す。
我々の知る限り、本研究は、著者検証タスクの学習表現に自己教師付き学習を適用した最初のものである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:43:58 GMT)
See Me and Believe Me: Causality and Intersectionality in Testimonial Injustice in Healthcare [10.4] 我々は、因果発見を用いて、特定の人口統計学的特徴が証言の不正につながる程度を調査する。
貢献する1つの特徴は、証言の不正を他の貢献者が経験する傾向を増す。
この研究は、因果発見を用いて、医療現場における患者のニュアンスな経験を理解するための最初の試みである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 04:10:55 GMT)
Towards a Law of Iterated Expectations for Heuristic Estimators [10.3] 本研究では,推定器が自身の誤りを予測できないという非公式の原理を論じる。
理想的な推定器はこの静脈の2つのより強い性質を満たすべきであると論じる。
別のアプローチとして *accuracy*:$mathbbG(Y mid pi)$ が数学的表現の分布上の平均誤差をゼロとする性質を探求する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:33:27 GMT)
MALLM-GAN: Multi-Agent Large Language Model as Generative Adversarial Network for Synthesizing Tabular Data [10.2] 大規模言語モデル(LLM)を用いた合成(語彙)データを生成するフレームワークを提案する。
提案手法は, サンプルサイズが小さい一般的なシナリオにおいて, 合成データ生成の品質を著しく向上させる。
以上の結果から,本モデルは下流タスクにおける高品質な合成データを生成する上で,実際のデータのプライバシを維持しつつ,いくつかの最先端モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:27:16 GMT)
Fitting an ellipsoid to a quadratic number of random points [10.2] 問題 $(mathrmP)$ が $n$ の標準ガウス確率ベクトルを $mathbbRd$ で中心楕円体の境界に収まることを $n, d to infty$ とみなす。
任意の$varepsilon > 0$ に対して、$n leq (1 - varepsilon) d2 / 4$ ならば、$(mathrmP)$ は高い確率の解を持つ。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:13:40 GMT)
DLP-LoRA: Efficient Task-Specific LoRA Fusion with a Dynamic, Lightweight Plugin for Large Language Models [10.2] 大規模言語モデル(LLM)は様々なタスクで堅牢なパフォーマンスを実現していますが、これらのモデルを特定のドメイン向けに微調整することはリソース集約的です。
5Mパラメータしか持たないミニMLPモジュールを提案し、トップpサンプリング戦略を用いて文レベルで複数のLoRAを動的に融合する。
このアプローチは、並列計算を利用することで、単一のLoRA推論の2倍未満まで推論時間を短縮する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:45:52 GMT)
Closed-loop Diffusion Control of Complex Physical Systems [10.2] 物理系制御のための効率的な閉ループ拡散法(CL-DiffPhyCon)を提案する。
CL-DiffPhyConは、異なる物理時間ステップに非同期なdenoisingフレームワークを使用することで、環境からリアルタイムでフィードバックされた制御信号を生成する。
CL-DiffPhyConを1次元バーガースの方程式制御と2次元非圧縮性流体制御の2つのタスクで評価した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:45:11 GMT)
CrowdCounter: A benchmark type-specific multi-target counterspeech dataset [10.1] 我々は3,425のヘイトスピーチ対を含む新しいデータセット、CrowdCounterを紹介した。
アノテーションプラットフォーム自体の設計は、アノテーションに対して、タイプ固有の、非冗長で高品質なカウンター音声を書くことを奨励します。
バニラとタイプ制御プロンプトという,対音声応答を生成する2つのフレームワークを評価する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:24:51 GMT)
MedQA-CS: Benchmarking Large Language Models Clinical Skills Using an AI-SCE Framework [9.7] 医学教育の客観的構造化臨床検査(OSCE)に触発されたAI-SCEフレームワークであるMedQA-CSを紹介する。
コントリビューションには、公開データとエキスパートアノテーションを備えた総合的な評価フレームワークであるMedQA-CSの開発が含まれている。
実験の結果,MedQA-CSは,従来のマルチ選択QAベンチマークよりも,臨床スキルを評価する上で困難なベンチマークであることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:47:17 GMT)
House of Cards: Massive Weights in LLMs [9.7] 隠れ状態の特定の特徴次元に現れる大量活性化は、大きな言語モデル(LLM)に顕著なバイアスをもたらす
本稿では,初期層におけるフィードフォワードネットワークモジュールの中間状態ではなく,隠れ状態から大量のアクティベーションが生じることを確認した。
そこで本研究では,パラメータ効率の良い微調整を行う際の重みを少なくするため,MacDropと呼ばれる簡単なプラグアンドプレイ方式を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:54:21 GMT)
A Synthesis of Green Architectural Tactics for ML-Enabled Systems [9.7] ML対応システムのための30のグリーンアーキテクチャ戦略のカタログを提供する。
アーキテクチャ戦術は、ソフトウェア品質を改善するための高度な設計手法である。
透明性を高め、その普及を促進するため、我々はオンラインで簡単に消費可能なフォーマットで戦術を利用できるようにした。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:42:53 GMT)
Leveraging MTD to Mitigate Poisoning Attacks in Decentralized FL with Non-IID Data [9.7] 本稿では,DFLモデルのロバスト性を高めるため,移動目標防衛(MTD)アプローチを用いたフレームワークを提案する。
この枠組みはDFLシステムの攻撃面を継続的に修正することにより、効果的に中毒攻撃を緩和することを目的としている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:03:51 GMT)
Leveraging MTD to Mitigate Poisoning Attacks in Decentralized FL with Non-IID Data [9.7] 本稿では,DFLモデルのロバスト性を高めるため,移動目標防衛(MTD)アプローチを用いたフレームワークを提案する。
この枠組みはDFLシステムの攻撃面を継続的に修正することにより、効果的に中毒攻撃を緩和することを目的としている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:03:51 GMT)
Segment Any Text: A Universal Approach for Robust, Efficient and Adaptable Sentence Segmentation [9.7] この問題を解決するために、新しいモデル、Segment any Text (SaT)を導入します。
頑健性を高めるため,句読点への依存度を低くする事前学習方式を提案する。
適応性に対処するために、パラメータ効率の良い微調整の余分な段階を導入し、異なる領域で最先端の性能を確立する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:04:17 GMT)
MallowsPO: Fine-Tune Your LLM with Preference Dispersions [9.7] 直接選好最適化(DPO)は、人間のフィードバックによる強化学習を改善するための一般的なアプローチとして現れている。
Mallowsの選好ランク理論に触発されて、我々は新しいアプローチであるMallowsPOを開発した。
このアプローチの際立った特徴は、人選好のプロンプトへの分散を反映する分散指標である。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:56:33 GMT)
CodeMMLU: A Multi-Task Benchmark for Assessing Code Understanding Capabilities of CodeLLMs [9.6] 提案するCodeMMLUは,CodeLLMにおけるソフトウェア深度とコード理解度を評価するためのベンチマークである。
CodeMMLUには、コード分析、欠陥検出、ソフトウェアエンジニアリング原則といったタスクを含む、さまざまなドメインからソースされた10,000以上の質問が含まれている。
評価の結果,最先端モデルでさえ,CodeMMLUでは重大な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:04:02 GMT)
Run-time Observation Interventions Make Vision-Language-Action Models More Visually Robust [9.6] 視覚言語アクション(VLA)モデルは、大規模なインターネットデータとロボットのデモンストレーションに基づいて訓練され、汎用的なロボットポリシーとして機能する可能性がある。
本稿では,入力画像の領域を動的に識別するリアルタイム介入方式である bring Your Own VLA (BYOVLA) を紹介する。
我々は,BYOVLAが最先端のVLAモデルに対して,邪魔な対象や背景が存在する場合に,その名目上の性能をほぼ維持できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:29:24 GMT)
DyMix: Dynamic Frequency Mixup Scheduler based Unsupervised Domain Adaptation for Enhancing Alzheimer's Disease Identification [9.5] 教師なしドメイン適応のための動的周波数混合スケジューラ(DyMix)を提案する。
提案するDyMixは、ソース領域とターゲット領域とを混合した周波数領域の大きさを調整する。
アルツハイマー病の診断において,最先端の方法と比較して優れた成績を示した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 07:18:47 GMT)
CHASE-SQL: Multi-Path Reasoning and Preference Optimized Candidate Selection in Text-to-SQL [9.5] CHASE-は、マルチエージェントモデリングにおけるテスト時間計算を用いて、候補生成と選択を改善する革新的な戦略を利用する新しいフレームワークである。
最適な候補を特定するために、選別エージェントを用いて、微調整された二項候補選択LLMとのペア比較により候補をランク付けする。
提案したCHASE-は、BIRD Text-to- datasetベンチマークのテストセットと開発セットにおいて、73.0%と73.01%の最先端実行精度を実現している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:41:35 GMT)
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.4] 医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:52:30 GMT)
Signal Adversarial Examples Generation for Signal Detection Network via White-Box Attack [9.3] 本稿では,信号検出ネットワークのための信号対逆例生成モデルを定義する。
信号摂動エネルギー比が3%未満の制約下では, 平均精度が28.1%低下した。
等価強度のランダムノイズ摂動と比較して,我々の対向攻撃は大きな攻撃効果を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:05:43 GMT)
Auto-conditioned primal-dual hybrid gradient method and alternating direction method of multipliers [9.3] 線形サーチ手順は、双線形サドル点問題に対する原始双対法でよく用いられる。
双線形サドル点問題を解くのに最適な複雑性を実現するために, 自動条件付きプライマリ・デュアル・ハイブリッド勾配法(AC-PDHG)を導入する。
また、目的と制約の両方が2つの部分に分解される線形制約問題の重要なクラスについても検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:36:09 GMT)
TACOS: Topology-Aware Collective Algorithm Synthesizer for Distributed Machine Learning [9.2] 本稿では,トポロジ対応集団アルゴリズムを自動生成する自律合成器TACOSを提案する。
TACOSは非常に柔軟で、不均一な128-NPUシステムのAll-Reduceアルゴリズムを1.08秒で合成する。
最先端の合成装置よりも4.27倍の性能向上を実現している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:15:05 GMT)
ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding [9.1] 本稿では、並列ミキサーとスパースチャネル注意パッチ埋め込み(SCAPE)を組み込んだ視覚変換器であるParFormerを紹介する。
ParFormerは、畳み込み機構とアテンション機構を組み合わせることで、特徴抽出を改善する。
エッジデバイスのデプロイメントでは、ParFormer-Tのスループットは278.1イメージ/秒で、EdgeNeXt-Sよりも1.38ドル高い。
より大型のParFormer-Lは83.5%のTop-1精度に達し、精度と効率のバランスの取れたトレードオフを提供する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 03:46:17 GMT)
Boosting Hyperspectral Image Classification with Gate-Shift-Fuse Mechanisms in a Novel CNN-Transformer Approach [9.0] 本稿では,GSFブロックと変圧器ブロックの2つの畳み込みブロックを含むHSI分類モデルを提案する。
GSFブロックは局所的および大域的空間スペクトルの特徴の抽出を強化するように設計されている。
HSI立方体からの情報の抽出を促進するために,効果的な注意機構モジュールも提案されている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:00:18 GMT)
Boosting Hyperspectral Image Classification with Gate-Shift-Fuse Mechanisms in a Novel CNN-Transformer Approach [9.0] 本稿では,GSFブロックと変圧器ブロックの2つの畳み込みブロックを含むHSI分類モデルを提案する。
GSFブロックは局所的および大域的空間スペクトルの特徴の抽出を強化するように設計されている。
HSI立方体からの情報の抽出を促進するために,効果的な注意機構モジュールも提案されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:00:18 GMT)
Automated Red Teaming with GOAT: the Generative Offensive Agent Tester [8.9] Red Teamingは、安全トレーニング中に設定された規範やポリシー、ルールに違反したコンテンツを、大規模な言語モデルがいかに生成できるかを評価する。
文献における既存の自動化手法のほとんどは、人間がAIモデルと対話する傾向を示すものではない。
本稿では,非言語的会話をシミュレートする自動エージェントレッド・チーム・システムであるジェネレーティブ・オッサンティブ・エージェント・テスタ(GOAT)を紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:47:05 GMT)
Language-centered Human Activity Recognition [8.9] Inertial Measurement Unit(IMU)センサーを用いたHAR(Human Activity Recognition)は、医療、安全、産業生産における応用において重要である。
アクティビティパターン、デバイスタイプ、センサー配置の変化は、データセット間の分散ギャップを生成する。
本稿では,センサの読み書きとアクティビティラベルのセマンティック解釈を生成するシステムであるLanHARを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:04:02 GMT)
Finetuning Pre-trained Model with Limited Data for LiDAR-based 3D Object Detection by Bridging Domain Gaps [8.9] LiDARベースの3Dオブジェクト検出器は、センサーの設定が異なるターゲットドメインにうまく適応できないことが多い。
近年の研究では、トレーニング済みのバックボーンは大規模でラベルのないLiDARフレームで自己管理的に学習できることが示唆されている。
本研究では,対象データに制限のある事前学習モデルを適用するために,DADT(Domain Adaptive Distill-Tuning)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:22:42 GMT)
An LLM Feature-based Framework for Dialogue Constructiveness Assessment [8.9] 対話構築性評価に関する研究は、(i)個人が特定の行動をとること、議論に勝つこと、視点を変えること、またはオープンマインドネスを広げること、および(ii)そのような事例に対する対話に続く構成性の結果を予測することに焦点を当てている。
これらの目的は、解釈可能な特徴ベースモデルか、事前訓練された言語モデルのようなニューラルモデルのいずれかをトレーニングすることで達成できる。
特徴ベースとニューラルアプローチの強みを組み合わせた対話構築性評価のためのLLM特徴ベースフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:03:16 GMT)
High-Fidelity SLAM Using Gaussian Splatting with Rendering-Guided Densification and Regularized Optimization [8.8] 本稿では,3次元ガウススプラッティングに基づく高密度RGBD SLAMシステムを提案する。
近年のニューラルかつ並列に開発されたガウススプラッティング RGBD SLAM ベースラインと比較して,本手法は合成データセット Replica の最先端結果と実世界のデータセット TUM の競合結果を得る。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:00:48 GMT)
Simplified Mamba with Disentangled Dependency Encoding for Long-Term Time Series Forecasting [8.8] 本稿では,予測精度の向上に不可欠な3つの重要な依存関係を特定し,正式に定義する。
本稿では,アンタングル化された依存性エンコーディングを備えた単純化されたMambaであるSAMBAを提案する。
9つの実世界のデータセットの実験は、最先端の予測モデルに対するSAMBAの有効性を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:27:24 GMT)
Quo Vadis RankList-based System in Face Recognition? [8.7] 合理的なLogit-Cohort Selection (LoCoS) により, RankList ベースの関数の性能を大幅に改善できることを示す。
難解な2つの顔認識データセットの実験により,提案手法の性能向上が示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:46:18 GMT)
Sum-of-Parts: Faithful Attributions for Groups of Features [8.7] Sum-of-Parts(SOP)は、任意の差別化可能なモデルを、機能群に起因する予測を持つ自己説明モデルに変換するフレームワークである。
SOPは、ImageNetとCosmoGridの忠実度指標に関して高いスコアを得ながら、最高のパフォーマンスを達成する。
我々は,SOPが学習したグループの有用性を,高い純度,強い人間区別能力,科学的発見における実用性を通じて検証した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:37:28 GMT)
Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case [8.3] 本研究では,人間の行動認識(HAR)に骨格と視覚的手がかりをベースとした新しいアプローチを提案する。
特徴表現を最適化するために,スケルトンモダリティを条件とした言語モデルに対して学習可能なプロンプトを用いる。
建設現場における実世界のロボット応用に適した新しいデータセットを導入し,視覚,骨格,深度データモダリティを特徴とする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:10:23 GMT)
Off-policy Evaluation with Deeply-abstracted States [8.2] オフポリシー評価(OPE)は、デプロイ前にターゲットポリシーの影響をオフラインに評価するために不可欠である。
大規模な状態空間において正確なOPEを実現することは依然として困難である。
本稿では、OPEの文脈における状態抽象化(もともとポリシー学習用に設計された)について研究する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:22:51 GMT)
GLOCALFAIR: Jointly Improving Global and Local Group Fairness in Federated Learning [8.0] フェデレートラーニング(FL)は、データプライバシを犠牲にすることなく、クライアント間で共有モデルを共同で学習するための、将来的なソリューションとして登場した。
FLは、データの不均一性やパーティーの選択など、固有のFL特性のために、特定の人口集団に対してバイアスを受ける傾向にある。
クライアントのプライベートデータセットに関する詳細な統計を必要とせずに,グローバルおよびローカルグループフェアネスを改善するクライアントサーバのコードサインであるGFAIRを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:13:27 GMT)
Deep learning assisted high resolution microscopy image processing for phase segmentation in functional composite materials [8.0] 本研究は、トレーニングされたU-Netセグメンテーションモデルを用いて、生高分解能電子顕微鏡(TEM)画像から成分と位相セグメンテーションを検出する新しいワークフローを提案する。
開発したモデルでは、成分の検出と位相セグメンテーションの迅速化が可能であり、広範囲なTEM画像の精査に伴う時間的・認知的要求を低減できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:22:04 GMT)
Improving Fuzzy Rule Classifier with Brain Storm Optimization and Rule Modification [7.9] 本研究では,ブレインストーム最適化(BSO)アルゴリズムを用いて,糖尿病分類の課題を具体的に解決する。
指数モデルが標準BSOアルゴリズムに統合され、糖尿病関連データに特化された規則導出が強化される。
このファジィシステムは、糖尿病データセットを含む分類タスクに適用され、分類精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:48:23 GMT)
Equivariant score-based generative models provably learn distributions with symmetries efficiently [7.9] 実験的な研究により、対称性を生成モデルに組み込むことで、より優れた一般化とサンプリング効率が得られることが示されている。
我々は,ある群対称性に対して不変な分布を学習するためのスコアベース生成モデル(SGM)の最初の理論的解析と保証を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:14:28 GMT)
Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Making [7.9] 逐次的意思決定問題に対する教師付き事前学習型変換器について検討する。
このような構造は、事前学習フェーズにおける最適なアクション/決定の使用を可能にする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:45:50 GMT)
Small Language Models Like Small Vocabularies: Probing the Linguistic Abilities of Grapheme- and Phoneme-Based Baby Llamas [7.6] 我々は,Llamaアーキテクチャに基づく小型モデルは,標準構文および新しい語彙/音声のベンチマークにおいて,強力な言語性能が得られることを示す。
本研究は,言語習得と処理の計算研究に適する言語学的に妥当な言語モデルを作成するための,有望な方向性を示唆するものである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:36:08 GMT)
What is "Typological Diversity" in NLP? [7.6] いくつかの軸に沿って言語選択の多様性を近似する指標を導入する。
歪んだ言語選択は、過度に見積もられた多言語のパフォーマンスをもたらす可能性があることを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:27:36 GMT)
Towards Futuristic Autonomous Experimentation--A Surprise-Reacting Sequential Experiment Policy [7.5] 製造における自律的な実験プラットフォームは、それ自体で適切な製造条件のシーケンシャルな探索や、人間の介入を最小限に抑えた新しい材料発見を行うことができると考えられている。
このようなプラットフォームのインテリジェントな制御の中核は、これまで何をしてきたかに基づいて、次の実験の実施場所を決定する政策である。
我々は、過去の観測と関連する驚きの要素と度合いを計測することで、搾取と探検のトレードオフが有益かどうかを論じる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:17:56 GMT)
Deep Unlearn: Benchmarking Machine Unlearning [7.5] 機械学習(MU)は、訓練された機械学習モデルの学習可能なパラメータから、特定のデータポイントの影響を取り除くことを目的としている。
本稿では,様々なベンチマークデータセットおよびモデルを対象とした18種類の最先端MU手法について検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:41:58 GMT)
Polyp-SES: Automatic Polyp Segmentation with Self-Enriched Semantic Model [7.4] 本稿では,既存手法の制約に対処するため,自己富化セマンティックモデルを用いたAutomatic Polypを提案する。
まず、入力画像から一連の特徴を抽出し、ハイレベルな特徴をデコードし、初期セグメンテーションマスクを生成する。
提案する自己富化セマンティックモジュールを用いて,潜在的なセマンティクスを検索し,さらにセマンティクスを付加することで,コンテキスト理解のモデルを支援する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:34:23 GMT)
Does Graph Prompt Work? A Data Operation Perspective with Theoretical Analysis [7.3] 本稿では,データ操作の観点からグラフのプロンプトを厳密に解析する理論的枠組みを提案する。
グラフ変換演算子に近似する能力を示す形式的保証定理を提供する。
グラフプロンプトによってこれらのデータ操作の誤差の上限を導出し、この議論をグラフのバッチに拡張する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:07:13 GMT)
Quantum-data-driven dynamical transition in quantum learning [7.3] 量子ニューラルネットワーク(QNN)は、短期的に量子優位を達成するためのパラダイムを提供する。
我々は、目標値とデータがトレーニングの指数収束を決定する量子データ駆動の動的遷移を明らかにする。
我々は、一般化された制限されたハールアンサンブルによる遷移を説明する非摂動理論を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:58:02 GMT)
UI-JEPA: Towards Active Perception of User Intent through Onscreen User Activity [7.3] UI-JEPAは、ラベルのないデータから抽象的なUI埋め込みを学ぶためにマスキング戦略を使用する新しいフレームワークである。
Intent in the Wild" (IIW) と "Intent in the Tame" (IIT) という2つの新しいマルチモーダルデータセットを導入する。
IIWは219カテゴリーの1.7Kビデオで構成され、IITは10カテゴリの914ビデオを含んでいる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:00:57 GMT)
Text2PDE: Latent Diffusion Models for Accessible Physics Simulation [7.2] 物理シミュレーションに潜時拡散モデルを適用する方法をいくつか紹介する。
提案手法は、現在のニューラルPDEソルバと、精度と効率の両面で競合することを示す。
スケーラブルで正確で使用可能な物理シミュレータを導入することで、ニューラルPDEソルバを実用化に近づけたいと思っています。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:09:47 GMT)
Quantum annealing versus classical solvers: Applications, challenges and limitations for optimisation problems [7.1] 我々はD-Waveのハイブリッド・ソルバを業界主導のソルバと比較した。
その結果、D-Waveの解法は整数二次目的関数に対して最も有利であることが示唆された。
D-Waveはそのような問題を解決することができるが、その性能は従来のものとはまだ一致していない。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:02:51 GMT)
Document Type Classification using File Names [7.1] 迅速な文書分類は、デジタル法医学や大規模メディア分類といった、時間に敏感ないくつかの応用において重要である。
重厚なディープラーニングモデルに依存する従来のアプローチは、膨大な入力データセットよりも高い推論時間のために不足している。
本稿では、TF-IDF特徴抽出に基づくトークン化手法と組み合わせ、軽量教師付き学習モデルを用いた手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:42:19 GMT)
Sparse Autoencoders Reveal Temporal Difference Learning in Large Language Models [7.1] インコンテキスト学習(In-context learning)は、入力プロンプトのいくつかの例に基づいて適応する能力であり、大きな言語モデル(LLM)のユビキタスな特徴である。
最初に、Llamaが$70$Bで、コンテキスト内で単純なRL問題を解くことができることを示す。
次に、スパースオートエンコーダ(SAE)を用いてLlamaの残差ストリームを分析し、時間差(TD)誤差によく一致する表現を求める。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:51:12 GMT)
Fusion is all you need: Face Fusion for Customized Identity-Preserving Image Synthesis [7.1] テキスト・ツー・イメージ(T2I)モデルは人工知能の開発を著しく進歩させてきた。
しかし、既存のT2Iベースの手法は、参照画像から個人を正確に再現するのに苦労することが多い。
我々は、安定拡散から得られた事前学習されたUNetを利用して、対象の顔画像を直接生成プロセスに組み込む。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:56:31 GMT)
Fusion is all you need: Face Fusion for Customized Identity-Preserving Image Synthesis [7.1] テキスト・ツー・イメージ(T2I)モデルは人工知能の開発を著しく進歩させてきた。
しかし、既存のT2Iベースの手法は、参照画像から個人を正確に再現するのに苦労することが多い。
我々は、安定拡散から得られた事前学習されたUNetを利用して、対象の顔画像を直接生成プロセスに組み込む。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:56:31 GMT)
Racing Thoughts: Explaining Large Language Model Contextualization Errors [7.1] 本稿では,この形態の文脈化誤差の説明として,レース条件仮説を提案する。
機械的不可解性から様々な手法を用いて、仮説を支持する相関的および因果的証拠を提供し、それに対処するための推論時間的介入を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:46:48 GMT)
Efficient Statistics With Unknown Truncation, Polynomial Time Algorithms, Beyond Gaussians [7.0] 本研究では,サンプルが未知の集合に落下した場合にのみ,分布パラメータの推定を行う。
我々は,PAC学習から,正・負のサンプルによるPAC学習まで,独立したツールを開発する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:21:07 GMT)
The Unlikely Hero: Nonideality in Analog Photonic Neural Networks as Built-in Defender Against Adversarial Attacks [7.0] フォトニックアナログ混合信号AIハードウェアの対向ロバスト性は未解明のままである。
本フレームワークは、攻撃前の一意重み符号化と攻撃後の脆弱性認識重みロックにより、敏感な重みを積極的に保護する。
我々のフレームワークは、わずか3%のメモリオーバーヘッドしか持たない逆ビットフリップ攻撃において、ほぼ理想のオンチップ推定精度を維持している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:27:26 GMT)
PerSense: Personalized Instance Segmentation in Dense Images [7.0] 我々は、高密度画像のサンプルセグメント化のための、エンドツーエンドで、トレーニング不要で、モデルに依存しないフレームワークPerSenseを提案する。
インスタンスレベルのポイントプロンプトを自動的に生成できる新しいベースラインを開発する。
また、PerSenseが密度マップの精度を向上させるためのフィードバック機構も導入する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:45:38 GMT)
Automatic Image Unfolding and Stitching Framework for Esophageal Lining Video Based on Density-Weighted Feature Matching [7.0] 本稿では,内視鏡撮影時に撮影した食道ビデオに適した新しい自動画像展開・縫合フレームワークを提案する。
このフレームワークは、ビデオシーケンスにまたがる低ルート平均角構造誤差(RMSE)と高類似度指数(SSIM)を実現する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:53:48 GMT)
Llamipa: An Incremental Discourse Parser [7.0] 本稿では,SDRT方式でコーパスを微調整した大規模言語モデルを用いた最初の談話解析実験について述べる。
ダウンストリームタスクにおける言論情報の最終的な使用に不可欠な言論データを処理することができる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:28:36 GMT)
Reliable and diverse evaluation of LLM medical knowledge mastery [6.8] 本稿では,医療用LDMの信頼性と多種多様な検査サンプルを生成する新しいフレームワークを提案する。
提案手法を用いて,12の有名なLCMの医学的事実知識の習得を体系的に調査する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:17:35 GMT)
OmniGenBench: Automating Large-scale in-silico Benchmarking for Genomic Foundation Models [6.8] ゲノミクス基盤モデル(GFM)ベンチマーク専用のフレームワークであるGFMBenchを紹介する。
4つの大規模ベンチマークから数百のゲノムタスクに数百万のゲノム配列を統合する。
GFMBenchは、ユーザフレンドリーなインターフェースと多様なチュートリアルを提供するオープンソースソフトウェアとしてリリースされた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:40:44 GMT)
High-quality Animatable Eyelid Shapes from Lightweight Captures [6.8] 携帯電話で撮影したRGBビデオのみを用いて、より詳細なアイライド再構成とアニメーションを実現する新しい手法を提案する。
本手法は眼球の静的情報と動的情報を用いて眼球再建を支援する。
我々は,眼科のセマンティックアニメーション制御を実現するために,ニューラルアイリッド制御モジュールを開発した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:18:43 GMT)
Diffusion$^2$: Dynamic 3D Content Generation via Score Composition of Video and Multi-view Diffusion Models [6.7] Diffusion$2$は動的3Dコンテンツ作成のための新しいフレームワークである。
3次元モデルからの幾何的一貫性と時間的滑らかさに関する知識を精査し、密集した多視点画像を直接サンプリングする。
非常にシームレスで一貫した4Dアセットを生成する上で,提案手法の有効性を示す実験を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:07:04 GMT)
MixLinear: Extreme Low Resource Multivariate Time Series Forecasting with 0.1K Parameters [6.7] 時系列予測(LTSF)は、パターンや傾向を特定するために、大量の時系列データを分析することによって、長期的な価値を予測する。
トランスフォーマーベースのモデルは高い予測精度を提供するが、ハードウェア制約のあるデバイスにデプロイするには計算集約的すぎることが多い。
資源制約のあるデバイスに特化して設計された超軽量時系列予測モデルであるMixLinearを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:04:57 GMT)
MMFNet: Multi-Scale Frequency Masking Neural Network for Multivariate Time Series Forecasting [6.7] 長期時系列予測(LTSF)は、電力消費計画、財務予測、疾病の伝播分析など、多くの実世界の応用において重要である。
MMFNetは,マルチスケールマスク付き周波数分解手法を利用して,長期多変量予測を向上する新しいモデルである。
MMFNetは、時系列を様々なスケールの周波数セグメントに変換し、学習可能なマスクを用いて非関連成分を適応的にフィルタリングすることで、微細で中間的で粗い時間パターンをキャプチャする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:38:20 GMT)
FIZZ: Factual Inconsistency Detection by Zoom-in Summary and Zoom-out Document [6.7] そこで本研究では,Zoom-in概要とZoom-out文書による現実的不整合検出の高精度かつ解釈可能な手法を提案する。
我々は、アダプティブ展開を通じて、要約から得られた原子事実とソース文書とを一致させる。
実験結果から,提案手法が既存システムより有意に優れていることが示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:07:15 GMT)
Leveraging Large Language Models to Enhance Personalized Recommendations in E-commerce [6.7] 本研究では,eコマースのパーソナライズされたレコメンデーションシステムにおける大規模言語モデル(LLM)の適用について検討する。
LLMは、ユーザコメントと製品記述データの深いセマンティック理解を通じて、ユーザの暗黙的なニーズを効果的に捉えます。
この研究は、パーソナライズされたレコメンデーション分野においてLLMが大きなアドバンテージがあることを示し、ユーザーエクスペリエンスを改善し、プラットフォーム販売の成長を促進することを示唆している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:59:56 GMT)
A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models [6.6] 本研究では,条件付き深部生成モデルの推定のための可能性に基づくアプローチの大規模サンプル特性について検討する。
その結果,条件分布を推定するための最大極大推定器の収束率を導いた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:46:21 GMT)
DeNetDM: Debiasing by Network Depth Modulation [6.6] DeNetDMは、浅層ニューラルネットワークが学習コア属性を優先するのに対して、より深いものは、異なる情報を取得することを課題とする際のバイアスを強調するという観察に基づく、新しいデバイアス手法である。
提案手法は,データ内のバイアス強調点の多様性を効果的に活用し,従来の手法を超越し,バイアス強調点の多様性を高めるための明示的な拡張に基づく手法の必要性を回避している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:55:12 GMT)
Proof-of-principle experimental demonstration of quantum secure imaging based on quantum key distribution [6.5] 量子鍵分布(QKD)の位相符号化と弱+真空デコイ状態BB84プロトコルに基づく量子セキュアイメージング(QSI)方式を提案する。
実験では、単一光子検出器(SPD)を用いて信号光子数を測定することにより、物体の画像を迅速かつ効率的に取得した。
我々のイメージングシステムは、1550nmの可視波長のレーザーを用いており、その強度は単一光子として低く、弱光像を実現でき、成層圏の光や空気の乱流に免疫するので、傍受妨害攻撃に対する量子セキュリティレーダーの選択肢として好まれる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:59:14 GMT)
DeIDClinic: A Multi-Layered Framework for De-identification of Clinical Free-text Data [6.5] 本研究は,臨床テキストを微調整した深層学習モデルであるCeriorBERTを統合することにより,MASKフレームワークを強化する。
このシステムは、臨床文書内の機密性のある実体を効果的に識別し、再認識するか、置き換える。
リスク評価機能も開発され、文書内のコンテキストのユニークさを分析してリスクレベルに分類する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:16:02 GMT)
The Impact of the COVID-19 Pandemic on Women's Contribution to Public Code [6.4] 新型コロナウイルス(COVID-19)のパンデミックは、女性が公的コードの開発に貢献する能力に不釣り合いな影響を与えている。
特に、新型コロナウイルスは女性のホビイストに影響を与え、貢献パターンやメールアドレスドメインを使って特定した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:03:37 GMT)
BLEND: Behavior-guided Neural Population Dynamics Modeling via Privileged Knowledge Distillation [6.4] 本稿では,特権的知識蒸留による行動誘導型ニューラル人口動態モデリングフレームワークBLENDを提案する。
特権情報として行動を考えることにより、行動観察(私的特徴)と神経活動(正規特徴)の両方を入力として扱う教師モデルを訓練する。
学生モデルは神経活動のみを用いて蒸留される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:45:59 GMT)
Routoo: Learning to Route to Large Language Models Effectively [6.3] Routooは、性能、コスト、効率に基づいた特定のプロンプトに対してLLMの選択を最適化するために設計されたアーキテクチャである。
Routtooはパフォーマンス予測とコスト認識セレクタという2つの重要なコンポーネントで構成されている。
その結果,RoutooはMixtral 8x7bモデルの性能と一致し,推論コストを3分の1削減できることがわかった。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:51:45 GMT)
Revisiting Optimism and Model Complexity in the Wake of Overparameterized Machine Learning [6.3] まず、(有効)自由度という古典的な統計的概念を再解釈し、拡張することで、第一原理からモデルの複雑さを再考する。
我々は,概念的議論,理論,実験の混合を通じて,提案した複雑性尺度の有用性を実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:09:57 GMT)
Social Media Authentication and Combating Deepfakes using Semi-fragile Invisible Image Watermarking [6.2] 本稿では,メディア認証のために,見えない秘密メッセージを実画像に埋め込む半フレジブルな画像透かし手法を提案する。
提案するフレームワークは,顔の操作や改ざんに対して脆弱であると同時に,画像処理操作や透かし除去攻撃に対して頑健であるように設計されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:05:03 GMT)
Hate Speech Detection Using Cross-Platform Social Media Data In English and German Language [6.2] 本研究は,YouTubeコメントにおけるバイリンガルヘイトスピーチの検出に焦点を当てた。
コンテントの類似性、定義の類似性、一般的なヘイトワードなど、データセットがパフォーマンスに与える影響を測定する要素が含まれています。
最高のパフォーマンスは、YouTubeコメント、Twitter、Gabのデータセットと、英語とドイツ語のYouTubeコメントのためのF1スコアの0.74と0.68を組み合わせることで得られる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:22:53 GMT)
Positional Attention: Out-of-Distribution Generalization and Expressivity for Neural Algorithmic Reasoning [6.2] 固定位置符号化を用いて注意重みを推定する手法を提案する。
位置対応型トランスフォーマーは並列アルゴリズムを効果的にシミュレートできることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:55:08 GMT)
One Wave to Explain Them All: A Unifying Perspective on Post-hoc Explainability [6.2] 本稿では,ウェーブレット領域を寄与のための堅牢な数学的基礎として活用することを提案する。
我々のアプローチは、既存の勾配に基づく特徴属性をウェーブレット領域に拡張する。
私たちのメソッドが、入力の重要な部分である場所だけでなく、何についてもどのように説明しているかを示します。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:34:04 GMT)
Theoretical Lower Bounds for the Oven Scheduling Problem [6.1] 問題の目的は、複数の要因を最小化しながら、オーブンに一連のジョブをスケジュールすることである。
効率的なスケジュールを得るための鍵は、バッチで互換性のあるジョブを同時に処理することだ。
我々はOSPの理論的、問題固有の下限を非常に高速に計算できるように開発する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:30:01 GMT)
Energy change and Landauer's principle in the interaction between qubit and quantum field theory [6.0] 量子ビット理論と量子場理論の相互作用の下でのシステム進化の一般的な記述を2階まで与える。
我々は、量子ビットの還元密度行列だけでなく、量子場理論によって得られるバックリアクションを環境として得る。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:02:27 GMT)
Meta-TTT: A Meta-learning Minimax Framework For Test-Time Training [6.0] テスト時ドメイン適応は、推論中に制限された未ラベルのターゲットデータに事前訓練されたモデルを適用することを目的とした、困難なタスクである。
本稿では,バッチ正規化レイヤ上でのテスト時間トレーニングを行うためのメタラーニングミニマックスフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:16:05 GMT)
Strategies for Pretraining Neural Operators [5.8] 偏微分方程式(PDE)モデリングの事前トレーニングは、一般化性と性能を改善するために、データセットをまたいだニューラルネットワークのスケーリングを約束している。
我々は,事前学習のダイナミクスを特徴付けるために,アーキテクチャ選択を最適化することなく,事前学習手法を比較した。
プレトレーニングはモデルとデータセットの選択に大きく依存するが、一般的な転送学習や物理ベースのプレトレーニング戦略が最も有効である。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:37:16 GMT)
Automatic deductive coding in discourse analysis: an application of large language models in learning analytics [5.6] GPTのような大規模言語モデルの出現は、自動演能符号化のための新たな道を開いた。
我々は、異なる人工知能技術によって駆動される3つの異なる分類手法を採用した。
その結果,GPTは両方のデータセットにおいて,トレーニングサンプル数に制限のある他の2つの手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:04:06 GMT)
SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models [5.6] SORSA(Singular Values and Orthonormalized Singular Vectors Adaptation)は, PEFT法の一種である。
本稿では,パラメータの変動を特異値分解(SVD)によって解析し,SORSAのSVD面における変化を最小限に抑える上での優位性を議論し,分析する手法を提案する。
我々はSORSAがパラメータ効率の良い微調整の新しい視点を提供し、優れた性能を示すと結論付けた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:41:31 GMT)
SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models [5.6] SORSA(Singular Values and Orthonormalized Singular Vectors Adaptation)は, PEFT法の一種である。
本稿では,パラメータの変動を特異値分解(SVD)によって解析し,SORSAのSVD面における変化を最小限に抑える上での優位性を議論し,分析する手法を提案する。
我々はSORSAがパラメータ効率の良い微調整の新しい視点を提供し、優れた性能を示すと結論付けた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:41:31 GMT)
Neural Fields for Adaptive Photoacoustic Computed Tomography [5.6] 従来のPACT画像再構成アルゴリズムは、組織内の異種音速(SOS)による波面歪みに悩まされる。
NF-APACTは、ニューラルネットワークを利用した効率的な自己教師型フレームワークであり、正確で堅牢なマルチチャネルデコンボリューションを実現するためのSOSを推定する。
本手法は,SOSの収差を既存手法よりも高速かつ高精度に除去する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:00:38 GMT)
State Machine Mutation-based Testing Framework for Wireless Communication Protocols [5.5] 本稿では,プロトコルステートマシンであるProteusを提案する。
Proteusは、有意義なだけでなく、望ましい性質に違反する確率の高いテストケースを生成することで、その予算意識を維持している。
影響を受けたベンダーは、5つのCVEを通じて14の脆弱性を認めている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:48:24 GMT)
State Machine Mutation-based Testing Framework for Wireless Communication Protocols [5.5] 本稿では,プロトコルステートマシンであるProteusを提案する。
Proteusは、有意義なだけでなく、望ましい性質に違反する確率の高いテストケースを生成することで、その予算意識を維持している。
影響を受けたベンダーは、5つのCVEを通じて14の脆弱性を認めている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:48:24 GMT)
Block-Diagonal Orthogonal Relation and Matrix Entity for Knowledge Graph Embedding [5.5] 知識グラフ埋め込み (KGE) は、実体の低次元表現と、行方不明な事実を予測するための関係を学習することである。
我々は,エンティティの行列と関係のブロック対角行列を用いた新しいKGEモデルOrthogonalEを紹介する。
実験結果から,我々の新しいKGEモデルOrthogonalEは汎用的かつ柔軟であり,最先端のKGEモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 04:17:36 GMT)
Model-based Preference Optimization in Abstractive Summarization without Human Feedback [5.4] 人間のフィードバックを伴わずに要約能力を向上させるために,モデルベース推論最適化(MPO)を導入している。
標準要約データセットと各種測定値を用いた実験により,提案したMPOは,人間のフィードバックに頼らずに生成した要約の質を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:08:29 GMT)
Model-based Preference Optimization in Abstractive Summarization without Human Feedback [5.4] 人間のフィードバックを伴わずに要約能力を向上させるために,モデルベース推論最適化(MPO)を導入している。
標準要約データセットと各種測定値を用いた実験により,提案したMPOは,人間のフィードバックに頼らずに生成した要約の質を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:08:29 GMT)
Finding path and cycle counting formulae in graphs with Deep Reinforcement Learning [5.4] 本稿では,モンテカルロ木探索 (MCTS) を用いた強化学習アルゴリズムであるGrammar Reinforcement Learning (GRL) と,プッシュダウンオートマトン (PDA) をモデル化したトランスフォーマーアーキテクチャを提案する。
GRLは2から6w.r.t状態の手法によって計算効率を向上させるパス/サイクルカウントの新しい行列式を発見した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:29:42 GMT)
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models [5.3] 遅延チャンキングと呼ばれる新しい手法を導入し、長いコンテキストの埋め込みモデルを利用して、まず長いテキストのトークンを埋め込む。
結果として得られたチャンク埋め込みは、コンテキスト情報を完全にキャプチャし、様々な検索タスクにおいて優れた結果をもたらす。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:07:09 GMT)
Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration [5.3] マルチエージェント強化学習(MARL)は、自動運転車ネットワークのような分野を変革している。
異なるロールに対するMARL戦略は、スケールに応じて柔軟に更新することができる。
我々は、スケーラブルで不均一なポリシー最適化(SHPPO)という新しいMARLフレームワークを提案する。
SHPPOは、Starcraft Multi-Agent Challenge (SMAC)やGoogle Research Football (GRF)のような古典的なMARL環境において優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:52:13 GMT)
HC-Mamba: Vision MAMBA with Hybrid Convolutional Techniques for Medical Image Segmentation [5.3] 本稿では,現代空間モデルMambaに基づく新しい医用画像分割モデルHC-Mambaを提案する。
HC-Mambaモデルに拡張畳み込み手法を導入し,より広い範囲の文脈情報を取得する。
さらに、HC-Mambaモデルでは、深度的に分離可能な畳み込みを採用し、パラメータの数とモデルの計算能力を大幅に削減する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:43:33 GMT)
Basis Sharing: Cross-Layer Parameter Sharing for Large Language Model Compression [5.2] 大規模言語モデル(LLM)は、推論においてかなりの量のメモリストレージを必要とする。
本稿では,特異値分解を伴う異なる層間のパラメータ共有について検討する。
総合的な実験により、Basis Sharingは最先端のSVDベースの圧縮アプローチより優れていることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:30:02 GMT)
Formula-Driven Data Augmentation and Partial Retinal Layer Copying for Retinal Layer Segmentation [5.1] OCT画像のための新しいデータ拡張手法を提案する。
フォーミュラ駆動データ拡張は様々な網膜構造をエミュレートする。
PRLCは網膜層の一部をコピーし、網膜層の外の領域に貼り付ける。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:37:11 GMT)
Dynamic Graph Representation Learning via Edge Temporal States Modeling and Structure-reinforced Transformer [5.1] 本稿では,動的グラフ表現学習のための新しいフレームワークであるRecurrent Structure-Reinforced Graph Transformer (RSGT)を紹介する。
RSGTは、繰り返し学習パラダイムを通じて、グラフトポロジと進化力学の両方をコードする時間ノード表現をキャプチャする。
離散動的グラフ表現学習におけるRSGTの優れた性能を示し、動的リンク予測タスクにおける既存の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:40:53 GMT)
Graph Neural Preconditioners for Iterative Solutions of Sparse Linear Systems [5.1] 汎用プリコンディショナーとしてグラフニューラルネットワークを提案する。
多くの問題に対して魅力的なパフォーマンスを示しており、メインストリームのプレコンディショナーがパフォーマンスが悪い場合にも使用できる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:43:05 GMT)
Explaining an image classifier with a generative model conditioned by uncertainty [5.0] 本稿では,画像分類器の不確実性により生成モデルを条件付け,その振る舞いを解析・説明するために提案する。
合成データに関する予備的な実験と、MNISTデータセットの破損したバージョンは、このアイデアを示している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:14:31 GMT)
TiVaT: Joint-Axis Attention for Time Series Forecasting with Lead-Lag Dynamics [5.0] TiVaT(Time-Variable Transformer)は、時間と変数の依存関係を統合する新しいアーキテクチャである。
TiVaTは、さまざまなデータセットに対して、一貫して強力なパフォーマンスを提供する。
これによってTiVaTは、特に複雑で困難な依存関係を特徴とするデータセットの処理において、MTS予測の新しいベンチマークとして位置づけられる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:24:24 GMT)
Fair4Free: Generating High-fidelity Fair Synthetic Samples using Data Free Distillation [4.9] 本研究は, 潜水空間におけるデータフリー蒸留を用いて合成フェアデータを生成する新しい生成モデルを提案する。
提案手法では,まず教師モデルを訓練して公正表現を作成し,その知識を学生モデルに流用する。
学生モデルを蒸留するプロセスはデータフリーであり、すなわち、学生モデルは蒸留中にトレーニングデータセットにアクセスできない。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:16:11 GMT)
Price-guided user attention in large-scale E-commerce group recommendation [4.9] 実世界のEコマースデータセット上で広く利用されているグループ推薦モデルから,ユーザの注意点を分析した。
本稿では,ユーザアグリゲーションの指針として,アイテム価格を取り入れたグループ推薦手法を提案する。
以上の結果から,我々の価格誘導型ユーザアテンションアプローチは,ヒット率と平均二乗誤差で最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:46:51 GMT)
Non-Hermitian gauged reciprocity and symmetry [4.8] 虚ベクトルポテンシャルを持つ系では、ローレンツの相互性は壊れているが、厳密な数学的関係によって支配されている。
しかし、単に線形集積フォトニック要素を用いて虚ベクトルポテンシャルを模倣する場合、ローレンツの相互性につながる条件は依然として満たされている。
また、同じ系における別の等振幅応答も明らかにし、これは非エルミートゲージ対称性に帰着する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:19:38 GMT)
The Impact of Generative AI on Collaborative Open-Source Software Development: Evidence from GitHub Copilot [4.8] オープンソースコミュニティにおけるソフトウェア開発における,生成的AIプログラマペアであるGitHub Copilotの役割について検討する。
Copilotはプロジェクトレベルの生産性を6.5%向上させます。
結論として、AIペアプログラマは、コードの自動化と強化に開発者にメリットをもたらしますが、ソフトウェアプロジェクトに関する人間の開発者の知識は、そのメリットを高めることができます。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:26:10 GMT)
PretextTrans: Investigating Medical Factual Knowledge Mastery of LLMs with Predicate-text Dual Transformation [4.8] LLMが直接作成したテストサンプルは、常に事実エラーを導入し、知識表現の方法の多様性を欠いている。
動的評価スキーマに述語変換を導入することにより、新しい評価手法Predicate-text Dual Transformation(PretextTrans)を提案する。
提案したPretextTrans法を用いて,2つの医療データセットに基づいて,12の有名なLCMによる医療事実知識の習得を体系的に検討した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:17:35 GMT)
Are LLMs Effective Negotiators? Systematic Evaluation of the Multifaceted Capabilities of LLMs in Negotiation Dialogues [4.7] 本研究の目的は,多様な対話シナリオにまたがるLLMの多面的特徴を体系的に解析することである。
本分析では,GPT-4の課題を特定しながら,多くのタスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:32:31 GMT)
Coordinate-Based Neural Representation Enabling Zero-Shot Learning for 3D Multiparametric Quantitative MRI [4.7] 我々は,同時マルチパラメトリックqMRIのためのデータ取得と教師なし再構成を含む,革新的なイメージング手法であるSUMMITを提案する。
qMRI再構成のための教師なしアプローチは、様々な医用画像モダリティに適用可能な、新しいゼロショット学習パラダイムも導入する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:13:06 GMT)
Adversarial Latent Autoencoder with Self-Attention for Structural Image Synthesis [4.6] 本稿では, 複雑な工学部品の設計画像を生成可能な, 自己注意適応遅延オートエンコーダ (SA-ALAE) を提案する。
SA-ALAEでは、ユーザーは既存のデザインの新しいバリエーションを探索できるだけでなく、潜在空間で操作することで生成プロセスを制御できる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:24:08 GMT)
Conformal Prediction Sets Can Cause Disparate Impact [4.6] コンフォーマル予測は、機械学習モデルの不確実性を定量化するための有望な方法である。
予測セットを提供することは、彼らの決定の不公平性を高めることができることを示す。
カバー範囲を等化するのではなく、経験的により公平な結果をもたらすグループ間でセットサイズを等化することを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:00:01 GMT)
Importance is Important: Generalized Markov Chain Importance Sampling Methods [4.6] 我々は,任意のマルチトライトリメトロポリスアルゴリズムにおいて,提案を常に受け入れ,余分な計算コストを伴わずにバイアスを補正するために必要な重み付けを評価することができることを示した。
本稿では、メトロポリス・ハスティングスフレームワークの外部にある離散空間上の別のMCMCサンプリング器を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:17:33 GMT)
Ensemble and Mixture-of-Experts DeepONets For Operator Learning [4.6] 本稿では,演算子学習のための新しいディープ演算子ネットワーク(DeepONet)アーキテクチャを提案する。
アンサンブルのDeepONetは、1つのDeepONetのトランクネットワークを複数の異なるトランクネットワークで強化することを可能にする。
また,DeepONetトランクネットワークアーキテクチャの空間混合(MoE)について述べる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 02:44:55 GMT)
Learning the Optimal Path and DNN Partition for Collaborative Edge Inference [4.4] Deep Neural Networks (DNN)は、多数のインテリジェントなモバイルアプリケーションとサービスの開発を触媒している。
これを解決するために、協調的なエッジ推論が提案されている。
この方法では、DNN推論タスクを複数のサブタスクに分割し、それらを複数のネットワークノードに分散する。
我々は,従来のブロックされたEXP3アルゴリズムとLinUCBアルゴリズムの要素を組み合わせたB-EXPUCBアルゴリズムを導入し,そのサブ線形後悔を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:12:16 GMT)
A motion-based compression algorithm for resource-constrained video camera traps [4.3] 本稿では,カメラトラップに特化して設計された動き解析に基づくビデオ圧縮アルゴリズムを提案する。
このアルゴリズムは、受粉監視に関連する動きを描写した画像領域のみを特定し、記憶する。
本実験は,昆虫行動解析における重要な情報を保存するアルゴリズムの能力を実証するものである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:07:34 GMT)
Associative memory and dead neurons [4.3] 死んだ神経細胞の問題に弱いエネルギー関数について検討する。
これらの平坦な領域では、エネルギー関数だけですべての自由度を完全に決定することはできない。
我々は、死んだ神経細胞に対応する平坦な方向による問題を解決する方法を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:25:30 GMT)
Temporal Test-Time Adaptation with State-Space Models [4.2] テストサンプルにモデルを適用することは、パフォーマンスの低下を軽減するのに役立ちます。
ほとんどの試験時間適応法は、合成汚職シフトに重点を置いている。
本稿では,時相分布シフトに対応する確率的状態空間モデルSTADを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:29:54 GMT)
Precision Knowledge Editing: Enhancing Safety in Large Language Models [4.2] 本研究は,既存の知識編集手法に基づく高度な技術である精密知識編集(PKE)を紹介する。
PKEは、DINM(Detoxifying Instance Neuron Modification)のような従来の方法と比較して、有害なコンテンツ管理の粒度を極小に達成する
実験の結果,PKEは様々なモデルに対する攻撃成功率(ASR)を大幅に低下させることがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:15:53 GMT)
Replacement Learning: Training Vision Tasks with Fewer Learnable Parameters [4.2] 置換学習は、冷凍層の全パラメータを2つの学習可能なパラメータで置き換える。
CIFAR-10, STL-10, SVHN, ImageNetの4つのベンチマークデータセットを対象に実験を行った。
提案手法は,エンドツーエンドトレーニングの性能を完全に超えながら,パラメータ数,トレーニング時間,メモリ使用量を削減する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:03:54 GMT)
Deep Learning Alternatives of the Kolmogorov Superposition Theorem [4.2] 本稿では,ニューラルネットワーク設計の基礎となるKST(Kolmogorov Superposition Theorem)の定式化について検討する。
我々は、KST上に構築されたスケーラブルなディープラーニングモデルであるActNetを紹介し、Kolmogorov氏のオリジナルの定式化の欠点の多くを克服する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:53:14 GMT)
FairlyUncertain: A Comprehensive Benchmark of Uncertainty in Algorithmic Fairness [4.1] フェアネスにおける不確実性評価のための公理的ベンチマークであるFairlyUncertainを紹介する。
我々のベンチマークは、予測の不確実性推定は学習パイプライン間で一貫性があり、観測されたランダム性に調整されるべきである、と示唆している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:15:29 GMT)
SSL-NBV: A Self-Supervised-Learning-Based Next-Best-View algorithm for Efficient 3D Plant Reconstruction by a Robot [4.1] 本稿では,深層ニューラルネットワークを用いた自己教師型学習ベースNBV(SSL-NBV)手法を提案する。
クロスバリデーションを用いたシミュレーションおよび実環境における総合評価を行った。
その結果, SSL-NBVは非NBV法よりも植物再生の視点を少なくし, ボクセル法より800倍以上高速であった。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:42:38 GMT)
Aggregation of Multi Diffusion Models for Enhancing Learned Representations [4.1] 本稿では, Aggregation of Multi Diffusion Models (AMDM) を提案する。
AMDMは、複数の拡散モデルから特定のモデルに特徴を合成し、学習された表現を拡張して、きめ細かい制御のために特定の特徴を活性化する。
実験の結果,AMDMはトレーニング時間や推論時間を必要とせず,微粒化制御を著しく改善することがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:16:06 GMT)
Stochastic Gradient Descent with Adaptive Data [4.1] 勾配降下(SGD)は、オンライン学習シナリオにおいて特に有用である強力な最適化手法である。
オペレーションリサーチにおけるポリシー最適化問題へのSGDの適用には、環境を変えてポリシー更新に使用するデータに影響を与えるという、明確な課題が伴う。
過去の決定が生成したデータに与える影響は、勾配推定におけるバイアスを導入し、iidケースに存在しないオンライン学習の不安定性の潜在的な原因を示す。
適応データによるSGDの収束速度は, 政策誘起力学の混合時間に係わる限り, 古典的イド設定とほとんど同様であることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:58:32 GMT)
SAAS: Solving Ability Amplification Strategy for Enhanced Mathematical Reasoning in Large Language Models [4.1] 我々は,CoT(Chain-of-Thought)学習とPoT(Program-of-Thought)学習の統合に注力する。
本稿では,CoT学習からPoT学習へ戦略的に移行する,SAAS(Solving Ability Amplification Strategy)という逐次学習手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:56:35 GMT)
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems [4.0] 代理モデルは複雑なエネルギーシステムの振舞いを予測するために用いられる。
本稿では,システムキャプションやSysCapsと呼ばれる言語記述を用いて,そのようなサロゲートと対話する手法を提案する。
我々のSysCaps拡張サロゲートは従来の手法よりもホールドアウトシステムの方が精度が高いことを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:23:12 GMT)
Nebula: A discourse aware Minecraft Builder [4.0] 先行した言論と非言語的文脈を取り入れることで、そのような相互作用の「言語から行動への」要素がいかに改善されるかを示す。
私たちのモデルであるNebulaは、このタスクのベースライン上でのネットアクションF1スコアを2倍にします。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:40:36 GMT)
GraphRevisedIE: Multimodal Information Extraction with Graph-Revised Network [3.9] 視覚的にリッチなドキュメント(VRD)から重要な情報を抽出することは、文書インテリジェンスにおいて難しい課題である。
本稿では,VRDからテキスト,視覚,レイアウトなどのマルチモーダル機能を効果的に組み込む軽量モデルGraphIEを提案する。
複数の実世界のデータセットに対する大規模な実験は、GraphIERevisedsが様々なレイアウトのドキュメントに一般化し、以前のKIEメソッドと同等またはより良いパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:29:49 GMT)
Model Comparisons: XNet Outperforms KAN [3.9] XNetは複素数値コーシー積分式を用いる新しいアルゴリズムである。
XNetは、低次元空間と高次元空間の両方において、様々なタスクにおける速度と精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:59:47 GMT)
XChainWatcher: Monitoring and Identifying Attacks in Cross-Chain Bridges [3.9] 橋梁の監視と攻撃検出のための最初のメカニズムであるXChainWatcherを提案する。
XChainWatcherは、任意のクロスチェーンブリッジにプラグイン可能なように設計された、Datalogエンジンを使用したクロスチェーンモデルに依存している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:49:24 GMT)
Towards Privacy-Preserving Relational Data Synthesis via Probabilistic Relational Models [3.9] 確率的リレーショナルモデルは、一階述語論理と確率的モデルを組み合わせるための確立された形式主義を提供する。
人工知能の分野は、さまざまな機械学習タスクのために、ますます大量のリレーショナルトレーニングデータを必要とする。
プライバシの懸念やデータ保護の規制、高コストなどにより、現実のデータの収集は難しいことが多い。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:01:58 GMT)
PROXI: Challenging the GNNs for Link Prediction [3.8] 本稿では,グラフと属性空間の両方におけるノードペアの近接情報を活用するPROXIを紹介する。
標準機械学習(ML)モデルは競争力があり、最先端のGNNモデルよりも優れています。
ProXIによる従来のGNNの拡張はリンク予測性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:57:38 GMT)
FPGA-based Distributed Union-Find Decoder for Surface Codes [3.8] フォールトトレラントな量子コンピュータは、エラー訂正による指数的な減速を防ぐために、エラーの復号と修正を高速に行う必要がある。
並列計算資源を利用したUnion-Findデコーダの分散バージョンを報告する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 01:27:54 GMT)
Intent Detection in the Age of LLMs [3.8] インテント検出はタスク指向対話システム(TODS)の重要な構成要素である
従来のアプローチは、計算効率の良い教師付き文変換器エンコーダモデルに依存していた。
固有の世界知識を持つ生成的大言語モデル(LLM)の出現は、これらの課題に対処する新たな機会を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:01:55 GMT)
Moral Alignment for LLM Agents [3.7] 本稿では,基礎エージェントモデルの微調整による強化学習のためのコアヒューマン値を明示的に符号化する報酬関数の設計を紹介する。
我々は,Deontological EthicsとUtilitarianismの伝統的な哲学的枠組みを用いて,我々のアプローチを評価する。
我々は、エージェントが以前開発された自己中心的な戦略を解き放つことを可能にするために、いかに道徳的な微調整を展開できるかを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:09:36 GMT)
Evaluating Deduplication Techniques for Economic Research Paper Titles with a Focus on Semantic Similarity using NLP and LLMs [3.7] 本研究では, 大規模NLPデータセットの効率的な復号化手法について検討した。
以上の結果から,異なる手法で観察された意味的類似性に基づく重複の頻度が低い可能性が示唆された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 00:43:10 GMT)
Data Extrapolation for Text-to-image Generation on Small Datasets [3.7] 線形外挿を用いたテキスト・画像生成のための新しいデータ拡張手法を提案する。
トレーニングサンプルをオリジナルのデータセットの数十倍の規模で構築する。
我々のモデルは、CUB、オックスフォード、COCOのデータセットで7.91、9.52、および5.00のFIDスコアを達成する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:08:47 GMT)
Towards Inference-time Category-wise Safety Steering for Large Language Models [3.7] 大規模言語モデル(LLM)は、様々なユースケースで機能や応用が前例のない進歩を遂げている。
LLMの脆弱な性質は、トレーニングなしの推論時間法による追加の安全ステアリングステップを保証している。
本稿では,近年の推論時安全ステアリング作業と異なり,カテゴリー別ステアリングベクトルを用いたLCM出力の安全ステアリングについて検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:02:06 GMT)
Adaptive Exploit Generation against Security Devices and Security APIs [3.7] フォーマルな方法を用いて,Security APIに対する概念実証エクスプロイトを自動的に導出する方法を示す。
一般的なプロトコル検証器ProVerifを言語に依存しないテンプレート機構で拡張する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:05:44 GMT)
EAB-FL: Exacerbating Algorithmic Bias through Model Poisoning Attacks in Federated Learning [3.7] フェデレートラーニング(FL)は、複数のパーティがプライベートデータを開示することなく、共同で共有モデルをトレーニングできる技術である。
FLモデルは、データの異質性や党の選択により、特定の人口集団に対する偏見に悩まされることがある。
そこで本研究では, モデル有効性を維持しつつ, グループ不公平性を高めることを目的とした, 新たなモデル中毒攻撃であるERB-FLを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:22:48 GMT)
Performant, Memory Efficient and Scalable Multi-Agent Reinforcement Learning [3.7] Sableは、Retentive NetworksからMARLへの保持機構を適応させる新しいアルゴリズムである。
Sableは、タスクの大部分で既存の最先端メソッドを大幅に上回る。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:15:26 GMT)
Statistical Virtual Temperature of Classical and Quantum Systems [3.6] 本稿では,Gibs Kubo-Martin-Schwinger(KMS)状態のスペクトルから得られた統計的仮想温度の基本的な定義を紹介する。
我々は、フォン・ノイマンエントロピーと統計的仮想温度の間の普遍的な物理的境界がこれらのIPによって制約されることを示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:14:37 GMT)
"Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations [3.6] 専門家デモ(RLED)からの強化学習(Reinforcement Learning from Expert Demonstrations)のような手法は、学習プロセス中のエージェント探索を促進するために外部の専門家によるデモンストレーションを導入します。
学習にとって最も有益な人間のデモのベストセットをどうやって選ぶかが、大きな関心事になります。
本稿では,学習エージェントが軌跡に基づく特徴空間において,専門家による実演を最適化したクエリを生成できるアルゴリズムEARLYを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:03:52 GMT)
Endless Jailbreaks with Bijection Learning [3.6] ビジェクション学習(Bijection learning)は、大規模に成長する自動化された普遍的な攻撃である。
我々は、言語モデルの高度な推論能力を利用して、文脈における可逆言語(ビジェクション)を教える。
我々のアプローチは、幅広いフロンティア言語モデルと有害カテゴリーに有効であることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:40:56 GMT)
OCC-MLLM-Alpha:Empowering Multi-modal Large Language Model for the Understanding of Occluded Objects with Self-Supervised Test-Time Learning [3.5] マルチモーダルな大規模言語フレームワークと3次元生成をサポートする自己教師型学習戦略を導入する。
最初の結果は、最先端のVLMモデルと比較して16.92%改善したことを示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:52:39 GMT)
Deep Bayesian Filter for Bayes-faithful Data Assimilation [3.5] 非線形状態空間モデル(SSM)のデータ同化のためのディープベイズフィルタ(DBF)を提案する。
DBF は元の物理変数 $z_t$ に加えて新しい潜在変数 $h_t$ を構築し、観測値 $o_t$ を同化する。
物理空間上の真の後続分布がガウス的でないタスクにおいて,DBFはモデルベースアプローチや潜時同化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:29:35 GMT)
Emo3D: Metric and Benchmarking Dataset for 3D Facial Expression Generation from Emotion Description [3.5] Emo3Dは、人間の感情の幅広い範囲にまたがる広範な「テキスト画像表現データセット」である。
我々は多種多様なテキスト記述を生成し、感情表現の幅広い範囲を捉えやすくする。
エモ3D」はアニメーションデザイン、バーチャルリアリティ、感情的な人間とコンピュータのインタラクションに優れた応用がある。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:31:24 GMT)
Social Conjuring: Multi-User Runtime Collaboration with AI in Building Virtual 3D Worlds [3.5] Social Conjurerは、AIによる動的3Dシーンの共同作成のためのフレームワークである。
本稿では,AIモデルを3次元コンテンツ生成に組み込んだヒューマン中心インタフェースの設計における意味について述べる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:34:41 GMT)
Model Validation Practice in Banking: A Structured Approach [3.5] 銀行におけるモデル検証は、予測モデルが確実に動作し、規制基準を満たすように設計された重要なプロセスである。
バンキングにおけるモデル検証は、概念音質評価、結果分析、進行中の監視という3つの重要な要素を持つ多面的プロセスである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:46:52 GMT)
The potential of LLM-generated reports in DevSecOps [3.5] アラート疲労は、DevSecOpsパラダイムを使用してソフトウェアチームが直面する一般的な問題である。
本稿では,LCMが実用的なセキュリティレポートを生成する可能性について検討する。
DevSecOpsにこれらのレポートを統合することで、注意の飽和と警告疲労を軽減することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:01:12 GMT)
Cross-Domain Content Generation with Domain-Specific Small Language Models [3.3] そこで本研究では,2つのドメインに対して,コーヒーレントかつ関連する出力を生成するための小言語モデルを提案する。
それぞれのデータセットに合わせてカスタマイズされたカスタムトークン化ツールを利用することで、生成品質が大幅に向上することがわかった。
凍結層による知識拡張は,小言語モデルがドメイン固有のコンテンツを生成するのに有効な方法であることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:28:02 GMT)
UlcerGPT: A Multimodal Approach Leveraging Large Language and Vision Models for Diabetic Foot Ulcer Image Transcription [3.3] 糖尿病性足潰瘍(DFU)は、入院や下肢切断の主因である。
我々は,DFU画像の書き起こしに大規模言語と視覚モデルを活用する,新しいマルチモーダルアプローチであるUlcerGPTを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:51:48 GMT)
How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? [3.2] このような手法のメタ評価を行い、その信頼性を幅広いタスクにわたって評価する。
自動評価手法は、特定の条件下で人間の評価を近似することができるが、その妥当性は文脈に依存している。
本研究は,命令調整型LLMの開発と評価において,自動手法の適用方法や解釈方法の理解を深めるものである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:18:47 GMT)
Deep Generative Modeling for Identification of Noisy, Non-Stationary Dynamical Systems [3.1] 非線形・雑音・非自律力学系に対する擬似常微分方程式(ODE)モデルを求めることに集中する。
提案手法は,SINDyとSINDy(非線形力学のスパース同定)を結合し,スパースODEの時間変化係数をモデル化する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:00:00 GMT)
Learning from the Giants: A Practical Approach to Underwater Depth and Surface Normals Estimation [3.1] 本稿では,単眼深度と表面正規化推定(MDSNE)のための新しいディープラーニングモデルを提案する。
これは特に、CNNとTransformerを統合するハイブリッドアーキテクチャを使用して、水中環境向けに調整されている。
我々のモデルはパラメータを90%削減し、トレーニングコストを80%削減し、リソース制約されたデバイス上でリアルタイムな3D認識を可能にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:41:12 GMT)
Generative modeling of density regression through tree flows [3.0] 本稿では,表データの密度回帰タスクに適したフローベース生成モデルを提案する。
本稿では,木質変換を分割・対数戦略を用いて適合させる学習アルゴリズムを提案する。
本手法は, トレーニングおよびサンプリング予算のごく一部において, 同等あるいは優れた性能を継続的に達成する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 04:43:50 GMT)
Rapid Gyroscope Calibration: A Deep Learning Approach [2.9] 我々は,ディープラーニング手法を用いて,低コストジャイロスコープ校正時間を削減することに注力する。
本稿では,複数の実・仮想ジャイロスコープを用いた深層学習フレームワークを提案する。
この研究の重要な成果の1つは、3つの低コストジャイロスコープを使用してジャイロスコープの校正時間を最大89%削減することである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:55:53 GMT)
CaRtGS: Computational Alignment for Real-Time Gaussian Splatting SLAM [2.9] CaRtGSは、リアルタイム環境における光リアルなシーン再構築の効率性と品質を向上させる新しい手法である。
本手法は適応戦略によりガウススティングSLAM(GS-SLAM)の計算ミスアライメントに対処する。
ReplicaとTUM-RGBDの実験は、CaRtGSが高忠実度レンダリングデータセットを実現するための有効性を示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:07:56 GMT)
AgriLLM: Harnessing Transformers for Farmer Queries [2.9] 本研究は,農業従事者を対象とした問合せ解決の自動化におけるLarge Language Models (LLMs) の変容の可能性を探るものである。
インドで収集された現実世界のファーマークェリの膨大なデータセットのサブセットを用いて、我々の研究はタミル・ナドゥ州の約400万のクェリに焦点を当てた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:59:41 GMT)
OCC-MLLM:Empowering Multimodal Large Language Model For the Understanding of Occluded Objects [2.9] 本稿では,新たに設計されたビジュアルエンコーダを用いて,RGB画像の隠蔽対象を理解する新しいマルチモーダルモデルを提案する。
また、大規模視覚言語ペアデータセットを導入し、大規模視覚言語マルチモーダルモデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:14:49 GMT)
What's Mine becomes Yours: Defining, Annotating and Detecting Context-Dependent Paraphrases in News Interview Dialogs [2.8] 我々は,NPR と CNN のニュースインタビューから,文脈依存のパラフレーズに注釈を付けた発話ペアを用いたデータセットを提案する。
In-context Learningとトークン分類モデルを用いた対話における自動パラフレーズ検出の有望な結果を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:26:54 GMT)
Real-World Data and Calibrated Simulation Suite for Offline Training of Reinforcement Learning Agents to Optimize Energy and Emission in Buildings for Environmental Sustainability [2.8] 本稿では,実オフィスビルにおけるデバイスの実測から抽出した,オープンソースの対話型HVAC制御データセットについて紹介する。
使いやすくするために、私たちのRL環境は、すべてOpenAIのジム環境標準と互換性があります。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:30:07 GMT)
Exploratory Optimal Stopping: A Singular Control Formulation [2.7] 強化学習の観点から,連続時間と状態空間の最適停止問題について検討する。
乱数停止時間の累積残エントロピーをペナル化することにより、問題の正規化版を導入する。
実オプション問題の特定の場合には、正規化問題に対する半明示的な解を導出する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:13:06 GMT)
Peeling Back the Layers: An In-Depth Evaluation of Encoder Architectures in Neural News Recommenders [2.7] 本稿では,ニューラルニュースレコメンデータシステムにおけるエンコーダアーキテクチャの包括的解析を行う。
解析の結果,特定の符号化手法の複雑さは経験的に不適切であることが判明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:21:31 GMT)
PreND: Enhancing Intrinsic Motivation in Reinforcement Learning through Pre-trained Network Distillation [2.7] 強化学習における本質的モチベーションを高めるための新しいアプローチであるプレトレーニングネットワーク蒸留(Pre-trained Network Distillation, PreND)を導入する。
PreNDは、事前訓練された表現モデルをターゲットネットワークと予測ネットワークの両方に組み込み、より有意義で安定した本質的な報酬をもたらす。
我々は,Atariドメインの実験において,PreNDがランダムネットワーク蒸留(RND)を著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:56:03 GMT)
Iterated Local Search with Linkage Learning [2.7] ブラックボックス最適化では、経験的リンケージ学習技術を用いて、変数相互作用グラフを少なくとも部分的に発見することができる。
最近提案されたリンケージ学習を用いた局所探索は、反復局所探索の副作用として部分変数相互作用グラフを発見する。
本稿では,変数間の相互作用の強度に関する情報を格納する重み付き変数相互作用グラフを構築するリンクラーニング2を用いた局所探索を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:17:50 GMT)
FastLexRank: Efficient Lexical Ranking for Structuring Social Media Posts [2.6] FastLexRankはテキストランキングのためのLexRankアルゴリズムの効率的でスケーラブルな実装である。
文グラフの定常分布を計算するために最適化されたアプローチを用いることで、FastLexRankは元のLexRankスコアと同じ結果を維持する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:34:33 GMT)
Quantum Cryptography from Meta-Complexity [2.6] 古典暗号において、一方通行関数(OWF)は最小限の仮定である。
量子暗号では、これらのプリミティブの既知の構成はすべてOWFからのみである。
本稿では,GapK問題における量子平均硬度がOWPuzzsの存在を示唆していることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:30:06 GMT)
Evaluation Study on SAM 2 for Class-agnostic Instance-level Segmentation [2.6] Segment Anything Model (SAM) は自然界において強力なゼロショットセグメンテーション性能を示した。
最近リリースされたSegment Anything Model 2 (SAM2)は、画像セグメンテーション機能に対する研究者の期待をさらに高めた。
この技術レポートはSAM2ベースのアダプタの出現を加速させ,クラスに依存しないインスタンスセグメンテーションタスクにおいて,大規模ビジョンモデルの性能向上を目的としている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:22:30 GMT)
Disentangling and Integrating Relational and Sensory Information in Transformer Architectures [2.5] 我々は、個々の物体の性質に関する感覚情報と、物体間の関係に関する関係情報とを区別する。
本稿では,感性情報の流れを指示する感覚的注意機構と,関係情報の流れを指示する新たな関係的注意機構とを特徴とするトランスフォーマーフレームワークのアーキテクチャ拡張を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:31:42 GMT)
InstaTrans: An Instruction-Aware Translation Framework for Non-English Instruction Datasets [2.5] 末尾現象のため、英語以外の言語に対して高品質な命令データセットを生成することは困難である。
本稿では,既存の高品質な英語指導データセットを解として翻訳することを提案する。
InstaTransという命令データセットに適した新しい翻訳フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:02:23 GMT)
CBAM-SwinT-BL: Small Rail Surface Defect Detection Method Based on Swin Transformer with Block Level CBAM Enhancement [2.5] 本研究では, Swin Transformer (SwinT) をベースラインとして, Convolutional Block Attention Module (CBAM) を組み込んで拡張する。
提案手法は,スウィントランスブロックにCBAMを組み込むことにより,レール欠陥検出の性能を著しく向上させる。
実験およびアブレーション研究は、このフレームワークの有効性を証明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:16:05 GMT)
Ensembles provably learn equivariance through data augmentation [2.5] 群等分散は、無限に広いニューラルネットワークの極限における完全な拡張の結果、ニューラルネットワークのアンサンブルに現れる。
この出現は、ニューラルネットワークのカーネル制限に全く依存しないことを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:02:43 GMT)
Quantifying Cancer Likeness: A Statistical Approach for Pathological Image Diagnosis [2.4] 提案手法は,エビデンスベースの医学に基づく統計理論に基づいて構築される。
本手法は癌分類タスクにおいて0.95以上の区切りAUCを実現する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:57:45 GMT)
Engagement Measurement Based on Facial Landmarks and Spatial-Temporal Graph Convolutional Networks [2.4] 本稿では,ビデオからのエンゲージメント測定のための新しいプライバシ保護手法を提案する。
MediaPipeのディープラーニングソリューションを通じてビデオから抽出された、個人識別可能な情報を持たない顔のランドマークを使用している。
提案手法は,仮想学習プラットフォーム上に展開し,リアルタイムにエンゲージメントを測定することができる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:54:32 GMT)
MaxSAT decoders for arbitrary CSS codes [2.4] 任意の幾何およびパリティチェック重みを持つCSS符号の量子極大問題をMaxSAT問題にマップする方法を示す。
我々のデコーダはASICやFPGAでさらに並列化や実装が可能であり、数桁のさらなる高速化が期待できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:45:05 GMT)
SciPrompt: Knowledge-augmented Prompting for Fine-grained Categorization of Scientific Topics [2.4] SciPromptは,低リソーステキスト分類タスクに対して,科学的トピック関連用語を自動的に検索するフレームワークである。
本手法は, ほとんど, ゼロショット設定下での科学的テキスト分類作業において, 最先端, 即時的な微調整法より優れる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:45:04 GMT)
Flow Matching for Accelerated Simulation of Atomic Transport in Materials [2.3] LiFlowは結晶材料の分子動力学(MD)シミュレーションを加速するための生成フレームワークである。
4,186固体電解質 (SSE) 候補を4温度で25-psのリチウム拡散を観測した。
LiFlowは、短い訓練軌道からより大きなスーパーセルへと一般化し、高い精度を維持しながら、より長いシミュレーションを行う。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:16:46 GMT)
DynFrs: An Efficient Framework for Machine Unlearning in Random Forest [2.3] DynFrsはランダムフォレストにおける効率的な機械学習を可能にするために設計されたフレームワークである。
実験では、DynfrsをExtremely Treesに適用すると、大幅に改善される。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:20:30 GMT)
LLM-as-a-Judge & Reward Model: What They Can and Cannot Do [2.2] 自動評価器の総合的な分析を行い,その挙動に関するいくつかの重要な知見を報告する。
英語の評価能力は言語固有の評価能力に大きく影響し,英語で訓練された評価者が他の言語に容易にスキルを伝達できることがわかった。
我々は、現在最先端の評価者が、英語と韓国語の両方において、複雑な推論問題の評価や生成の限界について、挑戦的なプロンプトに苦しむことに気付きました。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:07:14 GMT)
Agent-Driven Large Language Models for Mandarin Lyric Generation [2.2] マンダリンのような音節の輪郭言語では、ピッチの輪郭はメロディとトーンの両方に影響され、歌詞とメロディの適合性が変化する。
本研究は,作詞家やメロディ作家が作曲過程に適合していることを確認する。
本研究では,メロディから歌詞へのタスクをサブタスクに分解するマルチエージェントシステムを開発し,各エージェントが韻律,音節数,歌詞・メロディのアライメント,一貫性を制御している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:01:32 GMT)
Life, uh, Finds a Way: Systematic Neural Search [2.2] エージェントの動作に迅速に適応して、設定における継続的な問題を解決するという課題に取り組みます。
深層強化学習に焦点をあてる代わりに,探索手順の物理的表現としての視聴行動を提案する。
本稿では,行動実行とグラフの突然変異の間の厳密なフィードバックループを調節することにより,行動の暗黙的な列挙を行うアルゴリズムについて述べる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:06:54 GMT)
Aspect-Based Sentiment Analysis Techniques: A Comparative Study [2.1] Aspect-based Sentiment Analysis (ABSA) は人工知能(AI)の進歩に支えられている
本研究では、2つのベンチマークデータセット(Restaurant14とLaptop-14)でABSAのディープNN手法を比較した。
FAST LSA は 87.6% と 82.6% の精度で最高の結果を得るが、それぞれ 90.33% と 86.21% の精度で LSA+DeBERTa を通過しない。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:18:02 GMT)
Diverse Expected Improvement (DEI): Diverse Bayesian Optimization of Expensive Computer Simulators [2.0] そこで我々は,多種多様な ''$epsilon$-optimal''' ソリューションを探索する新しい Diverse expected Improvement (DEI) 法を提案する。
DeI はガウス過程シュロゲートモデルの下で閉形式獲得関数が得られることを示す。
数値実験の組において,既存手法よりもDeIの改善を実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 02:59:42 GMT)
GCM-Net: Graph-enhanced Cross-Modal Infusion with a Metaheuristic-Driven Network for Video Sentiment and Emotion Analysis [2.0] 本稿では,発話からのマルチモーダルな文脈情報を活用し,メタヒューリスティックなアルゴリズムを用いて発話レベルの感情と感情予測を学習する新しい枠組みを提案する。
提案手法の有効性を示すため,我々は3つの顕著なマルチモーダル・ベンチマーク・データセットについて広範な評価を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:07:48 GMT)
Recovering Manifold Structure Using Ollivier-Ricci Curvature [1.9] 我々は、Ollivier-Ricci曲率と推定距離歪みに基づく基準を用いて、隣り合うグラフからスプリアスエッジをプルーする新しいアルゴリズムであるORC-ManLを紹介する。
我々のモチベーションは多様体学習から来ており、最も近い近傍グラフを生成するデータが低次元多様体からのノイズのあるサンプルで構成されている場合、周辺空間をショートカットするエッジは、データ多様体に沿って配置されるエッジよりも負のオリヴィエ・リッチ曲率を持つことを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:00:30 GMT)
A method for supervoxel-wise association studies of age and other non-imaging variables from coronary computed tomography angiograms [1.9] 冠状動脈造影による冠動脈造影における体積像と組織密度像の関連性について検討した。
我々は,画像分割,オブジェクト間画像登録,ロバストなスーパーボクセル相関解析に基づく新しい手法を開発した。
心室および心筋のDice係数と変換の逆整合性の観点から登録手法の評価を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:33:38 GMT)
DreamGarden: A Designer Assistant for Growing Games from a Single Prompt [1.9] 本稿では,Unreal Engineにおける多様なゲーム環境の開発を支援するAIシステムであるDreamGardenを紹介する。
提案手法のコアとなるのがLCM駆動型プランナーで、単一の高レベルプロンプトを階層的なアクションプランに分解することができる。
このシステムは、独立して成長し、シードプロンプト、プルーニング、フィードバックを通じてユーザーの介入に反応する計画と行動の庭としてユーザに提示される。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:49:07 GMT)
On the Creation of Representative Samples of Software Repositories [1.9] GitHubのようなソーシャルコーディングプラットフォームの出現により、研究者は研究のソースデータとして使うために何百万ものソフトウェアリポジトリにアクセスできるようになった。
現在のサンプリング法は、しばしばランダムな選択に基づいており、研究とは無関係な変数に依存している。
本稿では,ソフトウェアリポジトリの代表例を作成する手法を提案する。このような代表性は,リポジトリの個体群の特徴と実証研究の要件の両方に適切に一致している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:18:32 GMT)
Making Large Language Models into World Models with Precondition and Effect Knowledge [1.9] 本研究では,Large Language Models (LLM) を2つの重要な世界モデル関数の実行に利用することができることを示す。
我々は、我々のモデルが生み出す前提条件と効果知識が、世界力学の人間の理解と一致していることを検証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:37:50 GMT)
Making Large Language Models into World Models with Precondition and Effect Knowledge [1.9] 本研究では,Large Language Models (LLM) を2つの重要な世界モデル関数の実行に利用することができることを示す。
我々は、我々のモデルが生み出す前提条件と効果知識が、世界力学の人間の理解と一致していることを検証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:37:50 GMT)
Informed Dynamic Scheduling for QLDPC Codes [1.8] SRBPに基づくQLDPC符号に対するエッジワイド動的スケジューリング(IDS)の検討
この障害と量子トラップセットに対処するために、エッジプール設計とエラー事前補正を含む2つの戦略が導入された。
The novel sRBP with a predict-and-reduce-error mechanism (PRE-sRBP)。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:00:15 GMT)
LLM generated responses to mitigate the impact of hate speech [1.8] 本稿では,自動モデレーションシステムの設計について概説し,ユーザエンゲージメントを測定するための簡易な指標を提案する。
談話モデレーションのための生成AIの展開における倫理的考察と課題について論じる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 21:29:40 GMT)
Deep Kernel Posterior Learning under Infinite Variance Prior Weights [1.6] ベイジアンディープニューラルネットワークは、条件付きガウス表現を持つ各層に$alpha$stableのマージンを持つプロセスに収束することを示す。
また,浅い多層ネットワーク上の浅層ネットワーク上でのLor'ia & Bhadra (2024)の結果の有用な一般化も提供する。
競合するアプローチに対する計算的および統計的利点は、シミュレーションやベンチマークデータセットでの実証において際立っている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:13:17 GMT)
DeTPP: Leveraging Object Detection for Robust Long-Horizon Event Prediction [1.5] 本稿では,コンピュータビジョンからオブジェクト検出技術に触発された新しいアプローチであるDeTPPを紹介する。
DeTPPはユニークなマッチングベースの損失関数を採用し、確実に予測可能なイベントを選択的に優先順位付けする。
提案したハイブリッドアプローチは、大規模トランザクションデータセット上での次のイベント予測の精度を最大2.7%向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:21:50 GMT)
SegHeD: Segmentation of Heterogeneous Data for Multiple Sclerosis Lesions with Anatomical Constraints [1.5] 機械学習モデルは、自動MS病変セグメンテーションの大きな可能性を実証している。
SegHeDは、異種データを入力として組み込むことができる、新しいマルチデータセットマルチタスクセグメンテーションモデルである。
SegHeDは5つのMSデータセットで評価され、すべての、新しい、消滅するセグメンテーションで高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:21:43 GMT)
The Impact of Scanner Domain Shift on Deep Learning Performance in Medical Imaging: an Experimental Study [1.5] 我々は,異なる自動診断タスクにおいて,スキャナ領域シフトが畳み込みニューラルネットワーク性能に与える影響を評価する。
異なるスキャナーのデータに対するネットワーク性能は、ほぼ常に同じスキャナーのデータよりも悪い。
我々は、MRIやX線には存在しないCT取得システムの標準化された性質に、この落とし穴があると考えている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:51:37 GMT)
Test Time Learning for Time Series Forecasting [1.5] テストタイムトレーニング(TTT)モジュールは、MambaベースのTimeMachineなど、最先端モデルよりも一貫して優れている。
その結果,平均二乗誤差 (MSE) と平均絶対誤差 (MAE) に有意な改善が認められた。
この研究は、時系列予測の新しいベンチマークを設定し、スケーラブルで高性能な予測モデルにおける将来の研究の基礎を定めている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:40:10 GMT)
Test Time Learning for Time Series Forecasting [1.5] テストタイムトレーニング(TTT)モジュールは、MambaベースのTimeMachineなど、最先端モデルよりも一貫して優れている。
その結果,平均二乗誤差 (MSE) と平均絶対誤差 (MAE) に有意な改善が認められた。
この研究は、時系列予測の新しいベンチマークを設定し、スケーラブルで高性能な予測モデルにおける将来の研究の基礎を定めている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:40:10 GMT)
A Thematic Framework for Analyzing Large-scale Self-reported Social Media Data on Opioid Use Disorder Treatment Using Buprenorphine Product [1.5] ブプレノルフィン(Buprenorphine)は、食品医薬品局(FDA)が承認したオピオイド用薬物の1つである。
その人気にもかかわらず、個人はしばしばRedditのようなソーシャルメディアプラットフォームでブプレノルフィン治療に関する様々な情報を報告している。
本稿では,ソーシャルメディアから大規模データをキュレートし,分析し,自己申告された治療情報のニーズを特徴付けるためのテーマベースフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:04:21 GMT)
Logit-Q Dynamics for Efficient Learning in Stochastic Teams [1.4] ゲームにおける効率的な学習のための新しいロジット-Qダイナミクスのファミリーを提示する。
未知のダイナミックスを持つチームでは,ロジット-Qのダイナミクスが(ほぼ)効率のよい平衡に到達できることが示される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:02:46 GMT)
Enhancing LLM Fine-tuning for Text-to-SQLs by SQL Quality Measurement [1.4] Text-to-sにより、専門家でないユーザは、自然言語クエリを使用してデータベースから要求された情報を取得することができる。
GPT4やT5のような現在の最先端(SOTA)モデルは、BIRDのような大規模ベンチマークで素晴らしいパフォーマンスを示している。
本稿では,テキスト・ツー・ス・パフォーマンスを向上させるためにSQL Qualityのみを必要とする新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:21:51 GMT)
HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? [1.4] 金融、小売、ソーシャルネットワーク、ヘルスケアアプリケーションには、所定の時間内に複数の将来のイベントを正確に予測することが不可欠である。
コンピュータビジョンからの物体検出技術に触発された新しい評価手法を提案する。
今後の研究を支援するため, MTPPの長期予測を明示的に評価するために設計された最初のベンチマークである HoTPP をリリースする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:24:42 GMT)
Addressing Data Heterogeneity in Federated Learning with Adaptive Normalization-Free Feature Recalibration [1.3] フェデレートラーニング(Federated Learning)は、ステークホルダーのデータ所有を保護し、パフォーマンスと一般化を改善した分散コラボレーティブトレーニングパラダイムである。
本稿では、重み付け標準化とチャネルアテンションを組み合わせたアーキテクチャレベルの手法である、適応正規化自由特徴校正(ANFR)を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:16:56 GMT)
Deep Knowledge Tracing for Personalized Adaptive Learning at Historically Black Colleges and Universities [1.3] 本研究では,HBCUsにおけるSTEM教育におけるPAL実装のためのDKTに関する包括的データセットを構築した。
このデータセットには、プレーリービューA&M大学の8つのカレッジの17,181人の大学生を対象に、352,148の学習記録が含まれている。
実験により,学生の学術的成果を正確に予測する上で,DKTモデルの有効性が示された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:42:59 GMT)
Dimensionality Reduction and Nearest Neighbors for Improving Out-of-Distribution Detection in Medical Image Segmentation [1.3] この研究は、肝臓を分断する4つのSwin UNETRとnnU-netモデルのボトルネック特徴にマハラノビス距離(MD)ポストホックを適用した。
モデルが失敗した画像は、高性能で最小の計算負荷で検出された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:00:29 GMT)
Correlations Are Ruining Your Gradient Descent [1.2] 自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。
ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。
本稿では,ノード出力のデコレーションと白化のために提案された手法について述べるとともに,これを拡張し,分散コンピューティングや計算神経科学に特に有用な新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:27:13 GMT)
First-principles computational methods for quantum defects in two-dimensional materials: A perspective [1.2] 量子欠陥は、量子情報デバイスを構築するリソースを提供する材料における原子欠陥である。
本稿では、2次元材料における量子欠陥のスピンおよび電子的性質を予測するための第一原理計算法と課題について論じる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:06:37 GMT)
Towards Information Theory-Based Discovery of Equivariances [1.2] 対称性の存在は、システムに厳密な制約のセットを課す。
並行して、複雑性に制約のある学習と行動の原則モデルが、情報理論の手法の利用を増大させる。
本稿では,学習と情報制約のある適応行動に関する多くの原則研究において,生産的基盤として機能する情報ボトルネック原理の新たな変種を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:43:23 GMT)
Hierarchical Narrative Analysis: Unraveling Perceptions of Generative AI [1.2] 大規模言語モデル(LLM)を利用して,これらの構造を階層的な枠組みに抽出・整理する手法を提案する。
我々は,日本の文化庁が収集した生成AIに関する世論を分析して,このアプローチを検証する。
我々の分析は、生成的AIに対する多様な意見に影響を与える要因のより明確な可視化を提供し、合意と不一致の構造に関する深い洞察を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:05:11 GMT)
U-shaped and Inverted-U Scaling behind Emergent Abilities of Large Language Models [1.1] 大規模言語モデル(LLM)は、いくつかの下流タスクにおいて創発的な能力を示すことが示されている。
難解な質問に対してU字型のスケーリングを観察し、逆U字のスケーリングに続いて、簡単な質問に対して着実に改善する。
Slice-and-Sandwichと呼ばれる単純なパイプラインを提案し、しきい値を超える出現閾値とモデル性能の両方を予測する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:03:49 GMT)
An uncertainty-aware Digital Shadow for underground multimodal CO2 storage monitoring [1.1] Geological Carbon Storage GCSは、おそらく唯一利用可能なスケーラブルなネット負のCO2排出技術である。
機械学習に基づくデータ同化フレームワークを導入し、現実的な数値シミュレーションで検証する。
この研究は、不確実性を意識したインプリンシプルなスケーラブルなデジタルシャドウの概念の最初の証明である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:58:45 GMT)
Low depth amplitude estimation without really trying [1.1] 量子振幅推定アルゴリズムはモンテカルロシミュレーションの2次高速化を提供する。
それらは推定誤差の逆としてスケールする回路深さを必要とする。
量子アルゴリズム自体に古典モンテカルロ法を適用すれば、この制限を回避できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:59:33 GMT)
Enhancing Screen Time Identification in Children with a Multi-View Vision Language Model and Screen Time Tracker [1.1] 我々は,ウェアラブルセンサからのエゴセントリックなイメージを利用する新しいセンサ情報フレームワークを開発した。
我々は、エゴセントリックな画像シーケンスから複数のビューを抽出し、画面露出を動的に解釈するマルチビューVLMを考案した。
結果は、子どもの自然主義的環境における画面露出に関する行動研究を最適化する、このモニタリングアプローチの約束を支持した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:16:47 GMT)
CASE: Efficient Curricular Data Pre-training for Building Assistive Psychology Expert Models [1.1] 本研究では、自然言語処理(NLP)パイプラインを用いて、コンサルティングに使用されるオンラインメンタルヘルスフォーラムのテキストデータを解析する。
フォーラムの投稿を分析することで、これらのパイプラインは、すぐに専門家の注意を必要とするかもしれないユーザーにフラグを付けることができる。
Case-BERTは既存の手法に比べて優れた性能を示し、抑うつのf1スコアは0.91、不安の0.88を達成している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:44:46 GMT)
RS-FME-SwinT: A Novel Feature Map Enhancement Framework Integrating Customized SwinT with Residual and Spatial CNN for Monkeypox Diagnosis [1.1] Monkeypox(MPox)は世界的な重要な関心事として現れており、ケースは毎日着実に増えている。
ディープラーニングは自動化されたソリューションを提供するが、データセットにはデータ不足、テクスチャ、コントラスト、クラス間の多様性、その他の皮膚感染症との類似性が含まれる。
残留学習と空間爆発的畳み込みニューラルネットワーク(CNN)の学習能力と、カスタマイズされたスウィントランスフォーマー(RS-FME-SwinT)を統合してMPox診断を捉えるハイブリッドアプローチが提案されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:57:57 GMT)
Hybrid Quantum-inspired Resnet and Densenet for Pattern Recognition [1.0] パターン認識のための残差および高密度接続に根ざした2つのハイブリッド量子インスピレーションニューラルネットワークを提案する。
数値実験により,我々のハイブリッドモデルの認識精度は従来の量子インスピレーションモデルよりも2%-3%高いことがわかった。
我々のハイブリッドモデルは、ロバスト性、特に様々な非対称雑音を持つパラメータ攻撃に対する耐性において、純粋古典モデルよりも優れている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 04:06:27 GMT)
SkyAI Sim: An Open-Source Simulation of UAV Aerial Imaging from Satellite Data [0.9] 視覚ベースのナビゲーション(VBN)のための現実の空中画像の取得は、可用性と条件が限られているため困難である。
SkyAI Simは、UAVをシミュレートして、現実の可視光帯域仕様で、鳥眼の衛星画像をゼロヨーでキャプチャする、魅力的な代替手段を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:08:29 GMT)
Overpredictive Signal Analytics in Federated Learning: Algorithms and Analysis [0.9] エッジ信号処理は、フェデレート学習で提案されるクライアントサーバモデルにおける分散学習と推論を容易にする。
本稿では,効率的な凸最適化フレームワークを用いて,クライアントデバイスにおける過剰予測信号近似を計算するアルゴリズムを提案する。
また,提案した分散アルゴリズムの性能を,公用住宅エネルギー消費データセット上で示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:21:55 GMT)
Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting [0.8] 自動デモ(Auto-Demo Prompting)は、初期質問からの問合せペアを、その後の回答推論の実証としてバッチ内で活用する、新しいアプローチである。
本手法は,バッチプロンプトと少数ショットプロンプトのギャップを効果的に埋め,トークン使用率のわずかな妥協だけで性能を向上する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:34:40 GMT)
SEMF: Supervised Expectation-Maximization Framework for Predicting Intervals [0.8] Supervised expectation-Maximization Framework (SEMF)は、完全なデータまたは欠落したデータセットの予測間隔を生成するための汎用的でモデルに依存しないアプローチである。
SEMFは、従来教師なし学習で用いられてきた期待最大化アルゴリズムを教師付き文脈に拡張し、不確実性推定に潜在変数モデリングを利用する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 09:25:10 GMT)
Unlocking the Potential: Multi-task Deep Learning for Spaceborne Quantitative Monitoring of Fugitive Methane Plumes [0.8] メタン濃度インバージョン(英語版)、プルームセグメンテーション(英語版)、エミッションレート推定(英語版)は、メタン排出モニタリングの3つのサブタスクである。
リモートセンシング画像からメタン排出量の定量モニタリングを行うための,新しいディープラーニングベースのフレームワークを提案する。
メタン濃度インバージョンのためのU-Netネットワーク,メタン配管セグメンテーションのためのMask R-CNNネットワーク,メタン排出率推定のためのResNet-50ネットワークを訓練する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:32:19 GMT)
$^{229}\mathrm{ThF}_4$ thin films for solid-state nuclear clocks [0.8] 真空紫外229ドルTh核異性体遷移に基づく原子時計は、現在の光学原子時計よりも頑丈であることが期待されている。
高濃度の229ドルThドープ結晶の成長と取扱いは、229ドルのTh材料の不足と放射能のために困難である。
ここでは, 物理的蒸着法で成長した229ドルThF$_4$薄膜において, 核移行のレーザー励起を示すことにより, 潜在的にスケーラブルな解を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:03:06 GMT)
Neural Context Flows for Meta-Learning of Dynamical Systems [0.7] 本稿では,不確実性推定を含むメタラーニングフレームワークであるNeural Context Flow (NCF)を紹介する。
NCFは6つの線形および非線形ベンチマーク問題のうち5つで最先端のOut-of-Distribution性能を達成する。
本研究は,NCFが物理科学の基礎モデルにもたらす影響を明らかにするものである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:18:44 GMT)
Extending Contextual Self-Modulation: Meta-Learning Across Modalities, Task Dimensionalities, and Data Regimes [0.7] Contextual Self-Modulation (CSM)は、Neural Context Flow (NCF)フレームワークの強力な正規化メカニズムである。
CSMを無限次元タスクに拡張する$i$CSMと、スケーラビリティを向上させる$i$NCFという2つの拡張を導入する。
これらの拡張は、様々なタスクに関する包括的な実験を通じて実証される。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:19:35 GMT)
Leray-Schauder Mappings for Operator Learning [0.7] 結果として得られる手法は、(おそらく非線形な)作用素の普遍近似であることを示す。
提案手法の有効性を2つのベンチマークデータセットで示し,その結果がアートモデルに匹敵することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:01:01 GMT)
A Deep Learning Approach for Imbalanced Tabular Data in Advertiser Prospecting: A Case of Direct Mail Prospecting [0.7] 本稿では,新たな顧客を特定するための教師付き学習手法を提案する。
このフレームワークは、膨大な数の数値的および分類的特徴を持つ大きな不均衡データセットに取り組むように設計されている。
我々のフレームワークは、オートエンコーダとフィードフォワードニューラルネットワークの2つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:19:40 GMT)
A Two-Stage Proactive Dialogue Generator for Efficient Clinical Information Collection Using Large Language Model [0.7] 患者情報収集作業を自動化する診断対話システムを提案する。
医療史と会話のロジックを活用することで、会話エージェントは複数回にわたる臨床クエリを作成できる。
実世界の医療会話データセットを用いた実験結果から,本モデルが実際の医師の会話スタイルを模倣した臨床クエリを生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:32:11 GMT)
Can We Delegate Learning to Automation?: A Comparative Study of LLM Chatbots, Search Engines, and Books [0.7] 教科書やウェブ検索といった従来のリソースからの移行は、教育者の間で懸念を呼び起こす。
本稿では,教育者の立場から3つの主な懸念点を体系的に明らかにする。
その結果,LLMは受動的学習を促進することなく,鍵概念の包括的理解を支援するが,知識保持効果は限られていた。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:16:54 GMT)
Is uniform expressivity too restrictive? Towards efficient expressivity of graph neural networks [0.6] グラフニューラルネットワーク(GNN)は、入力グラフのサイズによってパラメータなしでクエリを表現できる。
入力グラフの最大次数に対してパラメータの数が対数的であるように,多くのGNNがGC2クエリを効率的に表現できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:09:12 GMT)
Impact of White-Box Adversarial Attacks on Convolutional Neural Networks [0.6] 本稿では,畳み込みニューラルネットワーク(CNN)のホワイトボックス攻撃に対する感受性について検討する。
本研究は、敵の脅威に対するCNNの堅牢性に関する知見を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:24:08 GMT)
Gaussian kernel expansion with basis functions uniformly bounded in $\mathcal{L}_{\infty}$ [0.6] カーネル拡張は、機械学習にかなりの関心を持つトピックである。
この論文における最近の研究は、$mathcalL_infty$で一様有界基底関数を仮定することによって、これらの結果のいくつかを導いた。
我々の主な成果は、任意の$p>1$に対して$ell_p$の重みを持つガウス核展開の$mathbbR2$の構築である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:10:30 GMT)
Segmentation Strategies in Deep Learning for Prostate Cancer Diagnosis: A Comparative Study of Mamba, SAM, and YOLO [0.6] 本研究は,前立腺癌組織像の分画のための深層学習法であるMamba,SAM,YOLOの比較分析を行った。
Gleason 2019 と SICAPv2 という2つの総合データセット上で,Dice スコア,精度,リコール指標を用いてこれらのモデルの性能を評価した。
H-Vmunetモデルの高度なアーキテクチャは、高階の視覚状態空間と2D選択的スキャン操作を統合することで、効率的かつセンシティブな病変検出を可能にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:18:16 GMT)
Classification of Gleason Grading in Prostate Cancer Histopathology Images Using Deep Learning Techniques: YOLO, Vision Transformers, and Vision Mamba [0.6] 本研究は,3つの深層学習手法であるYOLO,Vision Transformers,Vision Mambaの有効性を,病理組織像からグリーソングレードを正確に分類し,比較した。
ビジョン・マンバ(Vision Mamba)は、病理画像におけるグリーソン分類の最も効果的なモデルとして登場し、精度と計算効率のバランスを提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:15:25 GMT)
Hidden in Plain Text: Emergence & Mitigation of Steganographic Collusion in LLMs [0.6] 他者の不利に対するコラボレーションは、望ましくないエージェント協力の中心的な形態として認識されている。
エージェント通信における情報隠蔽(ステガノグラフィー)の使用は、衝突を事実上検出できないものにする可能性がある。
このことは、ステガノグラフィーの共謀能力を監視・緩和するための評価フレームワークの必要性を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:18:33 GMT)
Sequential transport maps using SoS density estimation and $α$-divergences [0.6] 輸送型密度推定法は, 近似密度から試料を効率よく生成できるため, 関心が高まりつつある。
本稿では,$alpha$-divergencesの情報幾何学的性質に基づいて,シーケンシャルトランスポートマップの新たな収束解析を行う。
本研究では,ベイズ推論問題と教師なし学習課題について数値解析を行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:37:12 GMT)
Emotion-Aware Response Generation Using Affect-Enriched Embeddings with LLMs [0.6] 本研究は,精神医学的応用における大規模言語モデル(LLM)の感情的・文脈的理解を高めることの課題に対処する。
LLAMA 2、Flan-T5、ChatGPT 3.0、ChatGPT 4.0といった最先端のLLMと、複数の感情レキシコンを統合する新しいフレームワークを導入する。
一次データセットは、カウンセリング・アンド・サイコセラピー・データベースから2000以上の治療セッションの書き起こしを含み、不安、うつ病、トラウマ、中毒に関する議論をカバーしている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:01:05 GMT)
Towards quantum advantage with photonic state injection [0.5] 本稿では,量子モデルの表現力を高めるための近距離フォトニック量子デバイスの提案を行う。
このスキームは、より制御可能な状態を生成することができる測定に基づく手法である状態注入に依存している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:10:54 GMT)
Two Views Are Better than One: Monocular 3D Pose Estimation with Multiview Consistency [0.5] 本稿では,2次元の教師のみによるトレーニングデータの追加を可能にするために,新たな損失関数であるマルチビュー整合性を提案する。
実験の結果,2つの視点を90度にオフセットすれば良好な性能が得られることがわかった。
本研究は3次元ポーズ推定におけるドメイン適応の新たな可能性を導入し,特定のアプリケーション向けにモデルをカスタマイズするための実用的で費用対効果の高いソリューションを提供する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:17:05 GMT)
Incorporating Metabolic Information into LLMs for Anomaly Detection in Clinical Time-Series [0.5] 本稿では, 生体試料の構造と時間的変化をよりよく把握するために, 代謝経路に関する情報を統合する, 代謝経路駆動型プロンプト法(MPP)を提案する。
本手法をスポーツにおけるドーピング検出に適用し,ステロイド代謝に着目し,スポーツ選手の実世界データを用いて評価した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:05:21 GMT)
A Census-Based Genetic Algorithm for Target Set Selection Problem in Social Networks [0.5] 本稿では,TSS問題に対する「国勢調査に基づく遺伝的アルゴリズム」という新しいアプローチを提案する。
このアルゴリズムでは、人口統計の考え方を用いて、人口の個々の情報を収集し、保存する。
本論文では,本論文から14個の実生活ソーシャルネットワークインスタンスの大規模グラフ上で提案アルゴリズムを実行する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:21:52 GMT)
VectorGraphNET: Graph Attention Networks for Accurate Segmentation of Complex Technical Drawings [0.4] 本稿では,PDF形式での技術図面からベクトルデータを抽出し,解析する手法を提案する。
提案手法では,PDFファイルをSVGフォーマットに変換し,機能豊富なグラフ表現を生成する。
次に、階層的なラベル定義を持つグラフアテンション変換器を適用し、正確な線レベルセグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:53:20 GMT)
PerTok: Expressive Encoding and Modeling of Symbolic Musical Ideas and Variations [0.4] Cadenzaは、シンボリック・ミュージック・アイデアの表現的バリエーションを予測するための、新しい多段階生成フレームワークである。
提案するフレームワークは,1)コンストラクタと2)パフォーマの2段階からなる。
我々のフレームワークはミュージシャンにインスピレーションを与える目的で設計、研究、実装されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:11:31 GMT)
WEEP: A method for spatial interpretation of weakly supervised CNN models in computational pathology [0.4] モデル解釈のための新しい方法 Wsi rEgion sElection aPproach (WEEP) を提案する。
乳がん計算病理領域における二分分類課題におけるWEEPについて検討した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:09:18 GMT)
MyData: A Comprehensive Database of Mycetoma Tissue Microscopic Images for Histopathological Analysis [0.3] Mycetomaは慢性で無視された炎症性疾患であり、熱帯および亜熱帯地域で流行する。
本疾患は真菌(真菌)と放線菌(細菌)の2種類に分類される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:56:56 GMT)
Representations learnt by SGD and Adaptive learning rules: Conditions that vary sparsity and selectivity in neural networks [0.3] 相互干渉を減らす効果的な方法は、神経細胞の空間性と選択性に見られる。
本稿では,ニューラルネットワークの空間性や選択性を自然に向上させる諸条件について検討する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:32:31 GMT)
Scaffolding Research Projects in Theory of Computing Courses [0.3] The Theory of Computing (ToC) はCSカリキュラムにおいて重要なコースである。
最近の研究は、学生が実際のCSコンファレンスに応募しているかのようにToCの問題にアプローチし、提示するモック・カンファレンス・プロジェクトという、新しいタイプの課題を実験した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:20:27 GMT)
Trying to be human: Linguistic traces of stochastic empathy in language models [0.3] 大規模言語モデル(LLM)は、コンピュータ生成コンテンツの質向上を支える重要な要因である。
私たちの研究は、2つの重要な要因が人間とAIの人種にどのように貢献するかをテストする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:46:40 GMT)
Morphology-based non-rigid registration of coronary computed tomography and intravascular images through virtual catheter path optimization [0.3] 血管内画像の剛性および非剛性マッチングのための形態学的枠組みをCCTA画像に提示した。
本フレームワークは,大規模なマルチモーダル臨床研究を行うために必要な手作業を削減する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:04:09 GMT)
Do Not Trust Power Management: A Survey on Internal Energy-based Attacks Circumventing Trusted Execution Environments Security Properties [0.2] 2015年以降、エネルギー管理機構を利用したソフトウェア対応のハードウェア攻撃が出現している。
彼らの目標は、TEEのセキュリティ保証をバイパスし、暗号鍵のような機密情報を公開することである。
本稿では,これらの攻撃の包括的知識調査と文献対策の評価について述べる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:02:57 GMT)
Optimal Causal Representations and the Causal Information Bottleneck [0.2] Information Bottleneck (IB) 法は表現学習において広く用いられている手法である。
IBのような従来の手法は純粋に統計的であり、根底にある因果構造を無視する。
IB の因果拡張である Causal Information Bottleneck (CIB) を提案し、対象変数に対する因果制御を維持しつつ、選択した変数の集合を圧縮する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:02:06 GMT)
Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning [0.2] 深部強化学習における一般化されたガウス誤差モデリングのための新しい枠組みを提案する。
我々のフレームワークは、高次モーメント、特にカルトーシスを付加することにより、エラー分散モデリングの柔軟性を向上させる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:46:06 GMT)
Advances in quantum algorithms for the shortest path problem [0.2] 我々は、構造化インスタンスの問題を解くために、隣接リストモデルに2つの有界エラー量子アルゴリズムを与える。
最初のアプローチは、量子フロー状態をサンプリングし、より小さな問題に対して古典的なアルゴリズムを実行することによって、元のグラフをスパース化することに基づいている。
2つ目のアプローチは、$tildeO(lsqrtm)$ stepsで最も短いパスを出力する分割および征服手順に基づいている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:33:06 GMT)
QESM: A Leap Towards Quantum-Enhanced ML Emulation Framework for Earth and Climate Modeling [0.2] 現在の気候モデルは、十分な解像度がないため、しばしば正確さに苦しむ。
我々は、CNNのような従来のモデルを量子バージョンに置き換える。
これらの量子モデルは、気候関連の結果を予測する上でより正確であることが判明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:40:37 GMT)
Application of Segment Anything Model for Civil Infrastructure Defect Assessment [0.2] 本研究では,コンクリート構造物のひび割れ検出のための2つの深層学習モデルSAMとU-Netの性能評価を行う。
その結果, それぞれのモデルには, 異なる種類のひび割れを検知する独自の強度と限界があることが示唆された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 00:36:38 GMT)
Forte : Finding Outliers with Representation Typicality Estimation [0.1] 生成モデルは、それを訓練する実際のデータとほぼ区別できない合成データを生成することができる。
OOD検出に関する最近の研究は、生成モデルの可能性が最適なOOD検出器であるという疑念を提起している。
本稿では,表現学習と,多様体推定に基づく情報的要約統計を利用した新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:26:37 GMT)
Analyzing Byte-Pair Encoding on Monophonic and Polyphonic Symbolic Music: A Focus on Musical Phrase Segmentation [0.1] Byte-Pair
(BPE)は、自然言語処理において、サブワードの語彙を構築するためによく使われるアルゴリズムである。
音楽コンテンツの種類によってBPEがどのように振る舞うかを検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:59:58 GMT)
Integrating Visual and Textual Inputs for Searching Large-Scale Map Collections with CLIP [0.1] 自然言語入力を用いて大規模地図コレクションを対話的に検索する可能性について検討する。
ケーススタディでは,議会図書館のAPIを通じて公開されている地図の572,842枚を採用。
本稿では,議会地理地図局の職員との相談で作成した検索結果について紹介する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 02:51:02 GMT)
Variational Quantum Eigensolver Approach to Prime Factorization on IBM's Noisy Intermediate Scale Quantum Computer [0.1] 提案アルゴリズムは変分量子固有解法 (VQE) に基づいており, 古典的手法を用いて与えられたハミルトニアン基底状態を求める。
本研究は,IBMの実量子コンピュータと古典シミュレータの両方において,提案手法の性能を評価する数値実験である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:33:36 GMT)
Words that Represent Peace [0.0] 我々は、より高い平和ニュースは、財政、日々の行動、健康のテーマによって特徴づけられ、低い平和ニュースは、政治、政府、法的問題のテーマによって特徴づけられることを発見した。
この研究は、平和のレベルを測り、それらの言葉の下にある社会的過程を特定するための出発点を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:23:48 GMT)
What is lost in Normalization? Exploring Pitfalls in Multilingual ASR Model Evaluations [0.0] 本稿では,OpenAI Whisper,MetaのMMS,Seamless,アセンブリAIのConformerなど,主要なASRモデルのテキスト正規化ルーチンについて検討する。
我々の研究は、現在のテキスト正規化の実践が、公正な比較のためにASR出力を標準化することを目的としている一方で、Indicスクリプトに適用した場合、根本的な欠陥があることを明らかにする。
本稿では,言語学の専門知識を生かしたテキスト正規化ルーチン開発へのシフトを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:40:25 GMT)
Web3 and the State: Indian state's redescription of blockchain [0.0] この記事は、NITI(National Institution for Transforming India) Aayog(英語版)の議論論文と、インドにおけるブロックチェーンの非金融的利用を提唱する電子情報技術省(英語版)の戦略論文を詳しく書いている。
この論文は、ブロックチェーンシステムがいかに"分散"に指定されているかを示すものだが、州が仲介者として再発明し、再確立する最近の効果を示している。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:40:38 GMT)
Volichenko-type metasymmetry of braided Majorana qubits [0.0] 本稿では, ブレイドマヨラナ量子ビットのパラ統計学に関連付けられた異なる数学的構造を示す。
混合ブラケットハイゼンベルク-リー代数が導入された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:03:00 GMT)
Using Style Ambiguity Loss to Improve Aesthetics of Diffusion Models [0.0] 創造的なテキスト・ツー・イメージモデルを教えるには、スタイルの曖昧さの損失を使用する必要がある。
本研究では,拡散モデルを用いて,創造性を近似するスタイルあいまいさ学習の目的について検討する。
スタイルのあいまいさの損失で訓練されたモデルは,ベースライン拡散モデルやGANよりも優れた画像を生成することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:05:30 GMT)
Urdu Dependency Parsing and Treebank Development: A Syntactic and Morphological Perspective [0.0] 依存関係解析を用いて、ウルドゥー語でニュース記事を分析する。
最良ラベル付き精度(LA)は70%,未ラベル付きアタッチメントスコア(UAS)は84%であった。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:44:26 GMT)
Universal bounds in quantum metrology in presence of correlated noise [0.0] 時間的および空間的相関を含む一般量子力学モデルの基本的境界を導出する。
境界は一般に厳密であることは保証されていないが、その厳密性は数値複雑性を増大させることで体系的に増大する可能性がある。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:00:00 GMT)
Universal and robust dynamic decoupling controls for zero-field magnetometry by using molecular clock sensors [0.0] ダイヤモンドおよび炭化ケイ素(SiC)およびホストマトリックス制御による分子スピンにおける色中心は、ナノスケールの量子センシングに期待できる。
しかし、その内在対称性や宿主行列の高局所ひずみのため、大きな横ゼロフィールド分割(ZFS)は避けられないことが多い。
我々は、指向性に沿って駆動する高周波(RF)フィールドとマイクロ波(MW)ダイナミックパルスシーケンスを組み合わせることで、この問題に対処する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:33:14 GMT)
Universal Logical Quantum Photonic Neural Network Processor via Cavity-Assisted Interactions [0.0] 量子フォトニクスニューラルネットワークを用いて任意の多モード多光子状態に対する論理量子演算を準備・実行するためのアーキテクチャを提案する。
提案アーキテクチャは、誤り訂正量子計算を可能にする、短期的な量子フォトニックプロセッサの道を開くものである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:21:50 GMT)
Tree-like process tensor contraction for automated compression of environments [0.0] そこで本研究では,PT-MPO縮合の順序を逐次的にツリー様のスキームに変更することにより,ACEの整合性の向上が可能であることを示す。
事前選択手法の欠点は、MPO圧縮が最適以下であり、逐次結合や圧縮よりもエラーの蓄積が多いことである。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:14:07 GMT)
TorchSISSO: A PyTorch-Based Implementation of the Sure Independence Screening and Sparsifying Operator for Efficient and Interpretable Model Discovery [0.0] 記号回帰(SR)は、代数モデルの構造とパラメータの両方を探索する強力な機械学習手法である。
本稿では、PyTorchフレームワーク上に構築されたPythonネイティブ実装であるTorchSISSOを紹介する。
我々は,TorchSISSOが本来のSISSOの性能と様々なタスクで一致しているか,上回っていることを実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:02:17 GMT)
Topological entanglement and number theory [0.0] 3dチャーン・サイモンズ理論の文脈における位相的多界絡みの研究の最近の発展は、絡み合い測度と数論の間の強い相互作用を示唆している。
我々は、$k から infty$ の半古典的極限において、これらのエントロピーが有限値に収束することを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:43:57 GMT)
Thermal Purcell effect and cavity-induced renormalization of dissipations [0.0] 私はその材料に吸収された放射熱の簡単な表現を導き出す。
キャビティの存在によってどのように変化するのかを考察し、適切なキャビティジオメトリのために劇的に拡張されていることを示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:29:46 GMT)
The temperature dependent thermal potential in Quantum Boltzmann equation [0.0] 導電性電子の散乱に起因する減衰力の分布関数により熱スカラーおよびベクトルポテンシャルを表現する。
QBEにおける量子補正項の影響も考慮され、減衰力だけでなく、ドリフト項の異常速度にも寄与する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:19:10 GMT)
The NetMob23 Dataset: Population Density and OD Matrices from Four LMIC Countries [0.0] NetMob24データセットは、さまざまな学術分野の研究者が、2年間(2019年と2020年)に4カ国にまたがる包括的なデータセットにアクセスするためのユニークな機会を提供する。
このデータセットは、調査目的で匿名データ収集に自発的に同意したユーザから収集されたモバイルアプリケーション(アプリ)データからのプライバシー保護データセットを含む。
この参照データセットが新たな研究手法の創出と研究成果の集約を促進することを願っている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:18:36 GMT)
The NetMob2024 Dataset: Population Density and OD Matrices from Four LMIC Countries [0.0] NetMob24データセットは、さまざまな学術分野の研究者が、2年間(2019年と2020年)に4カ国にまたがる包括的なデータセットにアクセスするためのユニークな機会を提供する。
このデータセットは、調査目的で匿名データ収集に自発的に同意したユーザから収集されたモバイルアプリケーション(アプリ)データからのプライバシー保護データセットを含む。
この参照データセットが新たな研究手法の創出と研究成果の集約を促進することを願っている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:18:36 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence [0.0] モデルオープンネスフレームワーク(MOF, Model Openness Framework)は、その完全性とオープン性に基づいて機械学習モデルを評価する分類システムである。
MOFは、適切なオープンライセンスの下で、モデル開発ライフサイクルの特定のコンポーネントを含め、リリースする必要がある。
このフレームワークは、オープンであると主張するモデルの誤った表現を防止し、研究者や開発者が許容ライセンスの下ですべてのモデルコンポーネントを提供することを誘導し、個人や組織が安全に採用可能なモデルを特定するのを助けることを目的としている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:16:19 GMT)
The Effect of Sampling Temperature on Problem Solving in Large Language Models [0.0] 本研究では,サンプル温度が大規模言語モデル(LLM)の性能に及ぼす影響について検討する。
その結果, 0.0~1.0の温度変化は, LLMの性能に統計的に有意な影響を与えないことが示唆された。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:17:49 GMT)
TPP-LLM: Modeling Temporal Point Processes by Efficiently Fine-Tuning Large Language Models [0.0] 時間的ポイントプロセス(TPP)は、ソーシャルネットワーク、交通システム、eコマースなどのドメインにおけるイベントのタイミングと発生をモデル化するために広く用いられている。
イベントシーケンスのセマンティックな側面と時間的側面の両方をキャプチャするために,大規模言語モデル(LLM)とTPPを統合する新しいフレームワークであるTPP-LLMを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:17:24 GMT)
Supertrust: Foundational AI alignment pivoting from permanent control to mutual trust [0.0] 人類はいつか、私たちよりもはるかにインテリジェントなAIシステムを作るだろうと広く期待されています。
この問題を解決するための現在の制御ベースの戦略は、不信の危険な表現を埋め込んでいる。
超トラストメタストラテジーは、長期的基盤的ミスアライメントを防止するために提案されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:55:16 GMT)
Supermaps between channels of any type [0.0] 任意のタイプのチャネル間の決定論的スーパーマップは、単純な回路を用いて実現可能であることを示す。
チャネルには、POVM、量子機器、古典的に制御された量子チャネルのファミリー、古典的なチャネル、量子マルチメーターなどが含まれる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:56:26 GMT)
Stars, Stripes, and Silicon: Unravelling the ChatGPT's All-American, Monochrome, Cis-centric Bias [0.0] 論文はこれらの課題に対処するための学際的な取り組みを求めている。
ガバナンスフレームワークを確立するために、研究者、実践者、ステークホルダー間のコラボレーションの必要性を強調します。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 08:55:00 GMT)
SpaceRaceEdu: developing an educational multi-player videogame for self-study and assessment [0.0] SpaceRaceEduは、ソーシャルで教育的な性質を持つマルチプレイヤーゲームである。
教員が訓練・評価活動として、学生が学習・評価のツールとして利用することができる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:50:07 GMT)
SinkSAM: A Monocular Depth-Guided SAM Framework for Automatic Sinkhole Segmentation [0.0] 本稿では, 閉鎖型うつ病の従来の地形計算と, SAM(Segment Anything Model)を併用したシンクホールセグメンテーションの枠組みを提案する。
1) SAMとのトポグラフィ計算の統合により,シンクホール境界セグメンテーションのピクセルレベル改善が可能,(2) クローズド・プレッションに基づくコヒーレントな数学的プロンプト戦略は,未定義のシンクホール特徴の検出とセグメンテーションにおける純粋学習モデル(CNN)の限界に対処する,(3) ディープス・エキサイティングV2を用いた自動プロンプトは,光グラム量バイアスを排除し,LiDARデータに依存しないシンクホールマッピングを可能にする,(4) 確立されたシンクホールデータベースは,微細化を容易にする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:23:49 GMT)
Simple Construction of Qudit Floquet Codes on a Family of Lattices [0.0] コードを定義するシーケンス2体計測における簡単な条件のセットに基づいて,単純かつ汎用的なqudit Floquet符号の構成を提案する。
この構成には、特殊ケースとしてqubitとquditのFloquet符号の両方の既存の構成が含まれていることを示す。
さらに, 建設によって得られた任意のクディットフロッケ符号は, 物理的クエーディットに対して, 物理的クエーディット数として$frac12$に近づくエンコードされた論理クエーディットの速度を達成し, 格子の面上での物理クエーディットの数も大きくなる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:41:43 GMT)
Short-time Accuracy and Intra-electron Correlation for Nonadiabatic Quantum-Classical Mapping Approaches [0.0] 近年,従来のエレンフェスト法よりも高精度なマッピング手法が開発されている。
各種広く用いられているモデルに対して,短時間精度と電子間相関の相関関係を厳密に確立する。
LSC-IVR,PBME,Ehrenfest法は電子内相関を正しく再現できないことがわかった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:11:16 GMT)
Schwinger-Keldysh path integral formalism for a Quenched Quantum Inverted Oscillator [0.0] 平衡外力学によって支配される系の量子相関の時間依存的挙動について検討する。
次に,OTOCの時間依存的挙動から量子リアプノフを計算することでカオス的挙動を示す特定の事例について検討する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:23:10 GMT)
Robustness of contextuality under different types of noise as quantifiers for parity-oblivious multiplexing tasks [0.0] 我々は分析的および数値的なツールを用いて、異なる種類の雑音下でのPOMシナリオにおける文脈性のロバスト性を推定する。
我々は,任意の$n$-to-1 POMシナリオにおいて,文脈性から偏極へのロバスト性と成功率の関係を一般化する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:24:29 GMT)
Risk Alignment in Agentic AI Systems [0.0] 監視の少ない複雑な行動を実行することができるエージェントAIは、そのようなシステムをユーザ、開発者、社会と安全に構築し整合させる方法について、新たな疑問を提起する。
リスクアライメントは、ユーザの満足度と信頼には重要ですが、社会にさらに大きな影響をもたらします。
これらの質問の重要な規範的および技術的側面を論じる3つの論文を提示する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:21:08 GMT)
Review Non-convex Optimization Method for Machine Learning [0.0] 非局所最適化は、特にディープニューラルネットワークやサドルマシンのような複雑なモデルにおいて、機械学習を進める上で重要なツールである。
機械学習における非局所最適化手法と非局所最適化の応用について検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:34:33 GMT)
Resource Estimation for Delayed Choice Quantum Entanglement Based Sneakernet Networks Using Neutral Atom qLDPC Memories [0.0] 我々は、遅延チョイス量子エンタングルメントスワップを介して、ユーザを接続する中心的なパーティを備えた量子通信ネットワークを設計する。
この手法を従来の曲面符号と比較し、qLDPC符号が資源効率と論理量子ビット数において優れたスケーリングを提供することを示した。
短期的な到達可能なパッチサイズでは、中~高忠実度相関が達成でき、大規模商用量子ネットワークへの道を歩むことができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:39:45 GMT)
Recycling of a quantum field and optimal states for single-qubit rotations [0.0] 2レベル原子の正確な(絡み合いとエラーのない)回転を行うことのできる量子化場状態の族を導入する。
我々はこれらの状態と最近導入された「トランスコヒーレントな状態」の類似性と相違について論じる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 14:20:49 GMT)
Recursive Abstractive Processing for Retrieval in Dynamic Datasets [0.0] 本研究では,動的データセットにおける再帰的・漸進的木構造を効率的に維持するアルゴリズムを提案する。
また,クエリ中心の抽象処理を適用し,文脈品質を大幅に改善する検索後検索手法を提案する。
本手法は,検索アルゴリズムと互換性のあるブラックボックス後検索層として機能することで,他の手法の限界を克服する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:47:35 GMT)
Rabi oscillations at three-photon laser excitation of a single rubidium Rydberg atom in an optical dipole trap [0.0] 我々は、地上とリュードベルク状態の間の3光子ラビ振動を初めて観測した。
ライドバーグ原子を用いた量子情報処理における3光子ラビ振動のコヒーレンス時間とコントラストを高める方法について論じる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:14:20 GMT)
QuickCheck for VDM [0.0] 本稿では,VDM仕様の軽量検証ツールQuickCheckについて述べる。
このツールの目的は、証明義務を迅速に分類することである。
本稿では,このツールを用いて,VDM仕様の大規模な検証を行い,今後の方向性を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:25:10 GMT)
Quantum correlations, mixed states and bistability at the onset of lasing [0.0] 我々は、光子と電子の間の2つの粒子量子相関を全て含む単一モードレーザーのモデルを導出した。
レーザーは、非レーザーと非古典的コヒーレント状態の間の量子的不安定性の存在下で起こる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:29:42 GMT)
Quantum Photonic Gates with Two-Dimensional Random Walkers [0.0] 連続時間2次元ランダムウォーキング光子に基づく量子フォトニックゲートの設計を提案する。
これらのゲートは、光子が二酸化ケイ素散乱体を埋め込んだ2次元シリコンホスト媒体の中をランダムに歩く逆設計法を用いて実装することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:26:05 GMT)
QKD as a Quantum Machine Learning task [0.0] 本稿では,量子機械学習(QML)アルゴリズムのユースケースとして,量子鍵分布(QKD)プロトコルを提案する。
BB84プロトコルの量子回路実装に対する盗聴攻撃を最適化するQMLタスクを定義し,検討する。
本稿では,QMLアルゴリズムにおけるQKD後処理の古典的情報を用いて,集団攻撃のQML構築を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:03:38 GMT)
QCRMut: Quantum Circuit Random Mutant generator tool [0.0] 量子コンピューティングは近年増加しており、量子ソフトウェア工学とテストに関する出版物が急増していることが証明されている。
この技術が実用化に近づくにつれ、ソフトウェアの有効性の確保が不可欠になる。
本稿では、量子回路構造を利用した量子プログラムに適した突然変異ツールQCRMutを紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:54:00 GMT)
Probabilistic Analysis of Copyright Disputes and Generative AI Safety [0.0] この論文は、特に「逆比則」に重点を置き、重要な顕在的原則の構造化分析を提供する。
本稿では、生成AIによる著作権リスクの増大について検討し、生成モデルによる著作権物質へのアクセスが侵害のリスクを高めることを明らかにする。
この分析により、Near Access-Free (NAF) 条件はいくつかの侵害リスクを緩和するが、その正当性と有効性は特定の文脈で疑わしいことが判明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:36:39 GMT)
Piecewise linear potentials for false vacuum decay and negative modes [0.0] 本研究では, 正接解と負のモードを, 片方向線形三角形ポテンシャルのクラスで検討する。
バウンス解と作用は、一般時空次元$D$に対して解析的に得ることができる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:12:50 GMT)
Pauli Noise Learning for Mid-Circuit Measurements [0.0] 中間回路計測(MCM)におけるパウリ雑音の学習理論について紹介する。
MCMをベンチマークするスケーラブルな方法であるMCMサイクルベンチマークの作成に使用しています。
提案手法は既存のパウリ雑音学習手法に統合され,MCMを含む幅広い回路の特性評価とベンチマークを行うことができる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 06:26:37 GMT)
PT symmetric fermionic particle oscillations in even dimensional representations [0.0] 相対論的および非相対論的系の量子力学的粒子振動の新しいクラスについて述べる。
結果として生じる量子力学的進化はユニタリであり、確率は振動によって保存される。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 18:14:05 GMT)
Output-Constrained Decision Trees [0.0] 本稿では,マルチターゲット出力だけでなく,対象間の制約も扱える決定木を新たに導入する。
我々は,制約に対処する分割基準を調整し,実現可能な予測を得ることにより,従来の決定木をカスタマイズすることに注力する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 10:05:38 GMT)
Optimization by Parallel Quasi-Quantum Annealing with Gradient-Based Sampling [0.0] 本研究では、連続緩和による勾配に基づく更新と準量子アナリング(QQA)を組み合わせた別のアプローチを提案する。
数値実験により,本手法はiSCOと学習型解法に匹敵する性能を有する汎用解法であることが示された。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:11:08 GMT)
On the SAGA algorithm with decreasing step [0.0] 本稿では,Gradient DescentアルゴリズムとSAGAアルゴリズムを補間する新しい$lambda$-SAGAアルゴリズムを提案する。
我々は$lambda$-SAGAアルゴリズムの中央極限定理を確立する。
非漸近的な$mathbbLp$収束率を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:04:36 GMT)
On the Robustness of Machine Learning Models in Predicting Thermodynamic Properties: a Case of Searching for New Quasicrystal Approximants [0.0] この研究では、準結晶データセットのネストした金属間近似を合成し、それらの上で様々な機械学習モデルを訓練した。
我々の質的かつより重要なことは、予測の違いを定量的に評価することで、トレーニングサンプルの異なる合理的な変化が、予測される新しい物質の全く異なるセットにつながることを明らかに示しています。
また,プレトレーニングの利点を示し,安定度を高めるためのシーケンシャルトレーニングの簡易かつ効果的な手法を提案した。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:54:21 GMT)
Musings on SVD and pseudo entanglement entropies [0.0] 擬エントロピーとSVDエントロピーは、選択後を含む絡み合いエントロピーの一般化である。
この研究では、量子状態の空間上の測度としてそれらの性質を分析し、その余剰が2つの状態の違いの有用な特徴を与えると主張している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:09:39 GMT)
Multiple-Input Fourier Neural Operator (MIFNO) for source-dependent 3D elastodynamics [0.0] この研究は、材料特性を表す構造化3Dフィールドを扱うためのMultiple-Input Fourier Neural Operator (MIFNO)を導入している。
MIFNOは、地球の地殻における弾性波伝搬の問題に適用される。
HEMEWS-3Dデータベース上で, 異種領域の地震シミュレーションを30万回行った。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 11:59:27 GMT)
Multi-Omic and Quantum Machine Learning Integration for Lung Subtypes Classification [0.0] 量子コンピューティングと機械学習の融合は、マルチオミクスデータセット内の複雑なパターンを解き放つことを約束している。
我々は,バイオマーカー発見の可能性を秘めたLUADデータセットとLUSCデータセットの最適な識別方法を開発した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 23:16:31 GMT)
More precise edge detections [0.0] エッジ検出 (ED) はコンピュータビジョンの基本的なタスクである。
現在のモデルは相変わらず不満足な精度に悩まされている。
より正確な予測のためのモデルアーキテクチャはまだ調査が必要である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:24:45 GMT)
More precise edge detections [0.0] エッジ検出 (ED) はコンピュータビジョンの基本的なタスクである。
現在のモデルは相変わらず不満足な精度に悩まされている。
より正確な予測のためのモデルアーキテクチャはまだ調査が必要である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:24:45 GMT)
Monogamy of Nonlocal Games [0.0] 2ドル以上のゲームが2ドル以上の頂点を持つグラフ上のベル非局所性に違反できない場合を特徴付けます。
CHSHゲームは2つの分散シナリオでのみ非局所性を示す。
無限個のグラフに非局所性を示す2ドルのプレイヤゲームを提供する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 23:04:55 GMT)
Measuring Blackbody Noise in Silica Optical Fibres for Quantum and Classical Communication [0.0] 室内温度付近のシリカ単一モード光ファイバーの誘導モードに放射される黒体放射によるノイズについて検討した。
シリカ繊維の光学的に厚い20kmの限界付近の40degCで$approx$0.1光子/s/THzを測定した。
この雑音の大きさは小さいが、量子通信における生の忠実度に基本的な制限を課す付加雑音である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:37:31 GMT)
Matchgate hierarchy: A Clifford-like hierarchy for deterministic gate teleportation in matchgate circuits [0.0] 1999年にゴッテスマンとチュアンによって導入されたクリフォード階層は、量子ゲートの集合の普遍性の増大である。
本稿では,マッチゲート回路のコンテキストにおけるゲートテレポーテーションプロトコルとマッチゲート階層を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:00:01 GMT)
Machine learning a fixed point action for SU(3) gauge theory with a gauge equivariant convolutional neural network [0.0] 固定点格子作用は、離散化効果や量子レベルでの格子アーチファクトの減少の影響を受けない連続古典的性質を持つように設計されている。
ここでは、機械学習手法を用いて、固定点アクションのパラメータ化方法に関する質問を再考する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 22:51:02 GMT)
Linear cross-entropy certification of quantum computational advantage in Gaussian Boson Sampling [0.0] 我々は,対応する理想分布を用いてGBS実装を直接検証することで,この問題を回避することができると論じる。
我々は、LXEスコアと呼ばれる線形クロスエントロピーの修正版を用いて、与えられたGBS実装が対応する理想モデルにどの程度近いかを評価するのに役立つ基準値を求める。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:15:28 GMT)
LightSC: The Making of a Usable Security Classification Tool for DevSecOps [0.0] 我々は、emphDevOps対応のセキュリティ分類のための5つの原則を提案する。
次に、セキュリティ分類方法論をDevOps対応にする方法を例示します。
「このような作業は、使用可能なセキュリティコミュニティの中では新たなものと思われるので、我々のプロセスから一般的な3段階のレシピを抽出する。」
私たちのツールは(テスト対象者によって)設計フェーズでもっとも有用であるだけでなく、セキュリティクラスがソフトウェアの品質を評価するのに使用されるメトリクスの1つとなるテストフェーズでも有効であると認識されています。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:17:14 GMT)
Learning to learn ecosystems from limited data -- a meta-learning approach [0.0] 我々は,時間遅延フィードフォワードニューラルネットワークを用いたメタラーニングフレームワークを開発し,生態系の長期的挙動を予測する。
この枠組みは、限られたデータで生態系の「動的気候」を正確に再構築できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:23:34 GMT)
LLMs as Writing Assistants: Exploring Perspectives on Sense of Ownership and Reasoning [0.0] 執筆におけるオーナシップの感覚は、思考、時間、貢献の投資を制限し、アウトプットへのアタッチメントにつながります。
すべてのタスクが同等であっても、創造的なタスクでは、LLM(Large Language Models)を信用する傾向があります。
我々は,これらの問題を調査し,その基礎となる認知過程を理解して,書面における人間とコンピュータの相互作用についてより深い知識を得るための簡単な調査を行う。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:45:35 GMT)
Investigating on RLHF methodology [0.0] 本稿では,人間の嗜好をシミュレートする選好モデル(Preference Model)の訓練の特徴と,最良の結果を達成する上で不可欠な方法や詳細について論じる。
また、強化学習(Reinforcement Learning)を用いて大規模言語モデルを微調整し、直面した課題と克服方法を説明する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:46:22 GMT)
Introducing Flexible Monotone Multiple Choice Item Response Theory Models and Bit Scales [0.0] 本稿では,複数選択データに対する新しいモデルであるモノトーン多重選択(MMC)モデルを提案する。
MMCモデルは、適合性の観点から、従来の名目応答IRTモデルよりも優れていることを実証的に実証する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:33:16 GMT)
Integrating Protein Sequence and Expression Level to Analysis Molecular Characterization of Breast Cancer Subtypes [0.0] 本研究の目的は、乳癌のサブタイプの分子的特徴を改善するために、タンパク質配列データと発現レベルを統合することである。
タンパク質配列に設計された言語モデルであるProtGPT2を用いて,タンパク質配列の機能的および構造的特性をキャプチャする埋め込みを生成する。
これらの埋め込みはタンパク質の発現レベルと統合され、強化された生物学的表現を形成し、機械学習を用いて解析した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:05:48 GMT)
Inspection and Control of Self-Generated-Text Recognition Ability in Llama3-8b-Instruct [0.0] Llama3-8b-Instruct のチャットモデルでは,その出力を人間のものと確実に区別できることがわかった。
モデルが正しい自己書式認識判定を行うとき, モデル残ストリーム内のベクトルを差動活性化する。
ベクトルはモデルの振る舞いと知覚の両方を制御できることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:26:21 GMT)
Ink and Individuality: Crafting a Personalised Narrative in the Age of LLMs [0.0] LLMベースの筆記アシスタントへの依存が高まると、創造性と個性は時間とともに悪化する。
本研究は,様々な視点と概念を探索するための簡単な調査を行うことにより,これらの懸念について検討する。
これらの課題に対処することは、人間とコンピュータのインタラクションシステムを改善し、パーソナライズとパーソナライズのためのアシスタントを書くために不可欠である。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:45:53 GMT)
Getting in the Door: Streamlining Intake in Civil Legal Services with Large Language Models [0.0] 論理ルールとLCMを組み合わせたデジタル取り込みプラットフォームについて述べる。
このアプローチが正義のギャップを埋める上で有望な結果が得られ、最良のモデルはF1スコア.82に達する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:20:14 GMT)
GeoLife+: Large-Scale Simulated Trajectory Datasets Calibrated to the GeoLife Dataset [0.0] 実世界のデータの統計的特徴とシミュレーションデータの包括性を活用することにより、両方の利点を生かした。
これらの特徴を再現するために、人間の移動性の現実的なシミュレーションであるPattern of Life Simulationを校正する。
5年間で182, 1k, 5k, 10k, 50kでシミュレーションしたGeoLife+のデータを提供する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 15:01:13 GMT)
From Reward Shaping to Q-Shaping: Achieving Unbiased Learning with LLM-Guided Knowledge [0.0] Q-shapingは、エージェントトレーニングを加速するためにドメイン知識を取り入れた報酬形成の代替手段である。
我々は,大言語モデル(LLM)をプロバイダとして,20の異なる環境におけるQ-シェーピングを評価した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:10:07 GMT)
Financial Sentiment Analysis on News and Reports Using Large Language Models and FinBERT [0.0] 本稿では,大規模言語モデル(LLM)とFinBERTの財務感情分析への応用について検討する。
この研究は、感情分類精度を向上させるため、ゼロショットと少数ショット戦略による迅速なエンジニアリングの利点を強調している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 19:48:17 GMT)
Fast Summation of Radial Kernels via QMC Slicing [0.0] 一次元部分空間へのランダム射影と高速フーリエ和に依存するスライシングによりこの問題にアプローチする。
我々はスライシング誤差の有界性を証明し、プロジェクションを選択するための準モンテカルロ(QMC)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:12:29 GMT)
FanCric : Multi-Agentic Framework for Crafting Fantasy 11 Cricket Teams [0.0] この研究は、インドにおけるIPLの主要なファンタジークリケットリーグであるDream11に集中しており、参加者は実際のプレイヤーのパフォーマンスに基づいて仮想チームを作り、国際的に競争する。
本稿では,Large Language Models(LLM)を活用した高度なマルチエージェントシステムであるFanCricフレームワークと,クリケットにおけるファンタジーチーム選択を強化する堅牢なオーケストレーションフレームワークを紹介する。
FanCricは構造化データと非構造化データの両方を使って、高度なAI技術を組み込むことで従来の手法を超越している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:01:28 GMT)
Exploring strong locality : Quantum state discrimination regime and beyond [0.0] 我々は、$(2m+1) otimes 2 otimes (2m+1)$ systems の中で局所的に区別可能な集合のクラスを2つ提示する。
1つのクラスは局所的な操作によって非局所性を明らかにするが、もう1つのクラスは共同測定を必要とする。
また、データ隠蔽の文脈におけるそれらの重要な応用についても検討する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:08:10 GMT)
Evaluating the fairness of task-adaptive pretraining on unlabeled test data before few-shot text classification [0.0] 現代のNLP技術を評価するには、少ないショットの学習ベンチマークが重要である。
しかし、ベンチマークでは、ラベルのないテキストを簡単に利用できる方法が好まれる可能性がある。
ラベルなしテストセットテキストの事前学習によるバイアスを定量化する実験を行った。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 01:50:17 GMT)
Evaluating Large Language Models Using Contrast Sets: An Experimental Approach [0.0] 本研究では,スタンフォード自然言語推論データセットのコントラストセットを生成する革新的な手法を提案する。
我々の戦略は、動詞、副詞、形容詞をその同義語と自動置換して、文の本来の意味を保存することである。
本手法は,モデルの性能が真の言語理解に基づくのか,それとも単にパターン認識に基づくのかを評価することを目的とする。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:31:11 GMT)
Estimates of loss function concentration in noisy parametrized quantum circuits [0.0] 本稿では,深部量子回路における分散の正確な計算を可能にする新しい解析式を提案する。
単元量子コンピューティングの純粋可逆的文脈では生じない現象であるノイズ誘起吸収機構の出現を示す。
我々は,PQCの耐雑音性と,その表現力を高める可能性との間に深い関係を築けるように,一元的および非単元的力学の両方に適用する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 18:00:09 GMT)
Entanglement and Coherence Dynamics in Photonic Quantum Memristors [0.0] 私たちは、実量子ビットベースの量子コンピュータ(IBM-Q)上で、フォトニック量子メムリスタ(PQM)の回路モデルを構築し、実行します。
2つの独立したPQMからなるネットワークは、距離に関係なく、ネットワーク内を移動する相関光子の絡み合いとコヒーレンスの両方のダイナミクスにメモリ効果を示すことを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 21:15:18 GMT)
Enhancing Retrieval in QA Systems with Derived Feature Association [0.0] Retrieval augmented generation (RAG) は、長い文脈質問応答(QA)システムにおいて標準となっている。
我々は、AI派生文書(RAIDD)からレトリーバル(Retrieval)と呼ばれるRAGシステムへの新たな拡張を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 05:24:49 GMT)
Element-specific, non-destructive profiling of layered heterostructures [0.0] 半導体ヘテロ構造の作製は非常に正確であるため、メトロロジーは科学や応用の進歩の鍵となる課題となっている。
共振コントラストX線反射率計がこの課題にどのように対応しているかを示す理論と実験を示す。
シリコン中の単一ヒ素$delta$-layerに対する元素選択非破壊プロファイロメトリーの有用性を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:32:39 GMT)
Elegance, Facts, and Scientific Truths [0.0] 私は、科学的決定論は事実によって支持されないが、数学的言語物理学者が使用するエレガンスな結果であると主張している。
いくつかの実験では、自然は新しい情報を継続的に生成できることが証明されており、したがって物理学における決定論を支持している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 06:50:02 GMT)
Echo protocols of an optical quantum memory [0.0] 主に、光パルスと共鳴原子のスペクトル分散と非線形相互作用の影響について研究している。
弱信号パルスと強信号パルスの保存について述べることにより,高効率化のための条件を見つけることができる。
本稿では,量子リピータにおける光子エコー量子メモリプロトコルの利用の可能性について概説する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:32:00 GMT)
ENSTRECT: A Stage-based Approach to 2.5D Structural Damage Detection [0.0] ENSTRECTは2.5D構造損傷検出を実現するためのステージベースのアプローチである。
ローカライゼーション耐性は4cmであり、ひび割れの90%以上、腐食の82%、スポーリングの41%のIoUを達成できる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 20:24:14 GMT)
EEG-Language Modeling for Pathology Detection [0.0] 本研究は臨床報告に基づく脳波モデルの先駆者であり,脳波は15,000である。
以上の結果から,よりリッチな表現をさまざまなレポートセグメントに公開することで,モデルが学習できることが示唆された。
EEG言語モデルの表現は、脳波のみのモデルと比較して、病理診断を大幅に改善することができる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:02:13 GMT)
Dynamical generation and transfer of nonclassical states in strongly interacting light-matter systems in cavities [0.0] ポラリトンは、光と物質の間の非古典状態の生成と移動を仲介する。
非古典状態は半透明キャビティミラーで抽出でき、非古典状態は時間分解分光法で検出できる。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 15:13:36 GMT)
Dynamic Portfolio Rebalancing: A Hybrid new Model Using GNNs and Pathfinding for Cost Efficiency [0.0] 本稿では,取引コストを予測するグラフニューラルネットワーク(GNN)と,コスト効率の高いリバランスパスを特定するDijkstraのアルゴリズムを統合することで,ポートフォリオのリバランスを最適化する新たなアプローチを提案する。
実証的な結果は、このハイブリッドアプローチが取引コストを大幅に削減し、ポートフォリオマネージャに強力なツールを提供することを示している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:00:52 GMT)
Do Large Language Models Learn Human-Like Strategic Preferences? [0.0] LLMは、戦略的シナリオにおいて人間のような選好判断をすることを学ぶ。
太陽とミストラルは、人間と一致した安定な値に基づく嗜好を示す。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 17:54:17 GMT)
Disentangling Latent Shifts of In-Context Learning Through Self-Training [0.0] STICL(Self-Training ICL)は,クエリの潜時シフトから自己学習へ移行するデモの潜時シフトを解消する手法である。
STICLは擬似ラベルを生成するために教師モデルを使用し、アダプタモジュールにエンコードされたこれらのラベルを使用して学生モデルを訓練する。
実験結果から,STICLは一般化と安定性を向上し,従来のICL手法と他の不整合戦略を一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:00:21 GMT)
Diosi-Penrose criterion for solids and electrical components in quantum superpositions and application to a single-photon detector [0.0] ディオシ-ペンローズの基準は、量子的重ね合わせの固体に適用されるが、これは互いにわずかにずれたり、重畳状態の膨張が異なる。
固体核の質量集中による寄与は、10の格子定数よりも大きい変位に対して無視することができる。
パラメータフリーなディオシ-ペンローズモデルでは、質量密度が平均されるバージョンよりもはるかに高い崩壊率を予測できる。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 13:05:35 GMT)
Detecting Sexism in German Online Newspaper Comments with Open-Source Text Embeddings (Team GDA, GermEval2024 Shared Task 1: GerMS-Detect, Subtasks 1 and 2, Closed Track) [0.0] オーストリアの新聞のドイツ語オンラインコメントにおいて,性差別や誤用を確実に検出するために,単言語および多言語対応のオープンソーステキスト埋め込みについて検討した。
GermEval 2024 GerMS-Detect Subtask 1では,平均マクロF1スコアが0.597。
また、GerMS-Detect Subtask 2におけるヒトアノテーションの分布を正確に予測し、平均Jensen-Shannon距離は0.301(第2位)である。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:38:51 GMT)
Decoherence and Probability [0.0] 非確率的な説明では、デコヒーレンスによる確率の出現は説得力がない。
確率の出現に関する別の説明は、部分的に解釈されたデコヒーレンスモデルを通して、テクティクアシ確率的出現の組み合わせである。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 08:16:09 GMT)
Cross-Domain Content Generation with Domain-Specific Small Language Models [0.0] そこで本研究では,2つのドメインに対して,コーヒーレントかつ関連する出力を生成するための小言語モデルを提案する。
それぞれのデータセットに合わせてカスタマイズされたカスタムトークン化ツールを利用することで、生成品質が大幅に向上することがわかった。
凍結層による知識拡張は,小言語モデルがドメイン固有のコンテンツを生成するのに有効な方法であることを示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:28:02 GMT)
Contextual Compression in Retrieval-Augmented Generation for Large Language Models: A Survey [0.0] 大きな言語モデル(LLM)は目覚ましい能力を示すが、幻覚、時代遅れの知識、不透明さ、説明不能な推論といった制限に悩まされている。
Retrieval-Augmented Generation (RAG)は、外部データベースを活用して生成されたコンテンツの一貫性と一貫性を改善することで、実行可能なソリューションであることが証明されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:30:28 GMT)
Contextual Compression in Retrieval-Augmented Generation for Large Language Models: A Survey [0.0] 大きな言語モデル(LLM)は目覚ましい能力を示すが、幻覚、時代遅れの知識、不透明さ、説明不能な推論といった制限に悩まされている。
Retrieval-Augmented Generation (RAG)は、外部データベースを活用して生成されたコンテンツの一貫性と一貫性を改善することで、実行可能なソリューションであることが証明されている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 14:30:28 GMT)
Circuit QED Spectra in the Ultrastrong Coupling Regime: How They Differ from Cavity QED [0.0] キャビティQEDで研究された現象は、超伝導人工原子とマイクロ波光子を用いても探索できる。
回路QEDシステムは、個々の人工原子と超強結合状態に達する可能性を提供する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:53:30 GMT)
Causal Inference Tools for a Better Evaluation of Machine Learning [0.0] 本稿では、通常最小方形回帰(OLS)、可変解析(ANOVA)、ロジスティック回帰(ロジスティック回帰)などの重要な統計手法を紹介する。
この文書は研究者や実践者のガイドとして機能し、これらのテクニックがモデル行動、パフォーマンス、公平性に対する深い洞察を提供する方法について詳述している。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 10:03:29 GMT)
Bounds on $L_p$ Errors in Density Ratio Estimation via $f$-Divergence Loss Functions [0.0] 密度比推定(DRE)は2つの確率分布の関係を同定する基礎的な機械学習手法である。
$f$-divergence損失関数は、$f$-divergenceの変分表現から派生したもので、DREで最先端の結果を達成するために一般的に使用される。
本研究では,$L_p$エラーの上下境界を導出することにより,$f$-divergence損失関数を用いたDREの新しい視点を示す。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 13:05:09 GMT)
Bone: Block Affine Transformation as Parameter Efficient Fine-tuning Methods for Large Language Models [0.0] Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。
LoRA は LoRA+, PISSA, Olora, LoRA-GA などの派生型が登場した。
本稿では,トレーニング中にトレーニング可能な行列を元のウェイトを通して継続的に誘導し,ウェイト情報の利用を高めることを目的とした,新しい理論「ウェイトガイド」を紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:38:02 GMT)
Bone: Block Affine Transformation as Parameter Efficient Fine-tuning Methods for Large Language Models [0.0] Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。
LoRA は LoRA+, PISSA, Olora, LoRA-GA などの派生型が登場した。
本稿では,トレーニング中にトレーニング可能な行列を元のウェイトを通して継続的に誘導し,ウェイト情報の利用を高めることを目的とした,新しい理論「ウェイトガイド」を紹介する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:38:02 GMT)
Black box meta-learning intrinsic rewards for sparse-reward environments [0.0] 本研究では,RLエージェントが受信した学習信号がメタラーニングによってどのように改善されるかを検討する。
我々は,この手法をメタ学習の利点関数と外因性報酬を用いて分析・比較する。
開発したアルゴリズムはパラメトリックと非パラメトリックの双方で連続制御タスクの分布を評価する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 20:38:23 GMT)
AssessITS: Integrating procedural guidelines and practical evaluation metrics for organizational IT and Cybersecurity risk assessment [0.0] 「AssessITS」は、国際的に認められた基準に基づいて、組織が行動可能なITセキュリティの強度を高めることを目的としている。
「AssessITS」は、国際的に認められた基準に基づいて、組織が行動可能なITセキュリティの強度を高めることを目的としている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 17:01:59 GMT)
Approximation by Steklov Neural Network Operators [0.0] 我々はSteklov型積分を用いたニューラルネットワーク演算子の新バージョンを提案する。
我々は、位数$r$の滑らかさのモジュライを通した収束率(英語版)など、族に対する収束定理(英語版)を得る。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 11:23:09 GMT)
Application-Aware Benchmarking of NISQ Hardware [0.0] 我々は、Clifford回路のアプリケーションにインスパイアされたファミリーが、特定のアプリケーションを実行するための現在のハードウェアの能力をベンチマークするためにどのように使用できるかを示す。
キックドイシング回路を模擬する具体例を考えると,127量子ビット超伝導デバイスをベンチマークする。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 12:57:18 GMT)
Anti-biofouling Lensless Camera System with Deep Learning based Image Reconstruction [0.0] 本研究では、深層学習による画像再構成に基づくバイオファウリングやコンピュータビジョン技術に高い耐性を持つ材料技術を適用した水中カメラをレンズレスカメラに適用する。
プロトタイプカメラは、銅などの薄い金属板に1kの長方形のピンホールを持つ符号化開口部を使用しており、生物汚染の進行を妨げ、表面をきれいに保っている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 09:24:57 GMT)
An index for invertible phases of two-dimensional quantum spin systems [0.0] 我々はチャーン数 $nu bmod 48 neq 0$ の自由フェルミオン系が非自明な可逆相にあることを証明した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 22:11:22 GMT)
An Exploration of Self-Supervised Mutual Information Alignment for Multi-Task Settings [0.0] SAMI(Self-Supervised Alignment with Mutual Information)は、行動選好とモデル応答の接続を促進するために条件付き相互情報を使用する。
マルチタスク環境でSAMIを探索する2つの実験を行った。
SAMIの1つのイテレーションは、DPOに対して57%の勝利率を持ち、タスクカテゴリ間のパフォーマンスに大きな変化がある。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 16:15:04 GMT)
Algorithms for Non-Negative Matrix Factorization on Noisy Data With Negative Values [0.0] 非負行列分解(Non- negative matrix factorization, NMF)は, ノイズデータを解析するための次元還元法である。
本稿では、入力データのノイズと導入された負性の両方を扱えるShift-NMFとNearly-NMFの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 19:17:42 GMT)
A versatile machine learning workflow for high-throughput analysis of supported metal catalyst particles [0.0] ナノ粒子分析のための2段階人工知能(AI)駆動ワークフローを提案する。
この手法は、不均一触媒の透過電子顕微鏡(TEM)および走査TEM(STEM)画像に適用された。
NPの検出およびセグメント化におけるモデルの性能を各種触媒系で検証した。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:50:01 GMT)
A coherence method generating macroscopic quantum features using polarization-basis control and its projection measurements of laser light [0.0] 対光子間の量子絡み合いは、光量子コンピューティング、量子センシング、量子ネットワークの基礎である。
近年、コヒーレンスに基づくアプローチは、局所ランダム性から生じる非局所強度のいわゆる量子ミステリーを理解するために研究されている。
ここでは、線形光学に基づく測定による従来のレーザー光を用いたマクロ量子特性を作成するために、純粋コヒーレンス法を提案する。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 03:00:34 GMT)
A Guide to Tracking Phylogenies in Parallel and Distributed Agent-based Evolution Models [0.0] エージェントベースモデルを用いたサイリコ研究では、シミュレートされたエージェント間の祖先関係の高品質な記録を収集する機会を提供する。
現存する研究は通常、系統を直接追跡し、進化史の正確な系統学的な記録を生み出している。
ポストホック推定は、生物情報学者が生物間の遺伝的類似性を評価することによって植物学を構築する方法に似ている。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 16:36:51 GMT)
3D Data Long-Term Preservation in Cultural Heritage [0.0] 本報告では,文化遺産における3Dデジタルデータ保存の課題と戦略について考察する。
技術難読化の問題について議論し、持続可能なストレージソリューションの必要性を強調した。
また、長期デジタル保存におけるメタデータの重要性についても論じている。
論文参考訳(メタデータ) (Wed, 2 Oct 2024 07:52:37 GMT)
$α$-Divergence Loss Function for Neural Density Ratio Estimation [0.0] 密度比推定(DRE)は2つの確率分布の関係を捉えるための基礎的な機械学習手法である。
既存の手法では、低ウンバウンド損失関数によるオーバーフィッティング、バイアス付きミニバッチ勾配、トレーニング損失勾配の消失、KL(Kullback-Leibler)分散損失関数に対する高いサンプル要求など、最適化上の課題に直面している。
本稿では,DREの新しい損失関数である$alpha$-divergence loss function(alpha$-Div)を提案する。
論文参考訳(メタデータ) (Wed, 02 Oct 2024 12:57:41 GMT)