CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.0] LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:35:57 GMT)
Model Editing Harms General Abilities of Large Language Models: Regularization to the Rescue [122.2] 大規模言語モデル(LLM)におけるモデル編集の副作用を評価する。
分析の結果,モデルの重みを過度に修正したモデル編集によって副作用が生じることが明らかとなった。
これを軽減するために、修正の重み付けを正規化するためにRECTというメソッドが提案されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:02:33 GMT)
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion [118.7] 我々は動的シーンから時間ステップごとの幾何を直接推定する新しい幾何学的アプローチであるMotion DUSt3R(MonST3R)を提案する。
各タイムステップのポイントマップを単純に推定することで、静的シーンにのみ使用されるDUST3Rの表現を動的シーンに効果的に適応させることができる。
我々は、問題を微調整タスクとしてポーズし、いくつかの適切なデータセットを特定し、この制限されたデータ上でモデルを戦略的に訓練することで、驚くほどモデルを動的に扱えることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:00:07 GMT)
Exploring the Benefit of Activation Sparsity in Pre-training [117.3] プレトレーニング中に活性化特性がどう変化するかを検討した。
本稿では,Sparse-Dense Learning (SSD)を提案する。
SSDは同じモデルサイズで同等のパフォーマンスを実現し、事前トレーニングコストを削減する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:53:33 GMT)
Are Large Language Models Capable of Generating Human-Level Narratives? [114.3] 本稿ではストーリーテリングにおけるLLMの能力について考察し,物語の展開とプロットの進行に着目した。
本稿では,3つの談話レベルの側面から物語を分析するための新しい計算フレームワークを提案する。
談話機能の明示的な統合は、ニューラルストーリーテリングの40%以上の改善によって示されるように、ストーリーテリングを促進することができることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:31:58 GMT)
OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.9] 私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:54:08 GMT)
DiffKillR: Killing and Recreating Diffeomorphisms for Cell Annotation in Dense Microscopy Images [105.5] DiffKillRは、アーチェタイプマッチングと画像登録タスクの組み合わせとして、セルアノテーションを再構成する新しいフレームワークである。
我々はDiffKillRの理論的性質について論じ、それを3つの顕微鏡タスクで検証し、既存の教師付き・半教師なし・教師なしの手法に対する利点を実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:38:29 GMT)
VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.6] V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:56:35 GMT)
Training Language Models to Self-Correct via Reinforcement Learning [98.4] 自己補正は大規模言語モデル(LLM)の極めて望ましい機能である
自己補正を訓練するための既存のアプローチは、複数のモデルを必要とするか、より有能なモデルや他の形式の監督に依存している。
完全自己生成データを用いたLLMの自己補正能力を大幅に向上させるマルチターンオンライン強化学習手法であるSCoReを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:28:45 GMT)
Training Language Models to Self-Correct via Reinforcement Learning [98.4] 自己補正は、現代の大規模言語モデル(LLM)では、ほとんど効果がないことが判明した。
完全自己生成データを用いたLLMの自己補正能力を大幅に向上させるマルチターンオンライン強化学習手法であるSCoReを開発した。
SCoReは最先端の自己補正性能を実現し,MATHとHumanEvalでそれぞれ15.6%,9.1%向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:28:45 GMT)
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization [97.4] 任意の時間ステップ蒸留拡散モデルを直接微調整できるPSOアルゴリズムを提案する。
PSOは、現在の時間ステップ蒸留モデルからサンプリングされた追加の参照画像を導入し、トレーニング画像と参照画像との相対的な近縁率を増大させる。
PSOは、オフラインとオンラインのペアワイズ画像データの両方を用いて、蒸留モデルを直接人間の好ましくない世代に適応させることができることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:05:16 GMT)
Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.8] CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:49:05 GMT)
CodePlan: Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.8] 我々はCODEPLANを紹介した。CODEPLANは大規模言語モデルに対して,コード形式の計画の生成と追跡を可能にするスケーラブルなパラダイムである。
CODEPLANは、洗練された推論に固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
既存のコーパスから,コード・フォーム・プランと標準のプロンプト・レスポンス・ペアを統合する2Mサンプルの大規模データセットを構築した。
トレーニングと推論の両方のオーバーヘッドが最小限であるため、CODEPLANは直接生成する応答に比べて25.1%の相対的な改善を実現している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:49:05 GMT)
What Matters for Model Merging at Scale? [94.3] モデルマージは、複数の専門家モデルとより有能な単一モデルを組み合わせることを目的としている。
これまでの研究は主に、いくつかの小さなモデルをマージすることに焦点を当ててきた。
本研究は,大規模モデルマージの有用性を体系的に評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:17:19 GMT)
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models [92.9] 本研究では,大規模な教師の安全ガードモデルを,バイナリ有害度ラベル付き命令応答ペアのラベル付きデータセットを用いて,より小さなモデルに蒸留する。
本稿では,LLMをジェイルブレイクして有害な命令を発生させる単純なデータ拡張手法であるHarmAugを提案する。
私たちのHarmAugは、70億以上のパラメータを持つ大規模モデルに匹敵するF1スコアを達成し、計算コストの25%未満で運用しながら、AUPRCでそれを上回るパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:25:27 GMT)
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models [92.9] 本研究では,大規模な教師の安全ガードモデルを,バイナリ有害度ラベル付き命令応答ペアのラベル付きデータセットを用いて,より小さなモデルに蒸留する。
本稿では,LLMをジェイルブレイクして有害な命令を発生させる単純なデータ拡張手法であるHarmAugを提案する。
私たちのHarmAugは、70億以上のパラメータを持つ大規模モデルに匹敵するF1スコアを達成し、計算コストの25%未満で運用しながら、AUPRCでそれを上回るパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:25:27 GMT)
Open-World Reinforcement Learning over Long Short-Term Imagination [91.3] LS-Imagineは、有限個の状態遷移ステップにおいて、イマジネーションの地平線を拡大する。
我々の手法は、MineDojoの最先端技術よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:17:30 GMT)
Searching for Efficient Linear Layers over a Continuous Space of Structured Matrices [88.3] アインシュタイン和を通じて表現可能なすべての線形作用素の探索を可能にする統一フレームワークを提案する。
計算-最適スケーリング法則の違いは主に少数の変数によって支配されていることを示す。
そこで,Mixture-of-Experts (MoE) は,注目ブロックの投影を含む,モデルのすべての線形層におけるMoEを学習する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:47:01 GMT)
Searching for Efficient Linear Layers over a Continuous Space of Structured Matrices [88.3] アインシュタイン和を通じて表現可能なすべての線形作用素の探索を可能にする統一フレームワークを提案する。
計算-最適スケーリング法則の違いは主に少数の変数によって支配されていることを示す。
そこで,Mixture-of-Experts (MoE) は,注目ブロックの投影を含む,モデルのすべての線形層におけるMoEを学習する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:47:01 GMT)
AVG-LLaVA: A Multimodal Large Model with Adaptive Visual Granularity [85.4] 入力画像と命令に基づいて適切な視覚的粒度を適応的に選択できるLMMであるAVG-LLaVAを導入する。
AVG-LLaVAは11のベンチマークで優れた性能を示し、視覚トークンの数を大幅に削減し、推論を高速化する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:48:57 GMT)
AVG-LLaVA: A Large Multimodal Model with Adaptive Visual Granularity [85.4] 入力画像と命令に基づいて適切な視覚的粒度を適応的に選択できるLMMであるAVG-LLaVAを導入する。
AVG-LLaVAは11のベンチマークで優れた性能を示し、視覚トークンの数を大幅に削減し、推論を高速化する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:48:57 GMT)
Video Instruction Tuning With Synthetic Data [84.6] ビデオ命令追従のための高品質な合成データセット、すなわちLLaVA-Video-178Kを作成する。
このデータセットには、詳細なキャプション、オープンエンド質問回答(QA)、複数選択QAといった重要なタスクが含まれている。
このデータセットをトレーニングすることにより、既存の視覚的インストラクションチューニングデータと組み合わせて、新しいビデオLMMであるLLaVA-Videoを導入する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:29:09 GMT)
Video Instruction Tuning With Synthetic Data [84.6] ビデオ命令追従のための高品質な合成データセット、すなわちLLaVA-Video-178Kを作成する。
このデータセットには、詳細なキャプション、オープンエンド質問回答(QA)、複数選択QAといった重要なタスクが含まれている。
このデータセットをトレーニングすることにより、既存の視覚的インストラクションチューニングデータと組み合わせて、新しいビデオLMMであるLLaVA-Videoを導入する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:29:09 GMT)
Robust Barycenter Estimation using Semi-Unbalanced Neural Optimal Transport [84.5] 我々は,テクストロバスト連続バリセンタを推定するための,新しいスケーラブルなアプローチを提案する。
提案手法は$min$-$max$最適化問題であり,テキスト一般コスト関数に適応可能である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:27:33 GMT)
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge [84.3] 多くの領域で優れているにもかかわらず、潜在的な問題は未解決のままであり、その信頼性と実用性の範囲を損なう。
提案手法は, LLM-as-a-Judgeにおける各種類のバイアスを定量化し, 解析する自動バイアス定量化フレームワークである。
当社の作業は、これらの問題に対処するステークホルダの必要性を強調し、LLM-as-a-Judgeアプリケーションで注意を喚起します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:57:47 GMT)
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge [84.3] 多くの領域で優れているにもかかわらず、潜在的な問題は未解決のままであり、その信頼性と実用性の範囲を損なう。
提案手法は, LLM-as-a-Judgeにおける各種類のバイアスを定量化し, 解析する自動バイアス定量化フレームワークである。
当社の作業は、これらの問題に対処するステークホルダの必要性を強調し、LLM-as-a-Judgeアプリケーションで注意を喚起します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:57:47 GMT)
Emotionally Numb or Empathetic? Evaluating How LLMs Feel Using EmotionBench [83.4] 心理学からの感情評価理論を用いて,Large Language Models (LLMs) の人為的能力を評価する。
我々は、研究の中心となる8つの感情を引き出すのに有効な400以上の状況を含むデータセットを収集した。
我々は世界中の1200人以上の被験者を対象に人間による評価を行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:02:14 GMT)
Large Language Models can be Strong Self-Detoxifiers [82.7] SASA(Self-disciplined Autoregressive Smpling)は、大規模言語モデル(LLM)の毒性低減のための軽量制御復号アルゴリズムである。
SASAは、自己回帰サンプリング戦略を調整することにより、電流出力のマージンを追跡し、有害な部分空間から世代を分離する。
Llama-3.1-Instruct (8B), Llama-2 (7B), GPT2-L model with the RealToxicityPrompts, BOLD, and AttaQ benchmarks。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:45:15 GMT)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.2] 逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。
DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。
DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:26:54 GMT)
Jailbreaking as a Reward Misspecification Problem [80.5] 本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。
本稿では,報酬の相違の程度を定量化し,その有効性を実証する指標ReGapを紹介する。
ReMissは、報酬ミスの空間で敵のプロンプトを生成する自動レッドチームリングシステムである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:10:36 GMT)
Single-Image Shadow Removal Using Deep Learning: A Comprehensive Survey [78.8] 影のパターンは任意で変化しており、しばしば非常に複雑な痕跡構造を持つ。
影による劣化は空間的に不均一であり、照度と影と非陰影領域間の色に矛盾が生じている。
この分野での最近の開発は、主にディープラーニングベースのソリューションによって進められている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:44:58 GMT)
Self-Play Preference Optimization for Language Model Alignment [75.8] 近年の進歩は、嗜好の確率で直接作業することで、人間の嗜好をより正確に反映できることを示している。
本稿では,言語モデルアライメントのためのセルフプレイ方式を提案する。
我々の手法はSPPO(Self-Play Preference Optimization)と呼ばれ、繰り返しポリシー更新を利用してナッシュ均衡を確実に近似する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:48:25 GMT)
Unlocking Anticipatory Text Generation: A Constrained Approach for Large Language Models Decoding [75.1] 大規模言語モデル(LLM)は、テキスト生成の強力な能力を示している。
毒性や幻覚などの望ましくない行動が現れることがある。
将来制約付き生成問題としてテキスト生成の形式化を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:48:51 GMT)
VHASR: A Multimodal Speech Recognition System With Vision Hotwords [74.9] VHASRは、視覚をホットワードとして使用し、モデルの音声認識能力を強化するマルチモーダル音声認識システムである。
VHASRは、画像のキー情報を効果的に利用して、モデルの音声認識能力を高めることができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:30:06 GMT)
VHASR: A Multimodal Speech Recognition System With Vision Hotwords [74.9] VHASRは、視覚をホットワードとして使用し、モデルの音声認識能力を強化するマルチモーダル音声認識システムである。
VHASRは、画像のキー情報を効果的に利用して、モデルの音声認識能力を高めることができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:30:06 GMT)
AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark [73.6] 大規模なマルチモーダルモデルに基づくビデオキャプタであるAuroraCapを提案する。
トークンマージ戦略を実装し、入力されたビジュアルトークンの数を減らす。
AuroraCapは、様々なビデオおよび画像キャプションベンチマークで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:13:54 GMT)
Flow as the Cross-Domain Manipulation Interface [73.2] Im2Flow2Actは、現実世界のロボットのトレーニングデータを必要とせずに、ロボットが現実世界の操作スキルを習得することを可能にする。
Im2Flow2Actはフロー生成ネットワークとフロー条件ポリシーの2つのコンポーネントから構成される。
我々はIm2Flow2Actの様々な実世界のタスクにおいて、剛性、調音、変形可能なオブジェクトの操作を含む能力を実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:05:27 GMT)
Audio-Agent: Leveraging LLMs For Audio Generation, Editing and Composition [72.2] 本稿では,テキストやビデオの入力に基づく音声生成,編集,合成のためのフレームワークであるAudio-Agentを紹介する。
VTA(Video-to-audio)タスクでは、既存のほとんどの手法では、ビデオイベントと生成されたオーディオを同期させるタイムスタンプ検出器のトレーニングが必要である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:40:53 GMT)
On Unsupervised Prompt Learning for Classification with Black-box Language Models [71.6] 大規模言語モデル(LLM)は、テキスト形式学習問題において顕著な成功を収めた。
LLMは、熟練した人間のアノテータよりも品質の高いデータセットをラベル付けすることができる。
本稿では,ブラックボックス LLM を用いた分類のための教師なしのプロンプト学習を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:39:28 GMT)
Table Question Answering for Low-resourced Indic Languages [71.6] TableQAは構造化された情報のテーブル上で質問に答え、個々のセルやテーブルを出力として返すタスクである。
予算が限られている低リソース言語を対象とした,完全自動大規模テーブルQAデータ生成プロセスを提案する。
表QAデータセットやモデルを持たない2つのIndic言語であるBengaliとHindiにデータ生成手法を組み込む。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:26:12 GMT)
Quo Vadis, Motion Generation? From Large Language Models to Large Motion Models [70.8] 我々は、最初の100万レベルのモーション生成ベンチマークであるMotionBaseを紹介する。
この膨大なデータセットを活用することで、我々の大きな動きモデルは幅広い動きに対して強いパフォーマンスを示す。
動作情報を保存し,コードブックの容量を拡大する,モーショントークン化のための新しい2次元ルックアップフリーアプローチを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:48:54 GMT)
Metadata Matters for Time Series: Informative Forecasting with Transformers [70.4] 時系列予測のためのMetaTST(Metadata-informed Time Series Transformer)を提案する。
メタデータの非構造化の性質に取り組むため、MetaTSTは、事前に設計されたテンプレートによってそれらを自然言語に形式化する。
Transformerエンコーダは、メタデータ情報によるシーケンス表現を拡張するシリーズトークンとメタデータトークンの通信に使用される。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:37:55 GMT)
EvenNICER-SLAM: Event-based Neural Implicit Encoding SLAM [69.8] 密集した視覚的同時局所化とマッピングのための新しいアプローチである EvenNICER-SLAM を提案する。
EvenNICER-SLAMは、絶対輝度ではなく強度変化に対応するイベントカメラを内蔵している。
以上の結果から,イベントカメラによる高密度SLAMシステムの高速カメラ動作に対する堅牢性向上の可能性が示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:52:01 GMT)
Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation? [68.5] 我々はAutoPET3データ中心のトラックで競合するアプローチについて述べる。
AutoPETIIIデータセットでは、データセット全体をトレーニングしたモデルが望ましくない特性を示す。
我々は、スクラッチから再トレーニングする前に、モデル損失によって測定されたトレーニングデータセットから最も簡単なサンプルを取り除き、これを対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:39:07 GMT)
Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation? [68.5] 我々はAutoPET3データ中心のトラックで競合するアプローチについて述べる。
AutoPETIIIデータセットでは、データセット全体をトレーニングしたモデルが望ましくない特性を示す。
我々は、スクラッチから再トレーニングする前に、モデル損失によって測定されたトレーニングデータセットから最も簡単なサンプルを取り除き、これを対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:39:07 GMT)
Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation? [68.5] 我々はAutoPET3データ中心のトラックで競合するアプローチについて述べる。
AutoPETIIIデータセットでは、データセット全体をトレーニングしたモデルが望ましくない特性を示す。
我々は、スクラッチから再トレーニングする前に、モデル損失によって測定されたトレーニングデータセットから最も簡単なサンプルを取り除き、これを対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:39:07 GMT)
PreAlign: Boosting Cross-Lingual Transfer by Early Establishment of Multilingual Alignment [68.2] 大規模な言語モデルは、英語中心の事前訓練にもかかわらず、合理的な多言語能力を示す。
これらのモデルにおける自発的な多言語アライメントは弱く、不満足な言語間移動と知識共有をもたらす。
言語モデル事前学習に先立って多言語アライメントを確立するフレームワークであるPreAlignを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:34:23 GMT)
In Search of the Long-Tail: Systematic Generation of Long-Tail Inferential Knowledge via Logical Rule Guided Search [67.4] 推論知識の長期分布において,大規模言語モデル (LLM) を評価するための第一歩を踏み出す。
Linkは体系的なロングテールデータ生成フレームワークであり、事実的に正しいがロングテール推論ステートメントを取得する。
次に、LINKを用いてLINT(Logic-induced-Long-Tail)をキュレートする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:28:23 GMT)
Educational Question Generation of Children Storybooks via Question Type Distribution Learning and Event-Centric Summarization [67.1] 本稿では,まず,入力記事段落の質問型分布を学習する新しい質問生成手法を提案する。
学習用問合せペアで構成された銀のサンプルを用いて,事前学習したトランスフォーマーに基づくシーケンス・ツー・シーケンス・モデルを構築する。
本研究は,質問型分布学習とイベント中心の要約生成の分離の必要性を示唆するものである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:52:42 GMT)
DocKD: Knowledge Distillation from LLMs for Open-World Document Understanding Models [66.9] 本研究の目的は,LLMの知識を蒸留することにより,小型VDUモデルの一般化性を高めることである。
我々は、外部文書知識を統合することでデータ生成プロセスを強化する新しいフレームワーク(DocKD)を提案する。
実験の結果,DocKDは高品質な文書アノテーションを生成し,直接知識蒸留手法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:53:32 GMT)
Scalable Frame-based Construction of Sociocultural NormBases for Socially-Aware Dialogues [66.7] 社会文化的規範は、社会的相互作用における個人的行為の指針となる。
大規模言語モデル(LLM)を用いた社会文化的ノルム(SCN)ベース構築のためのスケーラブルなアプローチを提案する。
我々は、包括的で広くアクセス可能な中国社会文化ノルムベースを構築した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:08:46 GMT)
Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts [65.0] 視覚言語モデル(VLM)における長文抽出推論評価のためのベンチマークジェネレータであるLoCoVQAを提案する。
LoCoVQAは、数学的推論、VQA、そしてより長い視覚的コンテキストを持つ文字認識タスクのテスト例を拡張している。
このテストは、VLMがクエリに応答する際の無関係な情報をどの程度無視できるかを評価する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:58:06 GMT)
AID: Attention Interpolation of Text-to-Image Diffusion [64.9] AID(Attention Interpolation via Diffusion)という,トレーニング不要な手法を導入する。
AIDは補間された注意を自己注意と融合させ、忠実性を高める。
また,条件に依存した生成過程として,拡散による条件誘導注意補間(AID)も提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:09:40 GMT)
Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.8] 拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:25:50 GMT)
Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback [64.7] 人間のフィードバックからの強化学習など、アライメント技術で微調整された大規模言語モデル(LLM)は、これまでで最も有能なAIシステムの開発に役立っている。
マージンマッチング選好最適化(MMPO)と呼ばれる手法を導入し、相対的な品質マージンを最適化し、LLMポリシーと報酬モデルを改善する。
人間とAIの両方のフィードバックデータによる実験によると、MMPOはMT-benchやRewardBenchといった一般的なベンチマークにおいて、ベースラインメソッドよりも一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:56:11 GMT)
BPO: Staying Close to the Behavior LLM Creates Better Online LLM Alignment [64.4] 選好からの直接アライメント(DAP)は、事前コンパイルされたオフライン選好データセットからヒトデシダラタに大型言語モデル(LLM)をアライメントするための有望なパラダイムとして登場した。
オンライントレーニングのパワーをフル活用するために、特定のオンラインDAPアルゴリズムを開発する必要性を強調します。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:41:08 GMT)
SWE-bench Multimodal: Do AI Systems Generalize to Visual Software Domains? [64.3] 視覚的ユーザ向けJavaScriptソフトウェアにおけるバグ修正機能に基づいて,システム評価を行うSWE-bench Multimodalを提案する。
SWE-bench Mは、Webインターフェース設計、ダイアグラム、データ視覚化、シンタックスハイライト、インタラクティブマッピングに使用される17のJavaScriptライブラリから収集された617のタスクインスタンスを特徴とする。
分析の結果,SWE-benchシステムはSWE-bench Mと競合し,視覚的問題解決や言語間の一般化に限界があることが判明した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:48:58 GMT)
Learning 3D Perception from Others' Predictions [64.1] 本研究では,3次元物体検出装置を構築するための新たなシナリオについて検討する。
例えば、自動運転車が新しいエリアに入ると、その領域に最適化された検出器を持つ他の交通参加者から学ぶことができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:35:32 GMT)
Learning 3D Perception from Others' Predictions [64.1] 本研究では,3次元物体検出装置を構築するための新たなシナリオについて検討する。
例えば、自動運転車が新しいエリアに入ると、その領域に最適化された検出器を持つ他の交通参加者から学ぶことができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:35:32 GMT)
BIPEFT: Budget-Guided Iterative Search for Parameter Efficient Fine-Tuning of Large Pretrained Language Models [63.5] 自動PEFT(BIPEFT)のための新しいBudget-Guided Iterative Search戦略を提案する。
BIPEFTはバイナリモジュールとランク次元検索空間をアンタングルするために,新たな反復探索方式を採用している。
公開ベンチマークの大規模な実験は、パラメータ予算の低い下流タスクにおいて、BIPEFTの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:50:46 GMT)
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step [62.8] ステップバイステップの編集プロセスを通じて画像生成モデルを損なう、Chain-of-Jailbreak (CoJ)アタックと呼ばれる新しいジェイルブレイク手法を提案する。
我々のCoJ攻撃手法は、60%以上のケースでモデルの保護を回避できる。
また,効果的なプロンプトベース手法であるThink Twice Promptingを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:04:43 GMT)
Revisiting the Reliability of Psychological Scales on Large Language Models [62.6] 本研究の目的は,大規模言語モデルにパーソナリティアセスメントを適用することの信頼性を明らかにすることである。
GPT-3.5、GPT-4、Gemini-Pro、LLaMA-3.1などのモデル毎の2,500設定の分析により、様々なLCMがビッグファイブインベントリに応答して一貫性を示すことが明らかになった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:55:19 GMT)
Inheritune: Training Smaller Yet More Attentive Language Models [61.4] Inherituneは、より小型で高性能な言語モデルを開発するための、シンプルで効果的なトレーニングレシピである。
Inheritune は OpenWebText-9B や FineWeb_edu のようなデータセット上で GPT-2 モデルのさまざまなサイズのトレーニングを可能にする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:14:48 GMT)
HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.8] 効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:19:29 GMT)
High-Dimension Human Value Representation in Large Language Models [60.3] 大規模言語モデル(LLM)における人的価値分布の高次元表現であるUniVaRを提案する。
我々は,UniVaRが,異なるLLMに埋め込まれた人間の値と異なる言語源との分布を比較する強力なツールであることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:27:53 GMT)
Class of codes correcting absorptions and emissions [59.9] 我々は、全ての放射、吸収、軽視、エラーの上昇/低下を任意の順序で防止する量子コード群を構築している。
一般的なAE符号に対する簡易な誤り訂正条件を導出し、$le t$エラーを補正する置換不変符号をAE符号にマッピング可能であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:14:03 GMT)
VEDIT: Latent Prediction Architecture For Procedural Video Representation Learning [59.7] そこで本研究では,市販の冷凍型ビジュアルエンコーダを用いて,予測および手続き計画において,最先端(SoTA)の性能を達成可能であることを示す。
観察されたステップから凍結したクリップレベルの埋め込みを条件付けて、目に見えないステップの動作を予測することで、予測のための堅牢な表現を学習することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:52:09 GMT)
Accelerated Gradient Tracking over Time-varying Graphs for Decentralized Optimization [59.7] 実用的な単一ループ加速勾配追跡には$O(fracgamma1-sigma_gamma)2sqrtfracLepsilon)$が必要であることを証明している。
我々の収束率は$O(frac1epsilon5/7)$と$O(fracLmu)5/7frac1(1-sigma)1.5logfrac1epsilon)$よりも大幅に改善した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:38:24 GMT)
Autoregressive Large Language Models are Computationally Universal [59.3] 変換器に基づく言語モデルの自己回帰復号化により,普遍計算が実現可能であることを示す。
まず、2027年の生産規則を持つラグシステムにより、普遍チューリングマシンをシミュレートできることを示す。
我々は、チャーチ・チューリングの論文により、拡張自己回帰(greedy)復号化によるgemini-1.5-pro-001が汎用コンピュータであると結論付けた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:05:17 GMT)
LoRC: Low-Rank Compression for LLMs KV Cache with a Progressive Compression Strategy [59.1] キーバリュー(KV)キャッシュは、トランスフォーマーベースの自己回帰型大言語モデル(LLM)を提供する上で重要なコンポーネントである。
この問題を緩和するためのアプローチとしては、(1) アップサイクルステージに統合された効率的な注意変動、(2) テスト時のKVキャッシュ圧縮、(3) テスト時のKVキャッシュ圧縮がある。
そこで我々は,KV重み行列の低ランク近似を提案し,モデル再学習なしに既存のトランスフォーマーベースLCMとのプラグイン統合を実現する。
本手法は,テスト段階におけるアップサイクリング段階のモデルチューニングやタスク固有のプロファイリングを伴わずに機能するように設計されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:10:53 GMT)
A Peek into Token Bias: Large Language Models Are Not Yet Genuine Reasoners [58.2] 本研究では,大規模言語モデル (LLM) が真の推論能力を持つかどうかを評価するための仮説検証フレームワークを提案する。
我々は,相補的な誤りとシロジカルな問題を特徴とする,注意深く制御された合成データセットを開発した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:40:03 GMT)
Finer: Investigating and Enhancing Fine-Grained Visual Concept Recognition in Large Vision Language Models [58.0] 詳細な分析では、命令調整されたLVLMはモダリティギャップを示し、同じ概念に対応するテキスト入力と視覚入力の相違を示す。
我々は,LVLMの細粒度視覚理解能力を評価するために,複数の属性中心評価ベンチマークであるFinerを提案し,説明可能性を大幅に改善した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 00:40:23 GMT)
DiSK: Differentially Private Optimizer with Simplified Kalman Filter for Noise Reduction [57.8] 本稿では,微分プライベート勾配の性能を著しく向上する新しいフレームワークであるDiSKを紹介する。
大規模トレーニングの実用性を確保するため,Kalmanフィルタプロセスを簡素化し,メモリと計算要求を最小化する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:30:39 GMT)
Evaluating $n$-Gram Novelty of Language Models Using Rusty-DAWG [57.1] 本研究では,現代のLMがトレーニングデータから$n$-gramを生成できる範囲について検討する。
我々は,ゲノムデータのインデックス化にインスパイアされた新しい検索ツールであるRusty-DAWGを開発した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:42:20 GMT)
Dense X Retrieval: What Retrieval Granularity Should We Use? [56.9] しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:33:51 GMT)
LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.5] 視覚言語モデル(VLM)は、状態情報を視覚的テキストのプロンプトとして処理し、テキスト内のポリシー決定に応答することができる。
LLaRA:Large Language and Robotics Assistantは,ロボットの行動ポリシーを会話として定式化するフレームワークである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:28:30 GMT)
Benchmarks and Custom Package for Energy Forecasting [55.5] エネルギー予測は、電力グリッドディスパッチのようなその後のタスクのコストを最小化することを目的としている。
本稿では,大規模負荷データセットを収集し,再生可能エネルギーデータセットを新たにリリースした。
評価指標の異なるレベルにおいて,21種類の予測手法を用いた広範囲な実験を行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:13:43 GMT)
Can Watermarked LLMs be Identified by Users via Crafted Prompts? [55.5] この研究は、透かし付き大言語モデル(LLM)の非受容性を初めて研究したものである。
我々は、よく設計されたプロンプトを通して透かしを検出する、Water-Probeと呼ばれる識別アルゴリズムを設計する。
実験の結果、ほとんどの主流の透かしアルゴリズムは、よく設計されたプロンプトと容易に識別できることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:01:27 GMT)
One-step Diffusion with Distribution Matching Distillation [54.7] 本稿では,拡散モデルを1ステップ画像生成器に変換する手法である分散マッチング蒸留(DMD)を紹介する。
約KLの発散を最小化することにより,拡散モデルと分布レベルで一致した一段階画像生成装置を強制する。
提案手法は,イメージネット64x64では2.62 FID,ゼロショットCOCO-30kでは11.49 FIDに到達した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:41:06 GMT)
Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.1] 既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:42:09 GMT)
Offline congestion games: How feedback type affects data coverage requirement [53.8] 情報開示を減らした3種類のフィードバックについて検討する。
ゲームレベルのフィードバック設定ではエージェントレベルのフィードバック設定のカバレッジ仮定が不十分であることを示す。
本研究は,オフラインの混雑ゲームに関する最初の研究である。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:27:45 GMT)
How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6] この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。
我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。
私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:48:33 GMT)
Visual-O1: Understanding Ambiguous Instructions via Multi-modal Multi-turn Chain-of-thoughts Reasoning [53.5] 本稿では,マルチモーダルなマルチターン・チェーン・オブ・シークレット・推論・フレームワークであるVisual-O1を提案する。
人間のマルチモーダルなマルチターン推論をシミュレートし、高度にインテリジェントなモデルに即時体験を提供する。
私たちの研究は、不確実性と曖昧さのある現実のシナリオにおいて、人工知能が人間のように機能する可能性を強調します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:18:41 GMT)
Were RNNs All We Needed? [53.4] 従来のリカレントニューラルネットワーク(RNN)を10年以上前から再検討しています。
入力から隠れた状態依存を取り除くことで、LSTMやGRUはBPTTを必要とせず、並列で効率的に訓練できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:01:26 GMT)
Were RNNs All We Needed? [53.4] 従来のリカレントニューラルネットワーク(RNN)を10年以上前から再検討しています。
入力から隠れた状態依存を取り除くことで、LSTMやGRUはBPTTを必要とせず、並列で効率的に訓練できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:01:26 GMT)
Grounded-VideoLLM: Sharpening Fine-grained Temporal Grounding in Video Large Language Models [53.2] 我々は,特定の映像モーメントをきめ細かな方法で知覚・推論できる新しいビデオLLMであるGrounded-VideoLLMを紹介した。
我々は,(1)フレーム間の関係を符号化する追加の時間的ストリームと(2)特定の時間的知識に富んだ離散的な時間的トークンを組み込むことで,モデルを洗練する。
実験では, 時間文の接地, ビデオキャプションの密接化, ビデオQAの接地といった, きめ細かい接地作業に優れていた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:04:37 GMT)
Generative Edge Detection with Stable Diffusion [52.9] エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:52:23 GMT)
Learning Object Properties Using Robot Proprioception via Differentiable Robot-Object Interaction [52.1] 微分可能シミュレーションは、システム識別の強力なツールとなっている。
本手法は,オブジェクト自体のデータに頼ることなく,ロボットからの情報を用いてオブジェクト特性を校正する。
低コストなロボットプラットフォームにおける本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:48:38 GMT)
Generalizable Human Gaussians from Single-View Image [52.1] 単視点一般化可能なHuman Gaussian Model(HGM)を導入する。
提案手法では, 粗い予測されたヒトガウスの背景画像を改良するために, ControlNet を用いる。
非現実的な人間のポーズや形状の潜在的な発生を緩和するために、SMPL-Xモデルからの人間の先行を二重分岐として組み込む。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:52:15 GMT)
Aligning LLMs with Individual Preferences via Interaction [51.7] 調整可能な大きな言語モデル(LLM)をトレーニングします。
木構造における3K以上の多ターン会話を含む多ターン嗜好データセットを開発した。
評価のために、慎重に選択された100のサンプルと、会話中にカスタマイズされたアライメント性能を測定するために適切に設計されたメトリクスからなるALOEベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:48:29 GMT)
Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.6] 本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:29:14 GMT)
Measuring Psychological Depth in Language Models [50.5] 本稿では,文学理論に根ざした新たな枠組みである心理的深度尺度(PDS)を紹介する。
PDS(0.72 クリッペンドルフのα)に基づいて人間が一貫して物語を評価できることを示し、我々の枠組みを実証的に検証する。
驚いたことに、GPT-4のストーリーはRedditから入手した高評価の人文記事と統計的に区別できない。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 10:30:44 GMT)
CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios [50.0] CliMedBenchは、14のエキスパートによるコア臨床シナリオを備えた総合的なベンチマークである。
このベンチマークの信頼性はいくつかの点で確認されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:15:36 GMT)
How Hard is this Test Set? NLI Characterization by Exploiting Training Dynamics [49.9] 本稿では, 実例と非実例を手作業で構築することなく, 挑戦的なテストセットを自動生成する手法を提案する。
一般的なNLIデータセットのテストセットを,トレーニングダイナミクスを利用した3つの難易度に分類する。
我々の評価法がトレーニングセットに適用された場合、トレーニング対象データのごく一部でトレーニングされたモデルは、フルデータセットでトレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:39:21 GMT)
A SMART Mnemonic Sounds like "Glue Tonic": Mixing LLMs with Student Feedback to Make Mnemonic Learning Stick [48.9] SMARTは、実際の学生が新しい用語を学習する際のフィードバックに基づいて訓練された、モニーモニックなジェネレータである。
我々は、45人の学生から2684人の選好を2つのタイプに分けて集める:表現(評価から推測)と観察(学習から推定)
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:15:26 GMT)
MITS-GAN: Safeguarding Medical Imaging from Tampering with Generative Adversarial Networks [48.7] 本研究では,医療画像の改ざんを防止する新しいアプローチであるMITS-GANを紹介する。
このアプローチは、人間の目には知覚できない微調整された摂動を導入することで、攻撃者のCT-GANアーキテクチャの出力を妨害する。
CTスキャンによる実験結果から,MITS-GANの優れた性能が確認された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:11:13 GMT)
Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.5] 本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:00:32 GMT)
Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.5] 本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:00:32 GMT)
Repairs in a Block World: A New Benchmark for Handling User Corrections with Multi-Modal Language Models [48.4] 現状のビジョンと言語モデル(VLM)を複数の設定で評価する。
このタスクでは、人間に比べて、すべてのモデルの性能が著しく劣っていることが分かりました。
以上の結果から,これらのモデルはまだマルチモーダル・コラボレーティブ・セッティングにデプロイする準備が整っていないことが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:49:43 GMT)
Repairs in a Block World: A New Benchmark for Handling User Corrections with Multi-Modal Language Models [48.4] 命令追従操作タスクにおけるマルチモーダルなTPRシーケンスのデータセットであるBlockWorld-Repairsをリリースする。
現状のビジョンと言語モデル(VLM)を複数の設定で評価し,TPRの処理能力と正確な応答性に着目した。
以上の結果から,これらのモデルはまだマルチモーダル・コラボレーティブ・セッティングにデプロイする準備が整っていないことが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:49:43 GMT)
Identifying Factual Inconsistencies in Summaries: Grounding LLM Inference via Task Taxonomy [48.3] 事実的矛盾は、生成モデルによる忠実な要約にとって重要なハードルとなる。
我々は,要約中の不整合事実のキーエラータイプを集約し,ゼロショットと教師付きパラダイムの両方を容易にするためにそれらを組み込んだ。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:07:29 GMT)
BMRetriever: Tuning Large Language Models as Better Biomedical Text Retrievers [48.2] BMRetrieverは、バイオメディカル検索を強化するための一連の密集したレトリバーである。
BMRetrieverは強力なパラメータ効率を示し、410Mの派生型はベースラインを最大11.7倍まで上回っている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:25:34 GMT)
Unraveling the Truth: Do VLMs really Understand Charts? A Deep Dive into Consistency and Robustness [47.7] チャート質問応答(CQA)は、ビジュアル言語理解の重要な領域である。
この分野の現在のビジュアル言語モデル(VLM)は、まだ未調査のままである。
本稿では,包括的データセット上での最先端VLMの評価を行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:52:57 GMT)
EHRAgent: Code Empowers Large Language Models for Few-shot Complex Tabular Reasoning on Electronic Health Records [47.6] 大規模言語モデル(LLM)は、計画とツールの利用において例外的な能力を示した。
コードインタフェースを備えたLLMエージェントであるEHRAgentを提案し,マルチタブラル推論のためのコードの自動生成と実行を行う。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:56:56 GMT)
Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation [47.1] オフ・プライシ・データにおいても,ブートストラップ値推定の収束条件が弱くなることを証明する。
計算結果をトラジェクトリによる学習に拡張し、小さな修正を施した全てのタスクに対して収束が達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:04:33 GMT)
Aligners: Decoupling LLMs and Alignment [47.0] 大きな言語モデル(LLM)は、ほとんどのアプリケーションで安全性と実用性を確保するために、人間の期待に沿う必要がある。
そこで本稿では,LLM とアライメントを,任意の基準をアライメントするためのアライメントモデルのトレーニングによって分離することを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:29:18 GMT)
Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models [46.3] Multi-LogiEvalは、様々な推論規則と深さを持つ多段階論理推論を含む総合的な評価データセットである。
GPT-4, ChatGPT, Gemini-Pro, Yi, Orca, Mistralなどの大規模言語モデルの評価を行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:00:13 GMT)
When Reasoning Meets Information Aggregation: A Case Study with Sports Narratives [46.0] スポーツ物語の分析を LLM が要求する推論における情報集約の重要性について検討する。
我々はNBAの実際のバスケットボールデータを用いて総合的な実験を行い、ゲーム物語を合成する新しい手法であるSportsGenを提示する。
その結果, GPT-4oを含むほとんどのモデルでは, 頻繁な得点パターンのため, バスケットボールの得点を正確に集計することができないことが判明した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:25:07 GMT)
MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.7] MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
MDAgentsは、Large Language Models(LLMs)チームに対して、コラボレーション構造を自動的に割り当てる。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:56:06 GMT)
Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders [45.3] 本研究は、クラスラベルなどの半教師付き情報を付加できる非対称符号化復号プロセスを備えたチャートオートエンコーダを導入する。
このようなネットワークの近似力を議論し、周囲空間の次元ではなく、本質的にデータ多様体の内在次元に依存する境界を導出する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:34:17 GMT)
SPARTUN3D: Situated Spatial Understanding of 3D World in Large Language Models [45.3] Spartun3Dという,様々な位置空間推論タスクを組み込んだスケーラブルな位置位置3Dデータセットを導入する。
また,Spartun3D-LLMを提案する。これは既存の3次元LLM上に構築されているが,新しい位置空間アライメントモジュールと統合されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:22:20 GMT)
Group Fairness in Peer Review [44.6] 本稿では,グループフェアネスの概念であるコア(core)を導入し,すべてのコミュニティ(研究者のサブセット)に対して,大規模なカンファレンスからの撤退の一方的な利益を損なうような扱いをするよう求めている。
我々は、簡単なピアレビューモデルについて研究し、常にコアにレビューの代入が認められることを証明し、そのような代入を見つけるための効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:48:10 GMT)
Learning Personalized Alignment for Evaluating Open-ended Text Generation [44.6] PerSEは、特定の人間の好みに合わせてアライメントを評価するために設計された解釈可能な評価フレームワークである。
テキスト内個人プロファイルから特定の好みを推測し、生成されたコンテンツと個人の好みとの整合性を評価するように調整される。
当社の13B LLaMA-2ベースのPerSEは、ケダル相関が15.8%増加し、ゼロショットレビュアーによる13.7%の精度向上を示している。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:58:14 GMT)
GoldCoin: Grounding Large Language Models in Privacy Laws via Contextual Integrity Theory [44.3] これまでの研究では、さまざまなプライバシー攻撃、防御、評価を狭義に定義されたパターンの中で探索することで、プライバシを研究する。
我々は,プライバシ違反を評価する司法法において,LLMを効果的に活用するための新しい枠組みであるGoldCoinを紹介した。
我々のフレームワークは、コンテキスト整合性の理論をブリッジとして活用し、関連するプライバシー法に基づく多数の合成シナリオを作成する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:00:43 GMT)
Can Language Models Reason about Individualistic Human Values and Preferences? [44.2] 個人主義的価値推論の具体的な課題について言語モデル(LM)について検討する。
我々は,55%から65%の精度で個人主義的人間の価値を推論する,フロンティアLMの能力の限界を明らかにする。
提案した値不等式指数(sigmaINEQUITY)によって測定された大域的個人主義的価値の推論におけるLMの部分性も同定する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:03:41 GMT)
Elucidating the Design Choice of Probability Paths in Flow Matching for Forecasting [44.2] フローマッチングは、最近、強力なパラダイム生成モデリングとして登場した。
本研究では,フローマッチングを伴う時間的予測データが,確率パスモデルの選択に非常に敏感であることを示す。
そこで本研究では,予測性能向上のための新しい確率パスモデルを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:34:14 GMT)
Showing LLM-Generated Code Selectively Based on Confidence of LLMs [44.2] 大規模言語モデル(LLM)は、コード生成において印象的な能力を示しているが、誤ったプログラムを生成する可能性がある。
これらの誤ったプログラムを開発者に示すことは、開発者のエネルギーを無駄にし、セキュリティリスクを導入します。
我々は,新しいLLMベースのコード生成手法であるHonestCoderを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:51:31 GMT)
Generating Equivalent Representations of Code By A Self-Reflection Approach [44.0] コードの等価表現(ER)は、コード自体と同じセマンティクスを保持する。
コードのERを自動的に生成する方法は、依然としてオープンな課題である。
本稿では,ERを生成するための自己回帰手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:17:08 GMT)
ToolBeHonest: A Multi-level Hallucination Diagnostic Benchmark for Tool-Augmented Large Language Models [43.9] ツール拡張大型言語モデル(LLM)は、現実世界のアプリケーションに急速に統合されている。
この課題に対処するために、包括的な診断ベンチマークであるToolBHを導入する。
ツールセットの特徴に基づいた,必要なツールや潜在的なツール,限定的な機能ツールの3つのシナリオについて検討する。
結果は、ToolBHベンチマークで提示された重要な課題を示している。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:51:29 GMT)
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing [43.6] 我々は,エキスパート選択ルーティングを備えた拡散変圧器のためのMixture-of-Experts(MoE)モデル(EC-DIT)を新たに開発する。
EC-DITは、入力テキストを理解するために割り当てられた計算を適応的に最適化し、各画像パッチを生成する。
テキストと画像のアライメント評価において、我々の最大のモデルでは、最先端のGenEvalスコアが71.68%に達し、直感的に解釈可能な競合推論速度を維持しています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:55:31 GMT)
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing [43.6] 我々は,エキスパート選択ルーティングを備えた拡散変圧器のためのMixture-of-Experts(MoE)モデル(EC-DIT)を新たに開発する。
EC-DITは、入力テキストを理解するために割り当てられた計算を適応的に最適化し、各画像パッチを生成する。
テキストと画像のアライメント評価において、我々の最大のモデルでは、最先端のGenEvalスコアが71.68%に達し、直感的に解釈可能な競合推論速度を維持しています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:55:31 GMT)
Tadashi: Enabling AI-Based Automated Code Generation With Guaranteed Correctness [43.5] Tadashiは、適用されるコード変換の合法性をチェックするライブラリである。
図書館が生成した変換の合法性を保証することを証明し、その軽量な実用コストを実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:56:05 GMT)
SLANG: New Concept Comprehension of Large Language Models [43.5] 大規模言語モデル(LLM)は、しばしばオンラインコミュニティの急速な言語進化の特徴に追従するために苦労する。
我々のベンチマークとアプローチは、文脈ビーコンとして機能する言語シフトの現実世界のインスタンスを理解することである。
我々の因果推論に基づくアプローチは、インターネットスラングやミームの理解において、精度と関連性の観点から、ベースライン手法よりも優れている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:03:49 GMT)
Strategic Insights from Simulation Gaming of AI Race Dynamics [43.0] インテリジェンスライジング(Intelligence Rising)は、AIの未来に関するシナリオ調査である。
ゲームプレイ中に観察される繰り返しパターン,戦略,意思決定過程を照明する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:34:21 GMT)
Chronic Disease Diagnoses Using Behavioral Data [43.0] 高血糖(糖尿病)、高脂血症、高血圧(総称3H)を独自の行動データを用いて診断することを目的としている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:52:49 GMT)
Quantum Simulation of Nonlinear Dynamical Systems Using Repeated Measurement [42.9] 本稿では, 非線形常微分方程式の初期値問題を解くために, 繰り返し測定に基づく量子アルゴリズムを提案する。
古典ロジスティック系とローレンツ系に、積分可能かつカオス的条件の両方でこのアプローチを適用する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:06:12 GMT)
Computational Diplomacy: How "hackathons for good" feed a participatory future for multilateralism in the digital age [42.9] この記事では、グローバルSDGの課題に対処することに焦点を当てたソフトウェア開発者のコミュニティを構築する上で、ハッカソンが果たす役割について説明する。
これらの出来事は、人間の協力と共感の神経生物学的基盤を利用し、目的意識を育み、対人偏見を減らすことを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:01:07 GMT)
MedAdapter: Efficient Test-Time Adaptation of Large Language Models towards Medical Reasoning [42.8] MedAdapterは,大規模言語モデル(LLM)の生体医学的応用に対するテスト時間適応のための統合されたポストホックアダプタである。
MedAdapterは、バイオメディカル推論において、ホワイトボックスとブラックボックスの両方に効果的に適応し、それぞれ25.48%と11.31%の平均的なパフォーマンス向上を達成した。
モデルパフォーマンス、計算リソース、データプライバシのバランスをとるという課題に直面したMedAdapterは、効率的でプライバシ保護、費用対効果、透明なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:31:47 GMT)
Latent Action Priors From a Single Gait Cycle Demonstration for Online Imitation Learning [42.6] 本稿では,ロボット学習における帰納的バイアスとして,専門家による実証から学んだ潜伏行動を行動空間の先行として提案する。
単純なオートエンコーダを用いて1つのオープンループ歩行サイクルのみからこれらの動作先を学習できることが示される。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:10:56 GMT)
DALK: Dynamic Co-Augmentation of LLMs and KG to answer Alzheimer's Disease Questions with Scientific Literature [42.5] 我々は,LDMとKGの動的共拡張(DALK)について紹介する。
LLMとKGの相乗化フレームワークを相互に強化することで、まずLLMを活用して進化するAD固有の知識グラフを構築する。
そこで我々は,KGから適切な知識を抽出し,LLM推論能力を増強するために,新しい自己認識型知識検索手法を用いた粗大なサンプリング手法を用いる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:13:58 GMT)
Qihoo-T2X: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Any-Task [42.4] 本稿では,グローバルな視覚情報を効率的にモデル化するためのPT-DiT(Proxy-Tokenized Diffusion Transformer)を提案する。
各トランスブロック内で、各時空間ウィンドウから平均化トークンを計算し、その領域のプロキシトークンとして機能する。
また,スパースアテンション機構によって引き起こされる詳細モデリングの限界に対処するために,ウィンドウとシフトウインドウのアテンションを導入する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:45:54 GMT)
ActPlan-1K: Benchmarking the Procedural Planning Ability of Visual Language Models in Household Activities [42.2] ActPlan-1KはChatGPTと家庭用アクティビティシミュレータiGibson2に基づいて構築されたマルチモーダル計画ベンチマークである。
現在のVLMは、正常な活動と反現実的な活動の両方のために、人間レベルの手続き的な計画を作成するのに苦戦していることが判明した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:21:40 GMT)
ALR$^2$: A Retrieve-then-Reason Framework for Long-context Question Answering [42.1] 我々は,大規模言語モデル(LLM)のための検索・推論フレームワークを開発した。
現代のLLMは、関連した事実を正確に回収するのに苦労し、代わりにしばしば「検索された事実」を幻覚させる。
本稿では,LLMの長文推論能力を明示的な2段階手順で拡張する手法であるALR$2$を紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:29:12 GMT)
Efficient Finite Initialization for Tensorized Neural Networks [41.9] 本稿では,行列のパラメータの爆発を回避する手法として,テンソル化ニューラルネットワークの層の初期化手法を提案する。
i3BQuantumリポジトリのJupyter Notebookで利用可能な任意のレイヤ上で実行するPython関数を作成します。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:25:21 GMT)
MA-FSAR: Multimodal Adaptation of CLIP for Few-Shot Action Recognition [41.8] 我々は,行動に関連する時間的および意味的表現の観点からCLIP視覚エンコーダを強化するために,Fine-Tuning(PEFT)技術を利用するフレームワークであるMA-FSARを紹介する。
これらのトークンレベルの設計に加えて,ビデオプロトタイプの時間的・意味的特性をさらに強化するプロトタイプレベルのテキストガイド構築モジュールを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:43:47 GMT)
"Seeing the Big through the Small": Can LLMs Approximate Human Judgment Distributions on NLI from a Few Explanations? [41.6] 大規模言語モデル (LLM) は評価指標として使われることが多いが、結果が混在している。
本研究は,少数の専門家ラベルと説明を用いて,LLMを用いてHJDを近似することを提案する。
実験の結果,LLMのHJDを明示的なラベルなしで近似する能力は,いくつかの説明が著しく向上していることがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:22:29 GMT)
Soft Preference Optimization: Aligning Language Models to Expert Distributions [40.8] SPOは、Large Language Models (LLMs)のような生成モデルと人間の好みを整合させる手法である。
SPOは、選好損失をモデル全体の出力分布全体にわたる正規化項と統合する。
本稿では,SPOの方法論,理論的基礎,および単純さ,計算効率,アライメント精度における比較優位性について紹介する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 00:31:48 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8] 敵環境におけるジェネラリストWebエージェントのプライバシーリスクに関する最初の研究を行う。
まず,Webサイト上での攻撃に対する現実的な脅威モデルを提示し,ユーザ固有のPIIを盗むか,あるいはユーザ要求全体に対して,敵対的な2つのターゲットを検討する。
我々は、Mind2Webから様々なPIIカテゴリを含む177のアクションステップを収集し、これまでで最も有能なジェネラリストWebエージェントフレームワークの1つを使用して実験を行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:08:57 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8] 敵環境におけるジェネラリストWebエージェントのプライバシーリスクに関する最初の研究を行う。
まず,Webサイト上での攻撃に対する現実的な脅威モデルを提示し,ユーザ固有のPIIを盗むか,あるいはユーザ要求全体に対して,敵対的な2つのターゲットを検討する。
我々は、Mind2Webから様々なPIIカテゴリを含む177のアクションステップを収集し、これまでで最も有能なジェネラリストWebエージェントフレームワークの1つを使用して実験を行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:08:57 GMT)
Wrapper Boxes: Faithful Attribution of Model Predictions to Training Data [40.8] ニューラルモデルを通常のように訓練し、学習した特徴表現を古典的解釈可能なモデルで使用して予測を行う「ラッパーボックス」パイプラインを提案する。
異なる大きさの7つの言語モデルに対して、まず、ラッパー古典モデルの予測性能が元のニューラルモデルにほぼ匹敵することを示した。
我々のパイプラインは、古典的なモデル決定をデータトレーニングに忠実に寄与しながら、ニューラルネットワークモデルの予測性能を保っている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:23:15 GMT)
Generative Semantic Communication for Text-to-Speech Synthesis [39.9] 本稿では,テキスト音声合成のための新しい意味コミュニケーションフレームワークを開発する。
我々はトランスフォーマーエンコーダと拡散モデルを用いて,重要な通信オーバーヘッドを発生させることなく,効率的なセマンティックコーディングを実現する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:18:31 GMT)
Is Factuality Enhancement a Free Lunch For LLMs? Better Factuality Can Lead to Worse Context-Faithfulness [39.7] 我々は、現在の事実性向上手法は、大規模言語モデル(LLM)の文脈忠実性を著しく損なう可能性があると論じている。
実験の結果、これらの手法は事実の正確性に矛盾する改善をもたらす可能性があるが、文脈不信感の低下も引き起こすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:30:24 GMT)
Lower Bounds for the Trotter Error [39.6] トロッター積公式は最も一般的な近似法である。
現在、最小限の誤差が何であるかは不明である。
トロッター誤差の上限は、しばしば非常に過大評価されることが知られているため、これは重要な量である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:39:42 GMT)
Did You Hear That? Introducing AADG: A Framework for Generating Benchmark Data in Audio Anomaly Detection [39.5] 本稿では,異常検出と局所化に特化して設計された,新しい汎用オーディオ生成フレームワークを提案する。
産業や機械関連の音に主にフォーカスする既存のデータセットとは異なり、我々のフレームワークは幅広い環境に焦点を当てている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:12:35 GMT)
Learning Cortico-Muscular Dependence through Orthonormal Decomposition of Density Ratios [39.4] 本研究では,皮質振動と筋振動の関係をモデル化するために,密度比の正則分解に基づく統計的依存推定器の新たな応用を提案する。
本研究では,皮質筋接続から学習した固有関数が,運動と被験者を正確に分類できることを実験的に実証した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:05:08 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [38.9] 大規模言語モデル(LLM)は、微調整時に上流データを忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:18:15 GMT)
REBIND: Enhancing ground-state molecular conformation via force-based graph rewiring [38.8] 低次原子の非結合相互作用を捉えるために、レナード・ジョーンズポテンシャルに基づくエッジを追加することによって分子グラフを再構成する新しいフレームワークREBINDを提案する。
実験により、REBINDは様々な分子サイズで最先端の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:02:33 GMT)
Divide-or-Conquer? Which Part Should You Distill Your LLM? [38.6] 我々は、推論タスクを問題解決フェーズと問題解決フェーズに分解する同様の戦略を考案する。
戦略が単一ステージソリューションより優れていることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:44:10 GMT)
VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models [38.4] Contrastive Language-Image Pre-Training (CLIP) は広く研究され、多くの応用に応用されている。
事前トレーニング中の短い要約テキストの強調は、CLIPが長い記述を理解することを妨げている。
ビデオCLIPモデルの長文記述理解能力を解き放つことを目的とした,ビデオCLIP-XL (eXtra Length) モデルを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:10:38 GMT)
VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models [38.4] Contrastive Language-Image Pre-Training (CLIP) は広く研究され、多くの応用に応用されている。
事前トレーニング中の短い要約テキストの強調は、CLIPが長い記述を理解することを妨げている。
ビデオCLIPモデルの長文記述理解能力を解き放つことを目的とした,ビデオCLIP-XL (eXtra Length) モデルを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:10:38 GMT)
Is In-Context Learning Sufficient for Instruction Following in LLMs? [38.3] 実効性はあるものの, MT-Bench の命令微調整と比較すると, ICL とAL とのアライメントは依然として不十分であることがわかった。
我々は、我々の知識、ICLの体系的比較、低データ体制における命令追従のための命令微調整(IFT)を初めて提供する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:39:20 GMT)
GenSim2: Scaling Robot Data Generation with Multi-modal and Reasoning LLMs [38.3] GenSim2は、複雑で現実的なシミュレーションタスク作成のためのスケーラブルなフレームワークである。
パイプラインは200のオブジェクトで最大100の調音タスクのデータを生成し、必要な人的労力を減らすことができる。
我々は、生成したデータをゼロショット転送や実世界の収集データとの協調訓練に使用できる、GenSim2の有望な使用法を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:51:33 GMT)
A large-scale operational study of fingerprint quality and demographics [38.3] 性別、年齢、指型などの特定の要因が指紋品質に与える影響を理解する十分な証拠は残っていない。
本研究は、約16,000人の被験者の10プリントインプレッションを含む大規模運用データのデータベース上で、まだ研究中の課題に対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:20:31 GMT)
A large-scale operational study of fingerprint quality and demographics [38.3] 性別、年齢、指型などの特定の要因が指紋品質に与える影響を理解する十分な証拠は残っていない。
本研究は、約16,000人の被験者の10プリントインプレッションを含む大規模運用データのデータベース上で、まだ研究中の課題に対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:20:31 GMT)
Deep Learning Enhanced Road Traffic Analysis: Scalable Vehicle Detection and Velocity Estimation Using PlanetScope Imagery [38.2] 本稿では,PlanetScope SuperDove衛星画像を用いて車両の速度を推定する手法を提案する。
本稿では,RGB帯における車両軌跡追跡のためのキーポイントR-CNNモデルを提案する。
ドローン比較の結果、衛星データの平均速度は112.85km/h、ドローン映像の平均速度は131.83km/hと過小評価されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:14:07 GMT)
UNComp: Uncertainty-Aware Long-Context Compressor for Efficient Large Language Model Inference [38.1] UNCompは、隠れた状態とKVキャッシュの両方を適応的に圧縮する不確実性対応圧縮スキームである。
本手法は,プリフィル段階で1.6倍の高速化を実現し,KVキャッシュを元のサイズの4.74%に削減する。
注目すべきは、ニードル・イン・ア・ヘイスタックのタスクでは、UNCompは元のサイズの9.38%に圧縮された場合でも、フルサイズのKVキャッシュより優れていることである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:32:36 GMT)
DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search [37.2] DOTS は LLM が最適推論軌道探索によって動的に推論できるアプローチである。
提案手法は静的推論手法とバニラ命令チューニング手法より一貫して優れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:58:09 GMT)
A Survey on Time-Series Pre-Trained Models [37.1] 時系列マイニング (TSM) は, 実用化に大きな可能性を示す重要な研究分野である。
大量のラベル付きデータに依存するディープラーニングモデルは、TSMにうまく活用されている。
近年,コンピュータビジョンや自然言語処理における卓越した性能により,事前学習モデルが時系列領域で徐々に注目を集めている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:36:08 GMT)
Optimal Ground Station Selection for Low-Earth Orbiting Satellites [36.9] 本稿では,低地球軌道(LEO)ミッションにおける最適な地上局選択の問題に対する解決法を提案する。
ミッションオペレーターは、地上セグメントの性能とコストを正確に設計することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:48:50 GMT)
Thickness dependence of the mechanical properties of piezoelectric high-$Q_m$ nanomechanical resonators made from aluminium nitride [36.9] 窒化アルミニウム(AlN)から作製した引張歪圧電膜の材料特性について検討する。
200nm以下のAlNナノメカニカル共振器は1012ドルHzの高Q_mcdot f_m$-productを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:01:16 GMT)
LearnerVoice: A Dataset of Non-Native English Learners' Spontaneous Speech [36.4] 我々はLearnerVoiceを公開し、LearnerVoiceは50.04時間の音声とL2学習者の自然発話の書き起こしからなるデータセットである。
言語学的解析により、我々のデータセットの転写にはL2Sの特徴が含まれており、ネイティブな音声データセットよりもはるかに多いことが判明した。
LearnerVoiceによる微調整のwhisper-small.enのWERは10.26%、バニラのwhisper-small.enよりも44.2%低い。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:25:18 GMT)
StorySparkQA: Expert-Annotated QA Pairs with Real-World Knowledge for Children's Story-Based Learning [36.2] 我々は、専門家のアノテーションと思考プロセスを取得するために、既存の知識グラフによって強化されたアノテーションフレームワークを設計する。
StorySparkQAデータセットは,5,868のエキスパートアノテートされたQAペアと実世界の知識で構成されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:39:32 GMT)
Step-by-Step Reasoning to Solve Grid Puzzles: Where do LLMs Falter? [36.1] 複雑度が異なる274のグリッドベースパズルからなる評価データセットであるGridPuzzleを開発した。
第2に, GPT-4, Claude-3, Gemini, Mistral, Llama-2 など LLM の推論鎖を手動で解析した新しい誤り分類法を提案する。
第3に、大規模主観的評価のためのLLMベースのフレームワーク(すなわち、誤りを特定する)と客観的な指標であるPuzzleEvalを開発し、推論連鎖の正しさを評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:58:12 GMT)
N-Agent Ad Hoc Teamwork [36.1] 協調的マルチエージェント行動の学習への現在のアプローチは、比較的限定的な設定を前提としている。
本稿では,この問題を定式化し,エージェントモデリングを用いたポリシー最適化(POAM)アルゴリズムを提案する。
POAMは、NAHT問題に対するポリシーグラデーションであり、マルチエージェント強化学習アプローチであり、多様なチームメイト行動への適応を可能にする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:08:52 GMT)
A Second-Order Perspective on Model Compositionality and Incremental Learning [36.1] 本研究では,非線形ネットワークにおける構成性のデミスト化を試みる理論的研究を提案する。
提案した定式化は、構成可能なモジュールを達成するために、事前訓練された盆地内に留まることの重要性を強調している。
実際、インクリメンタルに学習されたモジュールのプールは、効果的なマルチタスクモデルの作成をサポートするだけでなく、特定のタスクの未学習と特殊化を可能にする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:25:27 GMT)
Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition [36.0] 視覚変換器の文脈における代表的PETL法について検討した。
PETL法は低ショットのベンチマークVTAB-1Kでも同様の精度が得られる。
PETLは、多くのショットレシエーションでも有用であり、フルFTよりも同等で、時には精度が向上する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:35:13 GMT)
Lessons Learned from a Unifying Empirical Study of Parameter-Efficient Transfer Learning (PETL) in Visual Recognition [36.0] 視覚変換器の文脈における代表的PETL法について検討した。
PETL法は低ショットのベンチマークVTAB-1Kでも同様の精度が得られる。
PETLは、多くのショットレシエーションでも有用であり、フルFTよりも同等で、時には精度が向上する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:35:13 GMT)
Infinite Limits of Multi-head Transformer Dynamics [36.0] 特徴学習体制における変圧器モデルの訓練力学の様々なスケーリング限界を解析する。
パラメータ化の集合は、適切に定義された無限の幅と深さの制限を許容し、トレーニングを通して注意層を更新することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:29:09 GMT)
Middleware for LLMs: Tools Are Instrumental for Language Agents in Complex Environments [35.7] 大規模言語モデル(LLM)は、複雑な環境で動作可能な汎用エージェントとして構想されている。
このような複雑性に対処する上で,LSMを増強する新しいツールのクラスを導入する。
2つの代表的な複雑な環境 -- 知識ベース(KB)とデータベース -- において、ツールで言語エージェントを増強する大きな可能性を実証する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:40:57 GMT)
SELU: Self-Learning Embodied MLLMs in Unknown Environments [35.6] マルチモーダルな大言語モデル(MLLM)は、強力な視覚的理解と意思決定能力を示している。
本稿では,強化学習におけるアクター批判的自己学習パラダイムに触発された,SELUと呼ばれる新しいアクター批判的自己学習パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:40:11 GMT)
Evaluating Readability and Faithfulness of Concept-based Explanations [35.5] 概念に基づく説明は、大規模言語モデルによって学習された高レベルのパターンを説明するための有望な道として現れます。
現在の手法は、統一的な形式化を欠いた異なる視点から概念にアプローチする。
これにより、概念の中核となる尺度、すなわち忠実さや可読性を評価するのが難しくなります。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:21:28 GMT)
Efficiently Identifying Watermarked Segments in Mixed-Source Texts [35.4] 部分透かし検出のための2つの新しい手法を提案する。
まず,長文に透かしセグメントが存在するかどうかを判定するための幾何被覆検出フレームワークを開発する。
第2に,テキスト内の透かしセグメントの正確な位置を特定できる適応型オンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:58:41 GMT)
Human-aligned Chess with a Bit of Search [35.2] チェスは長年、AIが人間の知性と一致しようとする試みの場だった。
本稿では,この古典的なゲームにおいて,人工知能と人間の知能のギャップを埋めるために設計されたチェスをプレイするAIであるAllieを紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:51:03 GMT)
LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language Generalization [35.1] LinguAlchemyは,類型的,地理的,系統的特徴を網羅する様々な言語情報を組み込んだ正規化手法である。
我々のLinguAlchemyは低リソース言語におけるmBERTとXLM-Rの性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:32:07 GMT)
Resfusion: Denoising Diffusion Probabilistic Models for Image Restoration Based on Prior Residual Noise [34.7] 微分拡散モデルの研究は、画像復元の分野への応用を拡大した。
本稿では,残余項を拡散前進過程に組み込むフレームワークであるResfusionを提案する。
Resfusionは, ISTDデータセット, LOLデータセット, Raindropデータセットに対して, わずか5つのサンプリングステップで競合性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:42:33 GMT)
Chain of Condition: Construct, Verify and Solve Conditions for Conditional Question Answering [34.6] 条件付き質問応答(CQA)は、可能な回答を見つけ、不足した条件を特定することを目的とした重要なタスクである。
既存のアプローチは,(1)必要な条件と論理的関係を正確に同定し,(2)不足しているものを検出するための条件を検証するという2つの課題により,CQAと競合する。
本論文では,まずすべての条件を同定し,それらの論理的関係を文書に従って明示的に構築することで,新しい条件の連鎖を創出する手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:13:41 GMT)
Intrinsic Evaluation of Unlearning Using Parametric Knowledge Traces [34.0] 近年,大規模言語モデル(LLM)の「学習」概念が注目されている。
未学習の手法を評価するための現在のプロトコルは、関連する知識を監視せずに行動テストに依存している。
我々は、未学習概念のパラメトリックな知識トレースの変化を考慮して、未学習を内部的に評価するべきだと論じている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:46:20 GMT)
Leveraging Social Determinants of Health in Alzheimer's Research Using LLM-Augmented Literature Mining and Knowledge Graphs [33.8] 成長する証拠は、社会的健康決定因子(SDoH)がアルツハイマー病(AD)と関連する認知症を発症する個人のリスクに影響を与えることを示唆している。
本研究は、SDoHの知識を広範囲にわたる文献から抽出し、AD関連生物学的実体と統合するための、新しい自動化された枠組みを提案する。
本フレームワークは,ADにおける知識発見の促進を約束し,他のSDoH関連研究領域に一般化することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:39:30 GMT)
Fine-Tuning Large Language Models to Translate: Will a Touch of Noisy Data in Misaligned Languages Suffice? [33.4] 大きな言語モデル(LLM)は、32のパラレル文で微調整された後、強い翻訳能力を示す。
英語のみを対象とするLLMは、非英語への翻訳を妨げるタスクの誤解釈につながる可能性がある。
未表現言語で合成されたデータは、顕著な効果が低い。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:50:46 GMT)
uniINF: Best-of-Both-Worlds Algorithm for Parameter-Free Heavy-Tailed MABs [33.3] 本稿では,HTMAB(Heavy-Tailed Multi-Armed Bandits)問題に対する新しいアルゴリズムを提案する。
我々の新しいアルゴリズムユニは、Best-of-Both-Worlds(BoBW)特性を楽しみ、両環境とも最適に機能する。
我々の知る限り、UniINFは重み付きMAB問題に対するBoBW特性を達成する最初のパラメータフリーアルゴリズムである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:55:44 GMT)
Robust Offline Imitation Learning from Diverse Auxiliary Data [33.1] オフラインの模倣学習は、専門家による一連のデモンストレーションからのみポリシーを学ぶことができる。
最近の研究には、専門家データとともに多数の補助的なデモンストレーションが組み込まれている。
逆補助データ(ROIDA)からのロバストオフライン模倣を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:30:54 GMT)
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation [32.6] 本稿では,プロンプトトークン処理の時間とコストを削減するために特別に設計されたモデル変換・蒸留手法であるSwiftKVを提案する。
Llama-3.1-8Bと70Bでは、SwiftKVはプリフィルの計算要求を50%削減し、KVキャッシュのメモリ要求を62.5%削減した。
16ビット精度でLlama-3.1-70Bの16Kトークン/sに変換する通常の推論スループットの560 TFlops/GPUを実現することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:45:26 GMT)
Scaling Parameter-Constrained Language Models with Quality Data [32.4] 言語モデリングにおける法則のスケーリングは、伝統的にデータセットのサイズとモデルパラメータの関数としてトレーニング損失を定量化する。
我々は,従来のスケーリング法則の理解を,元の定式化におけるデータ品質の微視的なビューを提供することによって拡張する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:07:17 GMT)
Mapping Degeneration Meets Label Evolution: Learning Infrared Small Target Detection with Single Point Supervision [32.3] 我々は、赤外小目標検出をポイントレベルの監視で実現するための最初の試みを行っている。
本稿では,ラベルを段階的に拡張するために,単一点監視(LESPS)を用いたラベル進化というラベル進化フレームワークを提案する。
本手法の有効性を検証するため,洞察力のある可視化実験を行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:37:48 GMT)
Enhancing Data Quality through Simple De-duplication: Navigating Responsible Computational Social Science Research [32.0] 我々は,計算社会科学のNLPで広く使われている20のデータセットについて,詳細な調査を行う。
分析の結果、ソーシャルメディアのデータセットは様々なレベルのデータ重複を示すことが明らかとなった。
以上の結果から,データ重複が現状の最先端性能の主張に影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:58:15 GMT)
HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration [32.0] 本稿では,新しい学習ベースキャッシングフレームワークを用いて,学習と推論を調和させる新しい手法を提案する。
従来の訓練パラダイムと比較して、新たに提案されたSDTは、認知プロセスの継続性を維持している。
IEPOは効率的なプロキシメカニズムを統合して、キャッシュされた機能の再使用による最終的な画像エラーを近似する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:14:17 GMT)
Predictive Multiplicity of Knowledge Graph Embeddings in Link Prediction [31.8] 知識グラフ埋め込み(KGE)モデルは知識グラフの不足リンクを予測するためにしばしば使用される。
複数のKG埋め込みはリンク予測にほぼ等しく機能するが、未知のクエリに対して矛盾する予測を与える。
ハイテイク領域におけるKGEベースのアプリケーションには重大なリスクが伴うが、KGEの研究では見落とされている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:03:41 GMT)
MobileQuant: Mobile-friendly Quantization for On-device Language Models [31.8] 大規模言語モデル(LLM)は言語処理に革命をもたらし、複数のアプリケーションにまたがって優れた結果をもたらしている。
エッジデバイスにLSMをデプロイすることは、メモリ、エネルギ、計算コストに関していくつかの課題をもたらす。
我々は、従来の重み等価変換作業を拡張する、MobileQuantと呼ばれる単純な後学習量子化手法を導入する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:03:03 GMT)
Evidence-based Match-status-Aware Gait Recognition for Out-of-Gallery Gait Identification [31.3] Evidence-based Match-status-Aware Gait Recognition frameworkを提案する。
Evidential Deep Learning (EDL)にインスパイアされたEMA-GRは、認識の一致状況に関連する不確実性を定量化するように設計されている。
我々の手法は既存の最先端手法をかなり上回ります。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 10:18:57 GMT)
From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities [31.1] 本稿では,Byte-Pairの原理を適用し,このギャップを埋める新しい画像トークンを提案する。
本手法は,テキストのみの大規模言語モデルで使用されるトークン化戦略を反映して,構造的事前情報を画像トークンに直接組み込む。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:27:20 GMT)
From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities [31.1] 本稿では,Byte-Pairの原理を適用し,このギャップを埋める新しい画像トークンを提案する。
本手法は,テキストのみの大規模言語モデルで使用されるトークン化戦略を反映して,構造的事前情報を画像トークンに直接組み込む。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:27:20 GMT)
LANTERN: Accelerating Visual Autoregressive Models with Relaxed Speculative Decoding [30.6] 実験により,提案手法が投機的復号化よりも大幅に高速化されたことを示す。
LANTERNは、greedyデコーディングやランダムサンプリングと比較して、$mathbf1.75times$と$mathbf1.76times$のスピードアップを増大させる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:21:03 GMT)
Lifelong Knowledge Editing for LLMs with Retrieval-Augmented Continuous Prompt Learning [30.6] 本稿では,生涯学習における編集効率と推論効率を向上させるために,ContInuous Prompt lEarning法であるRECIPEを紹介する。
RECIPEはまず、知識文をLLMの入力クエリの埋め込みにプレフィックスした、短くて情報的な連続的なプロンプトに変換する。
さらに、動的しきい値を計算するために仲介役として機能する知識センチネル(KS)を統合する。
我々のレトリバーとプロンプトエンコーダは、信頼性、一般性、局所性といった編集特性を達成するために共同で訓練されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:29:46 GMT)
Deception in Reinforced Autonomous Agents [30.5] 大型言語モデル(LLM)をベースとしたエージェントが微妙な騙しを行う能力について検討する。
この行動は、ブラタントな嘘や意図しない幻覚とは異なり、検出が難しい。
2つのLDMが対立する役割を担っている立法環境を模倣した敵対的テストベッドを構築した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 10:23:56 GMT)
LUQ: Long-text Uncertainty Quantification for LLMs [30.0] 大規模言語モデル(LLM)は、非現実的なコンテンツを生成する傾向がある。
不確実性定量化(UQ)は、モデルの生成に対する信頼性の理解を高める上で重要である。
我々は,複数のモデルからの応答をアンサンブルし,最も低い不確実性で応答を選択するTextscLuq-Ensembleを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:19:07 GMT)
Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach [29.8] フレーム対応ビデオ拡散モデル(FVDM)を提案する。
我々のアプローチでは、各フレームが独立したノイズスケジュールに従うことができ、モデルのキャパシティを高めて、きめ細かい時間依存性を捉えることができる。
実験により、FVDMは映像生成品質において最先端の手法よりも優れ、拡張タスクにも優れることが示された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:47:39 GMT)
Surgical, Cheap, and Flexible: Mitigating False Refusal in Language Models via Single Vector Ablation [29.6] 言語モデルを有用かつ無害にトレーニングするには、拒否行動の慎重な校正が必要である。
本稿では,単一ベクトルアブレーションによる言語モデルにおける偽の拒絶を緩和するための簡易かつ外科的手法を提案する。
提案手法はトレーニング不要で,モデルに依存しないため,現在および将来の言語モデルにおける誤認の軽減に有効である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:25:32 GMT)
From Pixels to Personas: Investigating and Modeling Self-Anthropomorphism in Human-Robot Dialogues [29.5] ロボットにおける自己人類同型は、好みや感情を表現するなど、対話における人間のような特徴の表示を通じて、自分自身を表わす。
これら2種類の応答に有意な差異を示し、あるタイプから別のタイプへの遷移を提案する。
Pix2Personaは、倫理的かつ魅力的なAIシステムを様々な実施形態で開発することを目的とした、新しいデータセットである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:06:24 GMT)
SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales [29.3] SaySelfは、大規模言語モデルに、より正確なきめ細かな信頼推定を表現するためのトレーニングフレームワークである。
さらに、SaySelf は LLM に対して、パラメトリック知識のギャップを明確に識別する自己反射的合理性を生成するよう指示する。
生成した自己反射的理性は合理的であり、キャリブレーションにさらに貢献できることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:23:48 GMT)
A Validation Approach to Over-parameterized Matrix and Image Recovery [29.3] 複数のランダムな線形測定から低ランク行列を復元する問題を考察する。
提案手法は,より深いネットワークを持つ画像である画像に有効であることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:39:11 GMT)
Sequential Probability Assignment with Contexts: Minimax Regret, Contextual Shtarkov Sums, and Contextual Normalized Maximum Likelihood [28.9] 多元的文脈木への射影後のシュタルコフ和に対応する新しい複雑性測度であるエンフコンテクスチュアルシュタルコフ和を導入する。
emph Normalized Maximum Likelihood (cNML) と呼ばれるミニマックス最適戦略を導出する。
私たちの結果は、バイナリラベルを超えて、シーケンシャルな専門家に当てはまります。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:31:12 GMT)
Data-Efficient Massive Tool Retrieval: A Reinforcement Learning Approach for Query-Tool Alignment with Language Models [28.7] 外部ツールやAPIと統合された大規模言語モデル(LLM)は、コンテキスト内学習や微調整によって複雑なタスクにうまく対応している。
この進歩にもかかわらず、厳密な入力長制約のため、ツール検索の大規模化は依然として困難である。
本稿では,大規模なツール検索(MTR)タスクとして,大規模リポジトリからの事前検索戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:58:05 GMT)
MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents [28.4] MLLMエージェントは、マルチモーダルなタスク関連軌道データを取得することで、複雑なエンボディされたタスクの可能性を実証する。
現在の検索手法は、主に軌跡におけるテキストや視覚的手がかりの表面レベルでの類似性に注目し、その特定のタスクに対する有効性を無視している。
本稿では,MLLMレシーバを微調整するためのインタラクションデータを活用することで,組込みエージェントの性能を向上させる新しい手法であるMLLM as ReTriever (MART)を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:10:39 GMT)
Preference-Guided Reflective Sampling for Aligning Language Models [27.7] 反復データ生成とモデル再訓練は、大きな言語モデル(LLM)を人間の好みに効果的に合わせることができる。
本研究では,PRS(Preference-Guided Reflective Smpling)を提案する。
ランダムサンプリングとは異なり、PSSはより効率的なサンプリングを可能にするためにツリーベースの生成フレームワークを使用している。
PRSは、反復的なオフラインRLトレーニングに適用した場合、高いパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:40:58 GMT)
VideoINSTA: Zero-shot Long Video Understanding via Informative Spatial-Temporal Reasoning with LLMs [27.5] 長いビデオ理解は、拡張タイムパンに対する推論の複雑さのために、ユニークな課題を提示する。
Informative Space-TemporAl Reasoning for long-form Video Understandingを提案する。
提案モデルは,3つの長大ビデオ質問応答ベンチマークの最先端性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:57:23 GMT)
CLoSD: Closing the Loop between Simulation and Diffusion for multi-task character control [27.4] 物理シミュレーションのための運動拡散モデルと強化学習に基づく制御は、人間の運動生成に相補的な強みを持つ。
CLoSDはテキスト駆動のRL物理ベースのコントローラで、様々なタスクの拡散生成によって導かれる。
CLoSDは、目標地点へのナビゲーション、テキストプロンプトで指定された手や足で物体を打つこと、座ること、立ち上がることなど、さまざまなタスクをシームレスに実行することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:56:48 GMT)
DataNarrative: Automated Data-Driven Storytelling with Visualizations and Texts [27.2] データストーリ生成のための新しいタスクと,さまざまなソースから1,449のストーリを含むベンチマークを導入する。
2つのLLMエージェントを用いたマルチエージェントフレームワークを提案する。
我々のエージェント・フレームワークは一般的にモデルベースと人的評価の両方において非エージェント・フレームワークよりも優れていますが、結果はデータ・ストーリー・ジェネレーションにおけるユニークな課題を明らかにします。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:07:58 GMT)
To Know or Not To Know? Analyzing Self-Consistency of Large Language Models under Ambiguity [27.1] 本稿では, 実体型あいまいさに着目し, 不明瞭な実体を刺激した場合の事実知識の適用において, 最先端のLCMの習熟度と一貫性を解析する。
実験の結果、LLMは正しいエンティティの読み取りを選択するのに苦労し、平均精度は85%、未特定のプロンプトで75%と低いことがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:36:36 GMT)
TheoremLlama: Transforming General-Purpose LLMs into Lean4 Experts [27.0] TheoremLlamaは、汎用的なLean4エキスパートをトレーニングするエンドツーエンドフレームワークである。
我々のフレームワークは,MiniF2F-ValidデータセットとTestデータセットでそれぞれ36.48%,33.61%の累積精度を達成した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:06:26 GMT)
Average gradient outer product as a mechanism for deep neural collapse [26.9] Deep Neural Collapse (DNC)は、Deep Neural Networks (DNN)の最終層におけるデータ表現の驚くほど硬い構造を指す。
本研究では,平均勾配外積(AGOP)を通した特徴学習によりDNCが生成するデータ依存環境を提案する。
特徴学習体制下で訓練されたニューラルネットワークに対して,適切な特異ベクトルと重みの値が,クラス内変動の崩壊の大部分の原因となることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:31:19 GMT)
Reparo: Loss-Resilient Generative Codec for Video Conferencing [26.9] 本稿では、再生深層学習モデルに基づく損失耐性ビデオ会議フレームワークReparoを紹介する。
ビデオ品質(PSNR, SSIM, LPIPS)とビデオフリーズの発生の両方の観点から,Reparoは最先端のFECベースのビデオ会議ソリューションよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:24:22 GMT)
S7: Selective and Simplified State Space Layers for Sequence Modeling [26.7] 我々は、入力依存を処理し、入力の可変性を処理できるシンプルで強力なSSMであるS7を紹介する。
我々はS7が時間とともに状態遷移を良好に保ち、長期連続モデリングにおける安定性を保証することを証明した。
S7は、ニューロモルフィックイベントベースのデータセット、Long Range Arenaベンチマーク、さまざまな物理的および生物学的時系列など、さまざまなシーケンスモデリングタスクにおいて、ベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:27:43 GMT)
Enhancing Question Answering on Charts Through Effective Pre-training Tasks [26.6] グラフやプロットに適用した場合の現在のVisualQAモデルの制限に対処する。
以上の結果から,既存のモデルでは,図の構造的・視覚的文脈に関する疑問に答える上で,特に性能が低いことが示唆された。
本稿では,構造的・視覚的知識と数値的疑問の理解の両面から,既存のモデルを強制する3つの簡単な事前学習タスクを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:33:23 GMT)
Grounding Continuous Representations in Geometry: Equivariant Neural Fields [26.6] そこで我々は,幾何インフォームド・クロスアテンションを用いた新しいCNFアーキテクチャを提案する。
このアプローチは、フィールドと潜伏剤の両方を幾何学的にグラウンド化することによって、ステアビリティ特性を誘導することを示す。
分類,セグメンテーション,予測,再構築など,様々なタスクにおいて,これらの主な特性を検証する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:00:24 GMT)
Are Graph Neural Networks Optimal Approximation Algorithms? [26.5] 最適化問題のクラスに対して最適な近似アルゴリズムをキャプチャするグラフニューラルネットワークアーキテクチャを設計する。
我々は、OptGNNの学習した埋め込みから最適解のバウンダリを生成するアルゴリズムを設計するために、凸緩和を捕捉するOptGNNの能力を利用する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:13:42 GMT)
SMILE: Single-turn to Multi-turn Inclusive Language Expansion via ChatGPT for Mental Health Support [26.4] 大規模で現実的なマルチターン会話は、メンタルヘルスサポートの進歩を促進する可能性がある。
SMILE(シングルターンからマルチターンインクルーシブ言語拡張技術)を紹介する。
我々は,55kの対話からなるSMILECHATという,大規模で生活型,多様な対話データセットを生成する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:00:21 GMT)
Adaptive BPE Tokenization for Enhanced Vocabulary Adaptation in Finetuning Pretrained Language Models [26.4] Byte-Pair を用いた語彙適応手法の基本的な限界を示す。
(BPE)エキスパートドメインへの微調整事前学習言語モデル(PLM)のトークン化方式。
本稿では,BPEのトークン化フェーズが変更され,文字レベルでのトークン化の前に,付加(ターゲット)語彙上で最も長い文字列マッチングが実行されるAdaptBPEを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:24:55 GMT)
Text-guided Diffusion Model for 3D Molecule Generation [26.1] 本研究では,3次元拡散モデルを用いたテキスト誘導型小型分子生成手法であるTextSMOGを紹介する。
この方法は、テキスト条件を用いて分子生成を誘導し、安定性と多様性を両立させる。
実験結果から,テキスト記述から情報を取得し,活用するためのTextSMOGの有効性が示された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:23:20 GMT)
Generative Artificial Intelligence for Navigating Synthesizable Chemical Space [25.7] 合成可能な化学空間を効率的に探索・ナビゲートするための生成モデリングフレームワークであるSynFormerを紹介する。
拡張性のあるトランスフォーマーアーキテクチャとブロック選択のための拡散モジュールを組み込むことで、SynFormerは合成可能な分子設計において既存のモデルを超えている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:09:05 GMT)
Mathfish: Evaluating Language Model Math Reasoning via Grounding in Educational Curricula [25.5] 我々は,言語モデル(LM)の数学的能力が,数学コンテンツによって実現されるスキルや概念を識別できるかどうかを検討する。
本研究では,算数問題を評価するためのLMの能力を評価するための2つのタスクを開発する。
LMは、問題に関連する標準をタグ付けして検証し、代わりに、真実に近いが微妙な方法で異なるラベルを予測するのに苦労している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:31:26 GMT)
Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models [25.4] MLLM(Multimodal Large Language Models)は幻覚、特に視覚入力に存在しないコンテンツを断定的に生成する。
本稿では,外部知識検索や微調整を必要とせず,新たな幻覚緩和パラダイムであるメモリスペース・ビジュアル・リトラクション(MemVR)を紹介する。
特に、モデルが不確かである場合や、質問関連視覚記憶に注意を払っている場合、フィードフォワードネットワーク(FFN)を介してMLLMにリジェクションされる補助的証拠として視覚刺激をキーバリューメモリとして扱う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:30:54 GMT)
No Need to Talk: Asynchronous Mixture of Language Models [25.4] SmallTalk LMは、ほぼ非同期な方法で言語モデルの混合を訓練する革新的な方法である。
本研究では,SmallTalk LM が,FLOP とほぼ同一の推論コストに対して,高密度モデルベースラインよりも有意に低いパープレキシティを実現することを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:50:10 GMT)
X-ALMA: Plug & Play Modules and Adaptive Rejection for Quality Translation at Scale [25.3] 大規模言語モデル(LLM)は、様々なNLPタスクで顕著な成功を収めてきたが、主に英語に焦点を当てている。
本稿では,多言語機械翻訳タスクに着目し,言語数よりも品質を優先する。
X-ALMAは、リソースレベルに関係なく、50の異なる言語で最高のパフォーマンスを保証することを約束するモデルである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:17:27 GMT)
MELODI: Exploring Memory Compression for Long Contexts [25.2] MELODIは、短いコンテキストウィンドウを使用して長いドキュメントを処理するように設計された新しいメモリアーキテクチャである。
提案手法は, 各種長文データセットにおいて, メモリフットプリントを8。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:34:15 GMT)
G-Transformer for Conditional Average Potential Outcome Estimation over Time [25.1] G変換器(G-transformer、GT)は、時間とともに変化する共同設立者に合わせて調整される新しいニューラル・エンド・ツー・エンド・モデルである。
我々のGTは、時間変化条件下でCAPOに対して回帰に基づく反復的なG-計算を行う最初のニューラルモデルである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:50:11 GMT)
ScriptViz: A Visualization Tool to Aid Scriptwriting based on a Large Movie Database [25.1] ScriptVizは、スクリプトのテキストと大きな映画データベースからの対話に基づいて、参照ビジュアルをリアルタイムで検索する。
15のスクリプトのユーザ評価は、ScriptVizが一貫した、かつ多様な視覚的可能性を持つスクリプトを提示できることを示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:23:56 GMT)
TICKing All the Boxes: Generated Checklists Improve LLM Evaluation and Generation [25.0] TICK(Targeted Instruct-evaluation with ChecKlists)は、完全に自動化され、解釈可能な評価プロトコルである。
まず,LLMが高品質な評価チェックリストを確実に生成できることを示す。
次に、STICKは、自己精製とBest-of-N選択により、複数のベンチマークで生成品質を向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:09:08 GMT)
Misinformation with Legal Consequences (MisLC): A New Task Towards Harnessing Societal Harm of Misinformation [24.9] 法的な問題を用いた誤情報検出の定義を社会的影響を測定するために,我々は新たな角度を採っている。
法的な領域の定義を幅広く活用するMisinformation with Legal Consequence (MisLC) という新しいタスクを導入する。
我々は,クラウドソース型チェックネスネスと誤情報のエキスパート評価を利用する2段階のデータセットキュレーションアプローチを提唱する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:00:28 GMT)
DiffusionPID: Interpreting Diffusion via Partial Information Decomposition [24.8] 入力テキストプロンプトを基本成分に分解するために,情報理論の原理を適用した。
個々のトークンとその相互作用が生成した画像をどのように形成するかを分析する。
PIDはテキスト・画像拡散モデルの評価と診断のための強力なツールであることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:58:13 GMT)
Fine-Grained Expressive Power of Weisfeiler-Leman: A Homomorphism Counting Perspective [24.7] グラフニューラルネットワークの任意のクラス(GNN)の準同型カウント能力を決定するための理論的枠組みを提供する。
検討されている設計空間は、既知の強力なGNNのほとんどすべてに対応するのに十分の大きさであるので、我々の結果は既存のすべての作業を大幅に拡張し、GNNモデル設計の自動化にその応用を見出すことができるかもしれない。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:36:48 GMT)
Is this the real life? Is this just fantasy? The Misleading Success of Simulating Social Interactions With LLMs [24.6] 大規模言語モデル(LLM)はより豊かな社会シミュレーションを可能にし、様々な社会現象の研究を可能にしている。
最近の研究は、これらのシミュレーションについて、人間とAIエージェントが現実世界で関与する不完全で情報非対称な相互作用と、基本的には異なっています。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:01:34 GMT)
Navigable Graphs for High-Dimensional Nearest Neighbor Search: Constructions and Limits [24.6] グラフが任意の開始ノードから任意のターゲットノードへの移動に成功すれば、グラフはナビゲート可能である。
アプリケーションにとって重要な問題は、スペーサーグラフを構築することができるかどうかである。
任意の次元において、任意の距離関数に対して、平均次数$O(sqrtn log n )$の任意の$n$点に対してナビゲート可能なグラフを構築するための単純かつ効率的な方法を与える。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:41:32 GMT)
Unlearnable 3D Point Clouds: Class-wise Transformation Is All You Need [24.2] 未許可ユーザーが2次元画像データのトレーニングを行うのを防ぐために、学習不可能な戦略が提案されている。
2つのプロセスを含む3Dポイントクラウドのための最初の統合不可能なフレームワークを提案する。
理論的および実証的な結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:49:32 GMT)
FastMem: Fast Memorization of Prompt Improves Context Awareness of Large Language Models [24.0] FastMemは、命令を微調整した大規模言語モデルのコンテキスト認識を強化するために設計された新しい手法である。
最後のFeed-Forward Network(FFN)モジュールのみを更新することで、推論前のプロンプトの可能性を最大化する。
本実験は, 読解理解, テキスト要約, 出力構造への順守において, かなりの効果を示した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:14:32 GMT)
L-CiteEval: Do Long-Context Models Truly Leverage Context for Responding? [23.8] 我々はL-CiteEvalという長文理解のためのベンチマークを紹介した。
L-CiteEvalは、さまざまなドメインから11のタスクをカバーし、コンテキストの長さは8Kから48Kまでである。
オープンソースモデルは、引用精度とリコールの観点から、クローズドソースモデルに遅れを取っていることに気付きました。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:52:28 GMT)
L-CiteEval: Do Long-Context Models Truly Leverage Context for Responding? [23.8] 我々はL-CiteEvalという長文理解のためのベンチマークを紹介した。
L-CiteEvalは、さまざまなドメインから11のタスクをカバーし、コンテキストの長さは8Kから48Kまでである。
オープンソースモデルは、引用精度とリコールの観点から、クローズドソースモデルに遅れを取っていることに気付きました。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:52:28 GMT)
Predicting perturbation targets with causal differential networks [23.6] 我々は、因果グラフを観察および介入データセットから推定するために、償却因果探索モデルを用いる。
我々は、これらのペアグラフを、教師付き学習フレームワークで介入された変数の集合にマッピングすることを学ぶ。
このアプローチは、7つのシングルセルトランスクリプトミクスデータセットの摂動モデリングのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:48:21 GMT)
FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction [23.5] 本稿では,トークンレベルのFusionモジュールを用いてドラッグ・ターゲットインタラクションの詳細な情報を学習するFusionDTIという新しいモデルを提案する。
特に、FusionDTIモデルでは、医薬品のSELFIES表現を使用して、配列フラグメントの無効化を軽減しています。
提案したFusionDTIモデルは,既存の7つの最先端ベースラインと比較して,DTI予測において最高の性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:23:12 GMT)
Discovering Biases in Information Retrieval Models Using Relevance Thesaurus as Global Explanation [23.5] 我々は「関連シソーラス」を構築することにより、世界規模で神経関連モデルを説明する新しい手法を提案する。
このシソーラスは、BM25のような語彙マッチングモデルを拡張して、ニューラルネットワークの予測を近似するために用いられる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:42:13 GMT)
I Learn Better If You Speak My Language: Understanding the Superior Performance of Fine-Tuning Large Language Models with LLM-Generated Responses [23.1] LLMによって生成された応答で大きな言語モデル(LLM)を微調整すると、特に推論タスクにおいて、人間によって生成された応答を使用するよりも良い結果が得られることが多い。
LLM生成応答によるトレーニングは、パフォーマンスの向上だけでなく、特定のタスクを微調整した後の他の推論タスクにおけるモデルの能力維持にも役立ちます。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:46:03 GMT)
HyResPINNs: Adaptive Hybrid Residual Networks for Learning Optimal Combinations of Neural and RBF Components for Physics-Informed Modeling [22.7] 我々はHyResPINNと呼ばれる新しいPINNのクラスを提示する。
本手法の重要な特徴は,各残差ブロックに適応的な組み合わせパラメータを組み込むことである。
HyResPINNは従来のPINNよりも、ポイントロケーションやニューラルネットワークアーキテクチャのトレーニングに堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:21:14 GMT)
Is Safer Better? The Impact of Guardrails on the Argumentative Strength of LLMs in Hate Speech Countering [22.6] 我々は、よりコジェントな応答を生成するために、対音声生成の2つの側面に焦点を当てる。
まず、安全ガードレールの存在が世代の品質を損なうかどうかを検証する。
第二に、ヘイトスピーチの特定の要素を攻撃することが、オンラインヘイトと戦うためのより効果的な議論戦略をもたらすかどうかを評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:31:37 GMT)
Investigating LLMs as Voting Assistants via Contextual Augmentation: A Case Study on the European Parliament Elections 2024 [22.5] 2024年の欧州議会議員選挙では、LLMsがVoting Advice Applications (VAA)として利用できるかどうかを調査している。
我々は、MISTRALとMIXTRALモデルを評価し、最新の「EUとI」投票支援アンケートに基づいて、政党の姿勢を予測する際の精度を評価した。
その結果、MIXTRALは平均82%の精度で精度が高く、異なる政治集団間で大きな性能差があることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:25:39 GMT)
Rater Cohesion and Quality from a Vicarious Perspective [22.4] Vicariousアノテーションは、他の人がデータにアノテートすると考える方法をラウンダーに問うことによって、不一致を断ち切る方法である。
我々はレーダ結束指標を用いて、政治的関係や人種的背景がラテンダーの犯罪に対する認識に与える影響について検討する。
我々は,レーダの品質指標が,個人的および活気あるレベルにわたって,グループ内およびグループ間レーダの凝集にどのように影響するかを検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:51:00 GMT)
Investigating and Mitigating Object Hallucinations in Pretrained Vision-Language (CLIP) Models [22.4] 本稿では,CLIPモデル内での物体幻覚問題について詳細に検討する。
孤立しても、CLIPモデルは対象の幻覚に傾向があり、幻覚問題は単に視覚と言語モダリティの相互作用によるものではないことを示唆する。
拡張モデルは視覚エンコーダとして利用でき、LVLMにおける物体幻覚の問題を効果的に緩和できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:24:49 GMT)
POSIX: A Prompt Sensitivity Index For Large Language Models [22.3] 大型言語モデル(LLM)は驚くほど微妙なプロンプトに敏感である。
POSIXは新規なPrOmpt Sensitivity IndeXである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:00:03 GMT)
POSIX: A Prompt Sensitivity Index For Large Language Models [22.3] 大型言語モデル(LLM)は驚くほど微妙なプロンプトに敏感である。
POSIXは新規なPrOmpt Sensitivity IndeXである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:00:03 GMT)
Steering Large Language Models between Code Execution and Textual Reasoning [22.3] テキスト推論は、数学、論理学、最適化、探索における課題を伴うタスクの解決に固有の制限がある。
最近リリースされたOpenAI GPT Code InterpreterとAutoGenのようなマルチエージェントフレームワークは、コード生成と実行を統合するのに顕著な能力を示している。
LLMのコード/テキスト生成を良くし、顕著な改善を実現するための3つの方法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:44:47 GMT)
Major Entity Identification: A Generalizable Alternative to Coreference Resolution [22.2] 代替参照タスクであるMajor Entity Identification (MEI)を提案する。
我々は、MEIモデルが複数のデータセット上のドメインにわたってよく一般化されていることを実証する。
MEIはまた、ユーザが特定のエンティティや関心のあるエンティティのグループのすべての言及を検索できるので、実用的な使用法である。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:08:06 GMT)
Multi-Robot Motion Planning with Diffusion Models [22.1] 衝突のないマルチロボット軌道を生成する手法を提案する。
我々のアルゴリズムは、学習した拡散モデルと古典的な検索に基づく手法を組み合わせる。
大規模環境における複数拡散モデルの構築方法について述べる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:31:13 GMT)
Aligning Language Models to Explicitly Handle Ambiguity [22.1] 我々は,あいまいなクエリを扱うために,言語モデルを整列する新しいパイプラインであるAlignment with Perceived Ambiguity (APA)を提案する。
質問応答データセットの実験結果から、APAはLLMに対して、あいまいなクエリを明示的に検出し、管理する権限を持つことが示された。
我々の発見は、APAがゴールドスタンダードラベルのトレーニング、特にアウト・オブ・ディストリビューションのシナリオで優れていることを証明している。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:20:18 GMT)
Analysis and Detection of Differences in Spoken User Behaviors between Autonomous and Wizard-of-Oz Systems [21.9] 注意的聴取と面接の対話シナリオにおけるユーザ音声行動の分析を行った。
その結果, 発話長, 発話速度, フィラー, バックチャネル, 拡散, 笑いなどの指標に有意な差が認められた。
我々は,オペレータと自律システムの状態を区別する予測モデルを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:07:55 GMT)
Data Augmentation for Code Translation with Comparable Corpora and Multiple References [21.8] 我々は、自然言語ドキュメントから生成されたプログラムを含む、比較可能なコーパスの複数のタイプを構築し、分析する。
単一の参照変換に対する過度な適合を低減するため、利用可能な並列データに対する追加の翻訳参照を自動生成する。
実験の結果,Java,Python,C++間の変換において,平均7.5%の計算精度でコードT5が大幅に改善された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:16:21 GMT)
Permissive Information-Flow Analysis for Large Language Models [21.6] 大規模言語モデル(LLM)は、大規模ソフトウェアシステムのコモディティコンポーネントになりつつある。
これは自然なセキュリティとプライバシの問題を引き起こします。あるコンポーネントから取得した有毒なデータは、モデルの振る舞いを変更し、システム全体を侵害します。
LLMクエリを通じて情報フローラベルを伝搬する新しい,より寛容な手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:25:43 GMT)
MetricX-24: The Google Submission to the WMT 2024 Metrics Shared Task [21.5] We present the MetricX-24 submits to the WMT24 Metrics Shared Task。
私たちの主な提案は、ハイブリッド参照ベース/フリーメトリックです。
WMT23 MQM 評価では MetricX-23 よりも大幅に性能が向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:52:28 GMT)
Predictive Coding for Decision Transformer [21.3] 決定変換器(DT)アーキテクチャは、様々な領域で約束されている。
最初の成功にもかかわらず、DTはゴール条件付きRLのいくつかの挑戦的なデータセットで性能が劣っている。
本稿では、一般化された将来の条件付けを活用してDT手法を強化するPCDT(Predictive Coding for Decision Transformer)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:17:34 GMT)
From 5G to 6G: A Survey on Security, Privacy, and Standardization Pathways [21.3] 6Gのビジョンは、より高速なデータレート、ほぼゼロのレイテンシ、より高いキャパシティでネットワーク機能を強化することである。
この進歩は、没入型混合現実体験、ホログラフィー通信、スマートシティインフラの実現を目指している。
6Gの拡張は、不正アクセスやデータ漏洩など、重要なセキュリティとプライバシの懸念を提起する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:03:44 GMT)
Coffee-Gym: An Environment for Evaluating and Improving Natural Language Feedback on Erroneous Code [21.0] Coffee-Gymは、コード編集に関するフィードバックを提供するトレーニングモデルのためのRL環境である。
Coffee-Gymには,(1)人間のコード編集トレースを含むデータセットであるCoffee,(2)誤ったコード編集のための機械によるフィードバックを含むデータセットであるCoffeeEval,(2)修正されたコードのパフォーマンスをユニットテストで評価することで,フィードバックの有用性を忠実に反映する報酬関数であるCoffeeEvalが含まれる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:48:56 GMT)
Coffee-Gym: An Environment for Evaluating and Improving Natural Language Feedback on Erroneous Code [21.0] Coffee-Gymは、コード編集に関するフィードバックを提供するトレーニングモデルのためのRL環境である。
Coffee-Gymには,(1)人間のコード編集トレースを含むデータセットであるCoffee,(2)誤ったコード編集のための機械によるフィードバックを含むデータセットであるCoffeeEval,(2)修正されたコードのパフォーマンスをユニットテストで評価することで,フィードバックの有用性を忠実に反映する報酬関数であるCoffeeEvalが含まれる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:48:56 GMT)
Learning Structured Representations by Embedding Class Hierarchy with Fast Optimal Transport [20.9] 本研究では,Earth Mover's Distance (EMD) を用いて特徴空間内のクラス間のペア距離を測定することを提案する。
最も効率的なOT-CPCC変種は、データセットとタスク間の競合性能を維持しながら、データセットのサイズで線形時間で実行されます。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:20:34 GMT)
Error Correction Code Transformer: From Non-Unified to Unified [20.9] 従来のデコーダは、特定のデコードアルゴリズムに適した固定ハードウェア回路として設計されていた。
本稿では、複数の線形ブロックコードを扱うことができる、コードに依存しないトランスフォーマーベースのデコードアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:30:42 GMT)
Deepfake Detection: A Comprehensive Survey from the Reliability Perspective [20.9] キノコ入りのDeepfake合成材料がインターネット上に流通し、政治家、有名人、そして世界中の個人に深刻な社会的影響を与えている。
現在のDeepfake検出領域では、トランスファービリティ、解釈可能性、堅牢性という、信頼性を重視した3つの研究課題を識別する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:53:15 GMT)
Infrared Small Target Detection in Satellite Videos: A New Dataset and A Novel Recurrent Feature Refinement Framework [20.7] IRSatVideo-LEOは、合成された衛星の動き、ターゲットの外観、軌道、強度を備えたセミシミュレートされたデータセットである。
RFRは、長期の時間的依存性を悪用するための、既存の強力なCNNベースの手法を備えることが提案されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:54:20 GMT)
Infrared Small Target Detection in Satellite Videos: A New Dataset and A Novel Recurrent Feature Refinement Framework [20.7] IRSatVideo-LEOは、合成された衛星の動き、ターゲットの外観、軌道、強度を備えたセミシミュレートされたデータセットである。
RFRは、長期の時間的依存性を悪用するための、既存の強力なCNNベースの手法を備えることが提案されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:54:20 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:53:50 GMT)
STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.5] 正確な3Dオブジェクト検出器をトレーニングするための重要な要件は、大量のLiDARベースのポイントクラウドデータが利用可能であることである。
本稿では,3Dオブジェクト検出のトレーニングのラベル付けコストを大幅に削減する,統合されたアクティブな3Dオブジェクト検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:45:33 GMT)
Online Posterior Sampling with a Diffusion Prior [20.2] ガウス事前の文脈的包帯における後方サンプリングは、ラプラス近似を用いて正確にあるいはほぼ実施することができる。
そこで本研究では,拡散モデルを用いた文脈帯域に対する近似的な後方サンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:47:16 GMT)
Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation [20.2] 大規模言語モデル(LLM)は「カストミゼーション(customization)」と呼ばれるプロセスを通じて下流アプリケーションに広く適応する。
近年の研究では、LSMを悪意のあるサンプルでチューニングすることで、その堅牢性を損なうことができ、有害なコンテンツを増幅する脆弱性が明らかにされている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:39:14 GMT)
Buckle Up: Robustifying LLMs at Every Customization Stage via Data Curation [20.2] 大規模言語モデル(LLM)は「カストミゼーション(customization)」と呼ばれるプロセスを通じて下流アプリケーションに広く適応する。
近年の研究では、LSMを悪意のあるサンプルでチューニングすることで、その堅牢性を損なうことができ、有害なコンテンツを増幅する脆弱性が明らかにされている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:39:14 GMT)
A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models [20.1] 大規模言語モデル(LLM)は、複雑な健康情報のニーズを満たすことを約束すると同時に、健康格差を悪化させる可能性がある。
エクイティ関連モデル失敗の信頼性評価は、ヘルスエクイティを促進するシステムを開発するための重要なステップである。
医学的問題に対するLLMによる長期的回答において、株式関連害を生じさせる可能性のあるバイアスを克服するためのリソースと方法論を提示する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:44:10 GMT)
When a language model is optimized for reasoning, does it still show embers of autoregression? An analysis of OpenAI o1 [20.1] o1はOpenAIの新しいシステムで、従来の言語モデルと異なり、推論に最適化されている。
多くの場合、o1は従来のLLMよりも大幅に優れていた。
しかし、o1は以前のシステムで観測したのと同じ定性的傾向を示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:57:33 GMT)
When a language model is optimized for reasoning, does it still show embers of autoregression? An analysis of OpenAI o1 [20.1] o1 は OpenAI の新しいシステムで,従来の LLM と異なり,推論に最適化されている。
多くの場合、o1 は従来の LLM よりも大幅に優れており、特に共通タスクの稀な変種に対して大きな改善が加えられている。
しかし、o1は以前のシステムで観測したのと同じ定性的傾向を示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:57:33 GMT)
SPHINX: Structural Prediction using Hypergraph Inference Network [19.9] 本稿では,非教師付き手法で遅延ハイパーグラフ構造を推論するモデルであるハイパーグラフ推論ネットワーク(SPHINX)を用いた構造予測を提案する。
k-サブセットサンプリングの最近の進歩は、離散ハイパーグラフ構造を生成するのに適したツールであることを示す。
結果として得られるモデルは、現代のハイパーグラフニューラルネットワークに必要な高次構造を生成することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:49:57 GMT)
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT [19.8] 本稿では,AIoTシステムにおけるデバイス上の時系列予測に最適化されたTransformers用ハードウェアアクセラレータの設計について述べる。
整数のみの量子化と量子化対応トレーニングと最適化ハードウェア設計を統合し、6ビットおよび4ビットの量子化トランスフォーマーモデルを実現する。
関連する研究で8ビット量子トランスモデルと比較すると、我々の4ビット量子トランスモデルはテスト損失をわずか0.63%増加させ、最大132.33倍速く動作し、48.19倍のエネルギーを消費する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:15:10 GMT)
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT [19.8] 本稿では,AIoTシステムにおけるデバイス上の時系列予測に最適化されたTransformers用ハードウェアアクセラレータの設計について述べる。
整数のみの量子化と量子化対応トレーニングと最適化ハードウェア設計を統合し、6ビットおよび4ビットの量子化トランスフォーマーモデルを実現する。
関連する研究で8ビット量子トランスモデルと比較すると、我々の4ビット量子トランスモデルはテスト損失をわずか0.63%増加させ、最大132.33倍速く動作し、48.19倍のエネルギーを消費する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:15:10 GMT)
Multilingual Topic Classification in X: Dataset and Analysis [19.7] X-Topicは4つの異なる言語(英語、スペイン語、日本語、ギリシャ語)のコンテンツを含む多言語データセットである。
私たちのデータセットには、ソーシャルメディアコンテンツに適した幅広いトピックが含まれています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:37:26 GMT)
Why Fine-Tuning Struggles with Forgetting in Machine Unlearning? Theoretical Insights and a Remedial Approach [19.3] ファインチューニング(FT)手法は、未学習を近似するための基本的なアプローチの1つとなっている。
本稿では,線形回帰フレームワーク内での機械学習のためのFT法に関する最初の理論的解析を行う。
本稿では,事前学習モデルにおけるデータ保存の維持を緩和するための理論的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:01:52 GMT)
Explainable Artifacts for Synthetic Western Blot Source Attribution [18.8] 近年の人工知能の進歩により、生成モデルは原始的なものと区別できない合成科学的イメージを生成できるようになった。
本研究の目的は、最先端の生成モデルによって生成された説明可能なアーティファクトを特定し、それらをオープンセットの識別とソース属性に活用することである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:40:11 GMT)
Mitigating Adversarial Perturbations for Deep Reinforcement Learning via Vector Quantization [18.6] 優れた強化学習(RL)エージェントは、展開中に敵の摂動に対してレジリエンスを欠いていることが多い。
これは、現実世界にデプロイする前に堅牢なエージェントを構築することの重要性を強調している。
本研究では,RLの入力変換に基づくディフェンスについて検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:41:54 GMT)
One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.6] 統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:56:10 GMT)
Dolphin: A Programmable Framework for Scalable Neurosymbolic Learning [18.5] 本稿では,シンボルプログラムの前方連鎖と後方勾配の伝播をベクトル化計算にマッピングすることにより,ニューロシンボリック学習を基本レベルでスケールする枠組みを提案する。
Dolphin氏は、PyTorchのような高性能なディープラーニングフレームワークの上に構築された一連の抽象化とプリミティブを紹介した。
我々はDolphinを、テキスト、画像、ビデオ処理のディープラーニングモデルとシンボリックプログラムを組み合わせた5つのニューロシンボリックタスクの13のベンチマークスイートで評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:12:36 GMT)
Understanding Decision Subjects' Engagement with and Perceived Fairness of AI Models When Opportunities of Qualification Improvement Exist [18.5] 我々は、AIモデルの公平さが、モデルの公正さに対する人々の関与と認識にどのように影響するかを考察する。
意思決定対象の戦略的かつ反復的なAIモデルとの相互作用において、モデルの公平性は、モデルとのインタラクションや自己改善の意思を変えるものではないことがわかった。
意思決定の被験者は、グループに対して体系的にバイアスをかけると、AIモデルが公平でないと認識します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:43:26 GMT)
Sample-efficient Imitative Multi-token Decision Transformer for Real-world Driving [18.3] 我々はSimDT(SimDT)を提案する。
SimDTでは、マルチトークン予測、オンライン模倣学習パイプライン、シーケンスモデリング強化学習への優先的なエクスペリエンスリプレイが導入されている。
結果は、Waymaxベンチマークのオープンループとクローズループ設定の両方で、人気のある模倣と強化学習アルゴリズムを上回る。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:45:21 GMT)
Graph Cuts with Arbitrary Size Constraints Through Optimal Transport [18.3] 任意のサイズ制約下でグラフを分割するグラフカットアルゴリズムを提案する。
我々は,大域収束を臨界点に保証する高速化された近位GDアルゴリズムを用いてこの問題を解決する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:39:36 GMT)
HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration [18.2] 本稿では,新しい学習ベースキャッシングフレームワークを用いて,学習と推論を調和させる新しい手法を提案する。
従来の訓練パラダイムと比較して、新たに提案されたSDTは、認知プロセスの継続性を維持している。
IEPOは効率的なプロキシメカニズムを統合して、キャッシュされた機能の再使用による最終的な画像エラーを近似する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:14:17 GMT)
Simple Drop-in LoRA Conditioning on Attention Layers Will Improve Your Diffusion Model [18.1] 現在の最先端拡散モデルでは、畳み込み層と(qkv)自己アテンション層を含むU-Netアーキテクチャを採用している。
U-Netアーキテクチャの他の部分を変更したり調整したりすることなく、LoRAコンディショニングをアテンション層に追加するだけで、画像生成の品質が向上することを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:40:05 GMT)
Simple Drop-in LoRA Conditioning on Attention Layers Will Improve Your Diffusion Model [18.1] 現在の最先端拡散モデルでは、畳み込み層と(qkv)自己アテンション層を含むU-Netアーキテクチャを採用している。
U-Netアーキテクチャの他の部分を変更したり調整したりすることなく、LoRAコンディショニングをアテンション層に追加するだけで、画像生成の品質が向上することを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:40:05 GMT)
Few-shot Prompting for Pairwise Ranking: An Effective Non-Parametric Retrieval Model [18.1] 本稿では,複雑な訓練パイプラインを必要とせず,教師付きモデルに近い性能を達成できる一対数ショットローダを提案する。
また,複雑なトレーニングパイプラインを必要とせず,教師付きモデルに近い性能を実現する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:35:14 GMT)
SiMilarity-Enhanced Homophily for Multi-View Heterophilous Graph Clustering [18.1] マルチビューヘテロ親和性グラフクラスタリング(SMHGC)のためのSiMilarity-enhanced Homophilyを提案する。
多視点ヘテロ親和性データセットおよびホモ親和性データセットの最先端実験結果は、教師なし多視点ヘテロ親和性グラフ学習における類似性の強い能力を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:55:35 GMT)
Test-Time Fairness and Robustness in Large Language Models [17.8] Frontier Large Language Models (LLM) は、社会的に差別的であるか、その入力の刺激的な特徴に敏感である。
既存のソリューションは、LLMに公正か堅牢かを指示し、モデルのバイアスに対する暗黙の理解に依存します。
暗黙的な指示とは異なり、我々のプロンプト戦略は、フロンティアLSMのバイアスを一貫して減少させることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:10:33 GMT)
Deep Learning and Machine Learning: Advancing Big Data Analytics and Management with Design Patterns [17.6] この本は、ビッグデータ分析システムの開発、メンテナンス、スケーラビリティを最適化するための、古典的なソフトウェアエンジニアリングパターンの適用について説明している。
モデル管理、デプロイメント戦略、チームコラボレーションへの影響について、シングルトン、ファクトリ、オブザーバ、ストラテジーといった主要なデザインパターンを分析します。
このボリュームは、開発者、研究者、エンジニアにとって、マシンラーニングとソフトウェア設計の両方における技術的専門知識を強化するために不可欠なリソースである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:50:58 GMT)
DiffSF: Diffusion Models for Scene Flow Estimation [17.5] 本稿では,変圧器を用いたシーンフロー推定とデノナイズ拡散モデルを組み合わせたDiffSFを提案する。
拡散過程は, 従来の手法に比べて, 予測の堅牢性を大幅に向上させることを示す。
異なる初期状態で複数回サンプリングすることにより、復調過程は複数の仮説を予測し、出力の不確実性を測定することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:37:08 GMT)
Mixture of Attentions For Speculative Decoding [17.3] 投機的復号法(SD)は、より小さなモデルを利用して将来のトークンを効率的に提案し、それを大規模言語モデルによって並列に検証する。
SDモデルには、トレーニング中のオン・ポリティネスの欠如や部分観測可能性の欠如など、いくつかの制限がある。
SD用ミクチャ・オブ・アテンションの導入により,小型モデルのより基礎的なアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:25:52 GMT)
EBES: Easy Benchmarking for Event Sequences [17.3] イベントシーケンスは、ヘルスケア、ファイナンス、ユーザインタラクションログなど、さまざまな現実世界のドメインにおける一般的なデータ構造である。
時間データモデリング技術の進歩にもかかわらず、イベントシーケンスのパフォーマンスを評価するための標準ベンチマークは存在しない。
標準化された評価シナリオとプロトコルを備えた総合的なベンチマークツールであるEBESを紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:03:43 GMT)
CommonIT: Commonality-Aware Instruction Tuning for Large Language Models via Data Partitions [17.3] そこで我々はCommonIT: Commonality-aware Instruction Tuningと呼ばれる新しい指導指導戦略を導入する。
具体的には、命令データセットを3つのメトリクス(Task, Embedding, Length)で異なるグループにクラスタ化する。
LLaMaモデルの厳密なテストは、LLMの命令追従能力を向上するCommonITの有効性を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:42:35 GMT)
Understanding Reasoning in Chain-of-Thought from the Hopfieldian View [17.2] 本稿では,認知神経科学における認知のホップフィールド的視点に基づく新しい視点を紹介する。
我々は, CoT(Chain-of-Thought)推論と, 刺激, 行動, 神経集団, 表現空間といった重要な認知要素の関連性を確立する。
我々は,低次元表現空間のロバスト性を利用して,CoTにおける推論過程のロバスト性を高めるRepresentation-of-Thought(RoT)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:55:30 GMT)
Are Expert-Level Language Models Expert-Level Annotators? [17.1] 本研究では,データアノテータとしてのLSMが専門知識を必要とする領域でどの程度機能するかを検討する。
我々の知る限り、我々はLSMを専門家レベルのデータアノテータとして初めて体系的に評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:17:09 GMT)
Dynamic Evidence Decoupling for Trusted Multi-view Learning [17.0] 本稿では,一貫性と相補性を考慮したマルチビューラーニング(CCML)手法を提案する。
我々はまず,信念の質量ベクトルと不確実性推定からなる明らかな深層ニューラルネットワークを用いて,見解を構築する。
その結果, 動的エビデンスデカップリング戦略の有効性を検証し, CCMLが精度と信頼性の基準線を著しく上回ることを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:27:51 GMT)
Horizon-Length Prediction: Advancing Fill-in-the-Middle Capabilities for Code Generation with Lookahead Planning [17.0] 本研究では,各ステップに残るミドルトークンの数をモデルに予測する学習目標として,Horizon-Length Prediction (HLP)を提案する。
HLPはファイルレベルとリポジトリレベルの異なるベンチマークでFIMのパフォーマンスを最大24%向上させ、非現実的なポストプロセッシング手法を使わずに改善する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:53:52 GMT)
A variational quantum algorithm by Bayesian Inference with von Mises-Fisher distribution [17.0] 我々は、フォン・ミセス・フィッシャー分布とともにベイズ的推論原理を用いる新しいアプローチを提案する。
理論的には、様々なランダムなハミルトン行列に対して基底状態を特定できる新しいアルゴリズムの能力を実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:57:19 GMT)
Can LLMs Generate Diverse Molecules? Towards Alignment with Structural Diversity [17.0] そこで本研究では, 構造的に多様な分子の集合を自己回帰的に生成する分子生成LDMを微調整する手法を提案する。
提案手法は,(1)LLMを自己回帰的に生成する分子に適応させるための微調整と,(2)生成分子の構造多様性を最大化するための強化学習の2段階からなる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:25:36 GMT)
A Tutorial on the Design, Experimentation and Application of Metaheuristic Algorithms to Real-World Optimization Problems [16.9] メタヒューリスティックの設計と使用に関する数十年の歴史的進歩にもかかわらず、新しい技術成果の理解可能性、アルゴリズム設計の正しさ、性能検証性に関して大きな困難が残っている。
この研究は、最適化に使用されるメタヒューリスティックス手法の研究を行う際に、受け入れるべき良いプラクティスの提案を聴衆に提供することを目的としている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:41:23 GMT)
MultiContrievers: Analysis of Dense Retrieval Representations [16.8] 我々は,高密度検索者が取得した情報を,ベースとした言語モデルと比較して初めて分析する。
ウィキペディアのような文書のコントリバーベクターから、性別や職業などの特定の情報を抽出できるかどうかを検証した。
本研究は,抽出可能性と性バイアスとの関係と,これらの結果の無作為な初期化やデータシャッフルに対する感受性について検討する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:37:12 GMT)
RAFT: Realistic Attacks to Fool Text Detectors [16.7] 大規模言語モデル(LLM)は、様々なタスクにまたがって顕著な流速を示した。
偽情報の拡散など倫理的でない応用が懸念されている。
RAFT:既存のLLM検出器に対する文法エラーのないブラックボックス攻撃について述べる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:59:00 GMT)
RIPPLECOT: Amplifying Ripple Effect of Knowledge Editing in Language Models via Chain-of-Thought In-Context Learning [16.5] 本稿では,Chain-of-Thought推論を統合した新しいICL編集手法であるRippleCOTを提案する。
以上の結果から,RippleCOTは7.8%から87.1%の精度向上を実現した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:37:36 GMT)
Grounding Language in Multi-Perspective Referential Communication [16.4] マルチエージェント環境における表現生成と理解のためのタスクとデータセットを提案する。
我々は2,970人の人間が書いた参照表現のデータセットを収集し、それぞれが人間の理解的判断と組み合わせる。
自動モデルの性能を人間のパートナーとペアリングした話者とリスナーとして評価し,人間のエージェントのペアよりも遅れた参照生成と理解の遅延の両方におけるモデル性能を確認した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:42:30 GMT)
Diffusing in Someone Else's Shoes: Robotic Perspective Taking with Diffusion [16.3] ヒューマノイドロボットは、人間から学ぶことによって、人間の形状と類似性から恩恵を受けることができる。
第三者の視点から見たデモから精神的に移行できることは、人間にとってこの能力の基本である。
本研究では,ロボットが直接第三者によるデモンストレーションから学習し,一対一の視点を生成できる新しい拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:03:45 GMT)
Towards Efficient Hyperdimensional Computing Using Photonics [16.0] 超次元コンピューティング(Hyperdimensional Computing、HDC)は、脳にインスパイアされた機械学習技術である。
本稿では,フォトニックコンピューティングとHDCが,フォトニックコンピューティングとディープニューラルネットワーク(DNN)よりも補完的であることを論じる。
我々は、HDCトレーニングと推論のための最初の電子フォトニック加速器であるPhotoHDCを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:26:45 GMT)
A General Framework for Producing Interpretable Semantic Text Embeddings [15.9] algoCQG-MBQAは、様々なタスクにまたがる解釈可能なセマンティックテキスト埋め込みを生成するためのフレームワークである。
我々は、広範囲な実験とアブレーション研究を通じて、algoCQG-MBQAの有効性と解釈可能性を検証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:51:19 GMT)
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences [15.8] 経験的なリプレイを伴う強化学習(RL)では、リプレイバッファに格納された経験がRLエージェントのパフォーマンスに影響を与える。
経験の影響を推定する1つの方法は、LOO法である。
ターンオーバー・ドロップアウト(PIToD)によるポリシー・イテレーションを行い,経験の影響を効率的に推定する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:47:03 GMT)
A Prescription of Methodological Guidelines for Comparing Bio-inspired Optimization Algorithms [15.8] 本稿では,新しいバイオインスパイアされたアルゴリズムの提案を成功させるための方法論的ガイドラインを提案する。
著者らが報告した結果は、過去の結果よりも大幅に進歩することが証明されるべきである。
我々は、これらのガイドラインが著者だけでなく、レビュアーや編集者にも有用であると期待している。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:50:41 GMT)
LInK: Learning Joint Representations of Design and Performance Spaces through Contrastive Learning for Mechanism Synthesis [15.8] 本稿では,性能と設計空間のコントラスト学習と最適化手法を統合する新しいフレームワークであるLInKを紹介する。
マルチモーダルおよび変換不変のコントラスト学習フレームワークを活用することで、LInKは複雑な物理学とメカニズムの設計表現をキャプチャする共同表現を学習する。
以上の結果から,LInKは機構設計の分野を進展させるだけでなく,他の工学分野へのコントラスト学習や最適化の適用性も拡大することが示された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:13:43 GMT)
IoT-LLM: Enhancing Real-World IoT Task Reasoning with Large Language Models [15.8] 大規模言語モデル(LLM)は、テキストや視覚領域にまたがる顕著な能力を示してきたが、しばしば物理法則に違反した出力を生成する。
人間の認識にインスパイアされた我々は、IoTセンサデータと、物理的な世界でのIoTタスク推論に関する関連する知識を用いて、知覚能力の向上によるLLMの強化について検討する。
我々は,IoT-LLMがLLMによるIoTタスクの推論性能を大幅に向上し,従来の手法と比較して,各タスクの平均65%の改善を実現していることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:30:10 GMT)
IoT-LLM: Enhancing Real-World IoT Task Reasoning with Large Language Models [15.8] 大規模言語モデル(LLM)は、テキストや視覚領域にまたがる顕著な能力を示してきたが、しばしば物理法則に違反した出力を生成する。
人間の認識にインスパイアされた我々は、IoTセンサデータと、物理的な世界でのIoTタスク推論に関する関連する知識を用いて、知覚能力の向上によるLLMの強化について検討する。
我々は,IoT-LLMがLLMによるIoTタスクの推論性能を大幅に向上し,従来の手法と比較して,各タスクの平均65%の改善を実現していることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:30:10 GMT)
Context and System Fusion in Post-ASR Emotion Recognition with Large Language Models [15.7] 大規模言語モデル(LLM)は、音声とテキストのモデリングにおいて重要な役割を担っている。
我々は,ASR後の音声感情予測における文脈と複数のシステムのアウトプットの最適利用を探求するために,GenSEC というタスクの促進について検討した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:50:18 GMT)
Do We Need Language-Specific Fact-Checking Models? The Case of Chinese [15.6] 本稿では,中国語の事例に着目し,言語固有の事実チェックモデルの潜在的なメリットについて検討する。
まず、翻訳に基づく手法と多言語大言語モデルの限界を実証し、言語固有のシステムの必要性を強調した。
文脈情報を組み込んで文書から証拠をよりよく検索できる中国のファクトチェックシステムを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:02:38 GMT)
EXAQ: Exponent Aware Quantization For LLMs Acceleration [15.6] ソフトマックス関数への入力に対して最適なクリッピング値を決定するための解析的手法を提案する。
この方法は$ex$と$sum(ex)$の両方の計算を最小限の精度で高速化する。
この超低ビット量子化は、蓄積相において初めて約4倍の加速を可能にする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:54:30 GMT)
The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection [15.5] 本稿では,高齢者の幸福感向上を目的としたスマートホームアプリケーションのための音声イベント検出研究を支援する住宅用オーディオデータセットを提案する。
このデータセットは、55~80歳の家庭で7日間の音声記録システムを構築して構築される。
事前訓練された音声ニューラルネットワークを用いて、音声を含むセグメントを検出し、除去する新しい音声除去パイプラインを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:35:03 GMT)
MiTTenS: A Dataset for Evaluating Gender Mistranslation [15.3] さまざまな言語ファミリーやスクリプトから26言語をカバーするデータセットMiTTenSを紹介した。
データセットは、既知の障害パターンをターゲットにした手作りのパスで構築される。
高資源言語においても,すべてのシステムが性別の誤訳や潜在的危害を示すことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:41:12 GMT)
Limits of Deep Learning: Sequence Modeling through the Lens of Complexity Theory [15.2] 彼らの成功にもかかわらず、ディープラーニングモデルは複雑な推論と機能構成を必要とするタスクに苦しむ。
本研究では,SSM(Structured State Space Models)とTransformer(Transformer)の制約に関する理論的および実証的研究を行う。
信頼性の高い多段階推論と構成課題解決を実現するための革新的なソリューションの必要性を強調した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:57:16 GMT)
Kiss up, Kick down: Exploring Behavioral Changes in Multi-modal Large Language Models with Assigned Visual Personas [15.2] 本研究は,マルチモーダル大言語モデル(LLM)が視覚的ペルソナと振舞いを調整できるかどうかを初めて検討するものである。
LLMの視覚的パーソナとして、5Kの架空のアバター画像の新たなデータセットを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:38:38 GMT)
Federated Ensemble-Directed Offline Reinforcement Learning [14.9] We developed the Federated Ensemble-Directed Offline Reinforcement Learning Algorithm (FEDORA)
FEDORAは、組み合わせたデータプールよりもオフラインRLなど、他のアプローチよりも大幅に優れています。
実世界におけるFEDORAの性能をモバイルロボットで実証する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:15:46 GMT)
Test-time Adaptation for Regression by Subspace Alignment [14.7] 本稿では、ソース領域で事前訓練された回帰モデルを、ラベルなしのターゲットデータを含む未知のターゲット分布に適応させる、回帰のためのテスト時間適応(TTA)について検討する。
回帰のためにTTAを有効にするために、ソースとターゲットドメイン間の特徴分布を整列する特徴アライメントアプローチを採用する。
回帰のためのTTAにおける効果的な特徴アライメントのために、我々は有意部分空間アライメント(SSA)を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:31:10 GMT)
Clustering Alzheimer's Disease Subtypes via Similarity Learning and Graph Diffusion [14.5] アルツハイマー病(英語: Alzheimer's disease、AD)は、世界中の何百万人もの人に影響を及ぼす複雑な神経変性疾患である。
本研究の目的は,臨床像や病態を特徴とするADのサブタイプを同定することである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:38:14 GMT)
Deliberate Reasoning for LLMs as Structure-aware Planning with Accurate World Model [14.5] 大規模言語モデル(LLM)のためのSWAP(Structure-Aware Planning)を提案する。
SWAPは、世界モデルによる推論プロセスのガイドとして構造情報を導入し、ステップ上のソフト検証メカニズムを提供する。
SWAPは,数理推論,論理推論,コーディングタスクなど,多種多様な推論集約型ベンチマークで評価される。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:23:36 GMT)
On the Hardness of Learning One Hidden Layer Neural Networks [14.3] 我々は、$mathbbRd$からの入力でReLUニューラルネットワークの隠れ層を学習する問題を考察する。
この学習問題は、ニューラルネットワークのサイズが$d$である場合でも、標準的な暗号的仮定の下では困難であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:48:13 GMT)
Towards Cost Sensitive Decision Making [14.3] 本研究では,環境から機能を積極的に獲得し,意思決定の質と確実性を向上するRLモデルを考察する。
本稿では,Active-Acquisition POMDPを提案する。
積極的に獲得された部分観測環境においてエージェントを支援するとともに,探索・探索ジレンマを軽減するため,モデルベースアプローチを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:48:23 GMT)
Distribution Guided Active Feature Acquisition [14.3] 本研究では,環境と対話して新たな情報を得るための能動的特徴獲得フレームワークを開発する。
データに存在する情報と条件依存を理解するバックボーン上に、AFAフレームワークを構築します。
生成モデルから得られた副作用および補助報酬を用いて,AFAに対するRLエージェントのトレーニングを指導することが可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:38:30 GMT)
Data-centric Prediction Explanation via Kernelized Stein Discrepancy [14.2] 本稿では,KSDの特性を利用した高精度・データ中心記述(HD-Explain)予測法を提案する。
具体的には、KSDはモデル依存データ相関を符号化する訓練モデルのパラメータ化カーネル関数を独自に定義する。
本稿では,HD-Explainが高精度(きめ細かな説明),一貫性,計算効率など,様々な面から既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:22:06 GMT)
Insights into LLM Long-Context Failures: When Transformers Know but Don't Tell [14.1] 大規模言語モデル(LLM)は位置バイアスを示し、長い文脈の中端からの情報を活用するのに苦労する。
LLMはターゲット情報の位置を符号化するが、正確な応答を生成するのに失敗することが多い。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:14:09 GMT)
Radio-opaque artefacts in digital mammography: automatic detection and analysis of downstream effects [14.1] 22,012個のマンモグラムを手動でアノテートした後,5種類のアーチファクトを識別するために,頑健なマルチラベルアーチファクト検出器を開発した。
実験の結果,これらの人工物はモデル性能,分類しきい値の変更,出力分布の歪みなどに大きな影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:16:35 GMT)
A LLM-Based Ranking Method for the Evaluation of Automatic Counter-Narrative Generation [14.1] 本稿では,Large Language Model (LLM) を用いた対数ナラティブ(CN)生成の評価手法を提案する。
従来の自動指標は, 人間の判断と相関が低く, 生成したCNと人間の知覚との微妙な関係を捉えることができないことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:15:14 GMT)
Post-Hoc Reversal: Are We Selecting Models Prematurely? [13.9] ポストホック変換を適用した後に性能傾向が逆転するポストホック逆転現象を示す。
予備的な分析は、これらの変換が、誤ラベルされた例の影響を抑えることによって、逆転を引き起こすことを示唆している。
ポストホック選択(post-hoc selection)は、ポストホックメトリクスがモデル開発決定を通知するシンプルな手法である。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 00:11:05 GMT)
Language Model Empowered Spatio-Temporal Forecasting via Physics-Aware Reprogramming [13.7] 本研究では,事前学習言語モデル(PLM)の推論と一般化能力を利用して,複雑な時間的予測を行うことを目的とする。
本稿では,時間予測に適した物理対応 PLM 再プログラミングフレームワーク RePST を提案する。
提案したRePSTは,特にデータスカースシナリオにおいて,12の最先端のベースライン手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:08:17 GMT)
WcDT: World-centric Diffusion Transformer for Traffic Scene Generation [13.6] 本稿では,拡散確率モデルと変圧器の相補的強度を利用して,自律走行軌道生成のための新しい手法を提案する。
提案するフレームワークは,WcDT(World-Centric Diffusion Transformer)と呼ばれ,軌道生成過程全体を最適化する。
提案手法は,現実的かつ多様な軌道を生成する上で,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:10:29 GMT)
Episodic fine-tuning prototypical networks for optimization-based few-shot learning: Application to audio classification [13.5] Prototypeal Network(ProtoNet)は、Few-shot Learningのシナリオで一般的な選択肢として登場した。
C-way-K-shotテストエピソードのテストエピソードの(ラベル付き)サポートセット上でProtoNetを微調整する手法を提案する。
提案したモデルであるMAML-ProtoとMC-Protoは,我々のユニークな微調整手法と組み合わせて,数ショットの音声分類タスクにおいて,通常のProtoNetよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:39:29 GMT)
Prefixing Attention Sinks can Mitigate Activation Outliers for Large Language Model Quantization [13.5] 我々は,問題となるトークンの発生を防止し,アクティベーション単位の量子化を容易にするための簡易かつ効果的な戦略を開発する。
トークンキャッシュを調整して、その後のトークンのアクティベーションを規則化し、より量子化しやすいものにします。
我々は,この手法を広範囲のモデルとベンチマークで徹底的に評価し,拡張子ごとのW8A8量子化の確立されたベースラインをはるかに上回っていることを確認した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:26:20 GMT)
GraphRouter: A Graph-based Router for LLM Selections [13.5] Graphは、大規模言語モデルの文脈的および適応的な選択のためのグラフベースのアプローチである。
Graphは既存のルータを大幅に上回り、12.3%の最小パフォーマンス向上を実現している。
この研究は、LLMの文脈的および適応的な選択のためのグラフベースのアプローチを実現し、現実世界のアプリケーションに対する洞察を提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:02:48 GMT)
Latent Abstractions in Generative Diffusion Models [13.3] 拡散に基づく生成モデルが画像などの高次元データをどのように生成するかを,低次元の潜在抽象集合の表現に暗黙的に依存して検討する。
我々は,NLFを拡張した理論的枠組みを提案し,SDEに基づく生成モデルについて一意に考察する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:34:24 GMT)
Bag of Tricks: Benchmarking of Jailbreak Attacks on LLMs [13.3] 大規模言語モデル(LLM)は、ゼロショット方式で複雑なタスクを実行する上で重要な機能を示している。
LLMはジェイルブレイク攻撃の影響を受けやすく、有害な出力を生成するために操作することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:14:30 GMT)
Universal Functional Regression with Neural Operator Flows [13.3] 普遍汎関数回帰の概念を導入し、非ガウス函数空間上の事前分布を学習することを目指す。
我々は正規化フローの無限次元拡張であるニューラル演算子フロー(OpFlow)を開発した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:13:39 GMT)
SpecSAR-Former: A Lightweight Transformer-based Network for Global LULC Mapping Using Integrated Sentinel-1 and Sentinel-2 [13.2] 我々はDynamic World+データセットを導入し、現在の信頼できるマルチスペクトルデータセットDynamic Worldを拡張した。
マルチスペクトルとSARデータの組み合わせを容易にするために,SpecSAR-Formerと呼ばれる軽量トランスフォーマアーキテクチャを提案する。
我々のネットワークは、既存のトランスフォーマーとCNNベースのモデルより優れており、平均的なユニオンのインターセクション(mIoU)は59.58%、総合的精度(OA)は79.48%、F1スコアは71.68%、パラメータは26.70万である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:53:25 GMT)
Auto-GDA: Automatic Domain Adaptation for Efficient Grounding Verification in Retrieval Augmented Generation [13.1] 検索拡張生成(RAG)は,大規模言語モデル(LLM)出力の現実性を高めることが示されている。
RAG入力は、NLIモデルのトレーニングに使用されるほとんどのデータセットよりも複雑である。
教師なしドメイン適応を実現するために自動生成ドメイン適応(Auto-GDA)を導入する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:21:27 GMT)
What Are Good Positional Encodings for Directed Graphs? [13.1] 我々は、有向グラフに対するウォークカウントシーケンスの一般化であるウォークプロファイルの概念を導入する。
磁気ラプラシアン固有ベクトル系PEを拡張した新しいマルチq磁気ラプラシアンPEを提案する。
提案するPEの表現性を検証し,ネットワークのソート性向上に有効であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:32:25 GMT)
Evaluation of Security of ML-based Watermarking: Copy and Removal Attacks [12.9] デジタル透かしはこれらの課題に対処するための重要なアプローチである。
本稿では,逆埋め込み技術を用いた基礎モデルの潜時空間デジタル透かしシステムのセキュリティ評価を行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:03:51 GMT)
Evaluation of Security of ML-based Watermarking: Copy and Removal Attacks [12.9] デジタル透かしはこれらの課題に対処するための重要なアプローチである。
本稿では,逆埋め込み技術を用いた基礎モデルの潜時空間デジタル透かしシステムのセキュリティ評価を行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:03:51 GMT)
Flow of Reasoning:Training LLMs for Divergent Problem Solving with Minimal Examples [12.5] 推論のフローは、最小限のデータで推論の品質と多様性を改善することを目的としています。
FoR は DAG 構造推論グラフ上のマルコフフローとして多段階 LLM 推論を定式化する。
実験によると、限られたトレーニング例で、FoRは多様な創造的で高品質なソリューションの発見を可能にする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:14:55 GMT)
Branches: A Fast Dynamic Programming and Branch & Bound Algorithm for Optimal Decision Trees [12.4] 決定木(DT)学習は、解釈可能な機械学習の基本的な問題である。
両アプローチの長所を組み合わせた新しいアルゴリズムであるブランチを導入する。
DPとB&Bは効率的な刈り出しのための新しい解析的境界を持つため、ブランチは速度とスパーシティの最適化の両方を提供する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:44:53 GMT)
Real-World Benchmarks Make Membership Inference Attacks Fail on Diffusion Models [12.4] 拡散モデルに対するメンバーシップ推論攻撃(MIA)は、不正なデータ使用の潜在的証拠として浮上している。
本研究は,拡散モデルにおける最先端MIAの評価について検討し,重大な欠陥と過度に楽観的な性能評価を明らかにした。
CopyMarkはより現実的なMIAベンチマークで、事前訓練された拡散モデル、偏りのないデータセット、公正な評価パイプラインのサポートを通じて自分自身を区別する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:46:06 GMT)
Img2CAD: Conditioned 3D CAD Model Generation from Single Image with Structured Visual Geometry [12.3] 編集可能なパラメータを生成するために2次元画像入力を用いた最初の知識であるImg2CADを提案する。
Img2CADはAI 3D再構成とCAD表現のシームレスな統合を可能にする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:27:52 GMT)
Tokenization Falling Short: On Subword Robustness in Large Language Models [12.2] 本研究では,これらの課題とその言語モデルへの影響を体系的に検討する。
その結果,スケーリングモデルパラメータはトークン化の問題を軽減することができることがわかった。
実験の結果,BPEドロップアウトなどのサブワード正規化がこの問題を緩和できることがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:06:24 GMT)
Enhancing Autonomous Navigation by Imaging Hidden Objects using Single-Photon LiDAR [12.2] 単一光子LiDARを用いたNon-Line-of-Sight(NLOS)センシングによる視認性の向上と自律ナビゲーションの向上を目的とした新しいアプローチを提案する。
本手法は,マルチバウンス光情報を利用することで,移動ロボットを「隅々まで見る」ことを可能にする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:03:13 GMT)
FedMAC: Tackling Partial-Modality Missing in Federated Learning with Cross-Modal Aggregation and Contrastive Regularization [12.0] Federated Learning(FL)は、分散データソースを使用して機械学習モデルをトレーニングする手法である。
本研究ではFedMACという新しいフレームワークを提案し,FLに欠落した部分モダリティ条件下でのマルチモダリティの解消を図った。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:24:02 GMT)
How Toxicity Classifiers and Large Language Models Respond to Ableism [11.9] 障害のある人(PwD)は、定期的にネット上の憎悪やマイクロアグレッションに遭遇する。
我々はPwDをターゲットにした100のソーシャルメディアコメントのデータセットをキュレートした。
我々は160人の参加者を募集し、これらのコメントがいかに有毒で有能かを説明しました。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:09:12 GMT)
MetaOOD: Automatic Selection of OOD Detection Models [11.8] 我々はメタラーニングを利用してOOD検出モデルを自動的に選択する最初のゼロショット・アン教師なしフレームワークであるMetaOODを紹介した。
メタ学習のアプローチとして、MetaOODは、さまざまなベンチマークOODデータセットにまたがって、既存のメソッドの過去のパフォーマンスデータを活用する。
私たちはMetaOODが既存のメソッドを著しく上回り、限界時間のオーバーヘッドしか生じないことを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:36:19 GMT)
Deciphering the Factors Influencing the Efficacy of Chain-of-Thought: Probability, Memorization, and Noisy Reasoning [11.8] Chain-of-Thought(CoT)プロンプトは、Large Language Models(LLM)の多段階推論能力を高めることが示されている。
CoTのプロンプト性能は,真の推論の暗黙化と確率バージョンの両方を反映していることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:01:39 GMT)
How Discrete and Continuous Diffusion Meet: Comprehensive Analysis of Discrete Diffusion Models via a Stochastic Integral Framework [11.7] L'evy型積分に基づく離散拡散モデルの誤差解析のための包括的フレームワークを提案する。
我々のフレームワークは、離散拡散モデルにおける現在の理論結果を統一し、強化する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:59:29 GMT)
Matrix product state fixed points of non-Hermitian transfer matrices [11.7] テンソルネットワークの仮想指標におけるゲージ自由度の影響について検討する。
ゲージ変換が伝達行列の固有状態の絡み合い構造に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:30:58 GMT)
Seeing the Forest through the Trees: Data Leakage from Partial Transformer Gradients [11.7] 1つのTransformer層からの勾配、あるいは0.54%のパラメータを持つ1つの線形コンポーネントでさえ、データの漏洩のトレーニングに影響を受けやすい。
トレーニング中の勾配に対する差分プライバシーの適用は、データ開示の新たな脆弱性に対する限定的な保護を提供する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:00:46 GMT)
Latte: Latent Attention for Linear Time Transformers [11.5] 注意を喚起するための確率的枠組みを提案する。
本手法は,標準アテンション機構のドロップイン置換としてシームレスに統合できる。
結果として生じるLatte Transformer'は、標準的な注目やその他の最先端モデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:19:27 GMT)
What Can We Learn from State Space Models for Machine Learning on Graphs? [11.4] グラフ構造化データに対する状態空間モデル(SSM)の原則拡張として,グラフ状態空間畳み込み(GSSC)を提案する。
グローバルな置換同変集合アグリゲーションと分解可能なグラフカーネルを活用することにより、GSSCはSSMの3つの利点を全て保持する。
グラフ機械学習のパワフルでスケーラブルなモデルとしてのGSSCの可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:46:03 GMT)
Airport Delay Prediction with Temporal Fusion Transformers [11.3] 本研究は,米国最上位30空港において,新しい時空核融合変圧器モデルを適用し,第4四半期の空港到着遅延を予測することを提案する。
我々のモデルには、空港の需要と容量予測、歴史的な空港の運転効率情報、空港の風と可視性、さらには気象や交通条件などが含まれる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:57:28 GMT)
Improving Quotation Attribution with Fictional Character Embeddings [11.3] 本稿では,文字のグローバルなスタイリスティックな情報をエンコードする文字埋め込みにより,人気のある引用帰属システムであるBookNLPを提案する。
提案するグローバル文字埋め込みとBookNLPの文脈情報を組み合わせることで,アナフォリックおよび暗黙的引用のための話者識別が向上することを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 10:39:17 GMT)
Are Large Vision Language Models up to the Challenge of Chart Comprehension and Reasoning? An Extensive Investigation into the Capabilities and Limitations of LVLMs [11.2] 自然言語は、バーやラインチャートのようなデータ視覚化のためのコミュニケーションの強力な補完的モダリティである。
近年,チャート質問応答,チャート要約,ファクトチェックなど,さまざまなダウンストリームタスクが導入されている。
これらのタスクはユニークな課題であり、視覚言語推論とグラフデータテーブル、ビジュアルエンコーディング、自然言語プロンプトの微妙な理解の両方を要求する。
本稿では,最近開発された大規模視覚言語モデル(LVLM)の総合的な評価を,チャート理解と推論のタスクに対して行った。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:03:16 GMT)
RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud [11.1] この研究は、最近の3次元トラッキング・バイ・検出手法の限界に対処する。
そこで本稿では,正解トラックとゴーストトラックを時間的に区別する新しいオンライントラック妥当性メカニズムを提案する。
我々はまた、軌道ドリフトにおけるノイズ緩和を強化するカルマンフィルタの改良を導入し、閉塞物体のより堅牢な状態推定を可能にした。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:38:06 GMT)
Model-Based Reward Shaping for Adversarial Inverse Reinforcement Learning in Stochastic Environments [11.1] 理論的結果が得られず,性能が劣化した環境下でのAIRL(Adrial Inverse Reinforcement Learning)手法の限界に対処する。
そこで本研究では,環境における最適政策の理論的保証とともに,力学情報を報酬形成に注入する手法を提案する。
本稿では,モデル拡張型AIRLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:27:37 GMT)
MARE: Multi-Aspect Rationale Extractor on Unsupervised Rationale Extraction [11.0] 教師なしの合理性抽出は、明示的な合理性アノテーションなしでモデル予測をサポートするためにテキストスニペットを抽出することを目的としている。
従来の作業は各側面を独立してエンコードすることが多く、アスペクト間の有意義な内部相関を捉える能力を制限する可能性がある。
本稿では,複数の側面を同時に説明・予測するためのマルチアスペクト・ライタリー・エクストラクタ(MARE)を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:52:29 GMT)
Beyond Film Subtitles: Is YouTube the Best Approximation of Spoken Vocabulary? [10.9] 我々は、慎重に処理されたYouTube字幕から抽出された周波数が、現在利用可能な最も優れたリソースに匹敵する近似を提供することを示した。
我々は,中国語,英語,インドネシア語,日本語,スペイン語の5つの多言語に対して,YouTube字幕を用いて周波数ノルムを構築し,語彙決定時間,単語親和性,語彙複雑性との相関性を評価する。
2つの心理言語学変数と強く相関するのに加えて、新しい周波数に対する単純な線形回帰は、英語と日本語の語彙的複雑性予測タスクにおいて、新しい高いスコアを達成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:04:20 GMT)
A Training-Free Conditional Diffusion Model for Learning Stochastic Dynamical Systems [10.8] 本研究では,未知の微分方程式(SDE)をデータを用いて学習するための学習自由条件拡散モデルを提案する。
提案手法はSDEのモデリングにおける計算効率と精度の重要な課題に対処する。
学習されたモデルは、未知のシステムの短期的および長期的両方の挙動を予測する上で、大幅な改善を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:07:36 GMT)
Large Language Model Performance Benchmarking on Mobile Platforms: A Thorough Evaluation [10.8] 大規模言語モデル(LLM)は、私たちの仕事や日常生活のあらゆる側面にますます統合されています。
ユーザのプライバシに関する懸念が高まり、これらのモデルがローカルに展開される傾向が強まっている。
急速に普及しているアプリケーションとして、市販のモバイルデバイスのパフォーマンスを懸念しています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:14:59 GMT)
Improving Node Representation by Boosting Target-Aware Contrastive Loss [10.7] 本稿では,ターゲット認識型コントラスト学習(Target-Aware Contrastive Learning,Target-Aware CL)を紹介する。
XTCLを最小化することにより、ターゲット認識CLは、ターゲットタスクとノード表現の間の相互情報を増加させる。
実験により、XTCLは2つのタスクの性能を著しく改善することを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:08:24 GMT)
Selective Aggregation for Low-Rank Adaptation in Federated Learning [10.7] FedSA-LoRA(Federated Share-A Low-Rank Adaptation)では,2つの低ランクトレーニング可能な行列をA$とB$で使用して,重み更新をモデル化する。
FedSA-rsLoRA 法をこれらの LoRA 変種に拡張し,その結果 FedSA-rsLoRA 法と FedSA-VeRA 法が得られた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:38:49 GMT)
Selective Aggregation for Low-Rank Adaptation in Federated Learning [10.7] FedSA-LoRA(Federated Share-A Low-Rank Adaptation)では,2つの低ランクトレーニング可能な行列をA$とB$で使用して,重み更新をモデル化する。
FedSA-rsLoRA 法をこれらの LoRA 変種に拡張し,その結果 FedSA-rsLoRA 法と FedSA-VeRA 法が得られた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:38:49 GMT)
CoCoLoFa: A Dataset of News Comments with Common Logical Fallacies Written by LLM-Assisted Crowds [10.7] 本稿では,648のニュース記事に対する7,706のコメントを含む,既知の最大の論理誤りデータセットであるCoCoLoFaを紹介する。
私たちは143人の群衆労働者を雇い、特定の誤字を具現化したコメントを書きました。
専門家は、CoCoLoFaの書き込み品質とラベル付けの有効性を高い信頼性と評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:15:56 GMT)
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy [10.5] Pairwise Accuracy(PA)に基づく新しいメタメトリックを提案する。
評価に用いるシステム/セグメント数の変化に対して,SPAはPAよりも安定であることを示す。
SPAは2024 WMT Metrics Shared Taskの公式なシステムレベルメトリクスに選ばれた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:57:08 GMT)
EB-NeRD: A Large-Scale Dataset for News Recommendation [10.5] 我々はEkstra Bladet News Recommendation dataset (EB-NeRD)を紹介する。
このデータセットには、100万人以上のユーザと、Ekstra Bladetの3700万以上のインプレッションログが含まれている。
EB-NeRDはRecSys '24 Challengeのベンチマークデータセットとして機能した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:43:29 GMT)
Recurrent Interpolants for Probabilistic Time Series Prediction [10.4] リカレントニューラルネットワークやトランスフォーマーのような逐次モデルは、確率的時系列予測の標準となっている。
近年の研究では、拡散モデルやフローベースモデルを用いて、時系列計算や予測に拡張した生成的アプローチについて検討している。
本研究は、補間剤と制御機能付き条件生成に基づく、リカレントニューラルネットワークの効率と拡散モデルの確率的モデリングを組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:18:49 GMT)
KARL: Knowledge-Aware Retrieval and Representations aid Retention and Learning in Students [10.4] フラッシュカードスケジューラは,(1)学生が知っているフラッシュカードを予測するための学生モデル,(2)これらの予測を通じて次に示すカードを選択するための教育方針に依存する。
フラッシュカードコンテンツを利用した最初のスケジューラであるコンテンツ認識スケジューリングを提案する。
我々は,DKT(Deep Knowledge Trace),検索,BERTを用いて,学生のリコールを予測する,シンプルだが効果的なコンテンツ認識学習モデルであるKARLを構築した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:08:14 GMT)
Minimax Adaptive Boosting for Online Nonparametric Regression [10.1] 本稿では,非パラメトリック回帰に対するパラメータフリーオンライン勾配向上アルゴリズムを提案する。
連鎖木への応用は、リプシッツ関数と競合する際の極小極小後悔を達成できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:30:03 GMT)
C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training [10.1] 本稿では,コントラッシブマスクを用いた自動エンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習するフレームワークであるC-MELTを提案する。
C-MELTは、生成性の強さと識別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:05:18 GMT)
C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training [10.1] 本稿では,コントラッシブマスクを用いた自動エンコーダアーキテクチャを用いて,ECGとテキストデータを事前学習するフレームワークであるC-MELTを提案する。
C-MELTは、生成性の強さと識別能力の強化を一意に組み合わせて、堅牢なクロスモーダル表現を実現する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:05:18 GMT)
Amodal Instance Segmentation with Diffusion Shape Prior Estimation [10.1] アモーダルインスタンス(AIS)は、画像内のオブジェクトの可視部分と隠蔽部分の両方のセグメンテーション予測を含む興味深い課題を提示する。
従来は、アモーダルセグメンテーションを強化するために、トレーニングデータから収集した形状の事前情報に頼っていた。
最近の進歩は、潜在空間から画像を生成するために、広範囲なデータセットで事前訓練された条件付き拡散モデルの可能性を強調している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:00:32 GMT)
Amodal Instance Segmentation with Diffusion Shape Prior Estimation [10.1] アモーダルインスタンス(AIS)は、画像内のオブジェクトの可視部分と隠蔽部分の両方のセグメンテーション予測を含む興味深い課題を提示する。
従来は、アモーダルセグメンテーションを強化するために、トレーニングデータから収集した形状の事前情報に頼っていた。
最近の進歩は、潜在空間から画像を生成するために、広範囲なデータセットで事前訓練された条件付き拡散モデルの可能性を強調している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:00:32 GMT)
A Simple Framework for Secure Key Leasing [10.0] 鍵取り消し可能な暗号により、暗号鍵を量子状態としてリースし、鍵を後で検証可能な方法で取り消すことができる。
本稿では,BB84状態の復号性を利用した暗号プリミティブをセキュアな鍵リースで構築するための簡単なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:24:03 GMT)
Zero-Shot Fact Verification via Natural Logic and Large Language Models [9.8] 命令調整型大規模言語モデルの一般化機能を利用したゼロショット手法を提案する。
提案手法は,最高性能のベースラインに対して平均8.96点の精度向上を実現する。
自然論理データに基づいて訓練された現在のシステムは、他の領域にうまく一般化しない。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:57:32 GMT)
Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs [9.8] ファクトチェックシステムの性能評価には,Averitecデータセットを使用します。
精度予測に加えて,本システムでは,データセットから抽出した証拠を裏付ける。
本システムでは,ベースラインに対する22%の絶対改善である0.33の「平均」スコアを達成している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:31:41 GMT)
Still Not Quite There! Evaluating Large Language Models for Comorbid Mental Health Diagnosis [9.7] 我々は、ソーシャルメディア投稿からの抑うつ不安のコorbidity分類のための、新しいファースト・オブ・イットのベンチマークであるAN GSTを紹介する。
我々は、メンタル-BERT から GPT-4 まで、様々な最先端言語モデルを用いてAN GSTをベンチマークする。
GPT-4は一般に他のモデルより優れているが、F1スコアが72%を超えるようなマルチクラスのコンコービッド分類は達成していない。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:24:11 GMT)
Teaching Transformers Modular Arithmetic at Scale [9.7] この作業では、モジュール追加モデルトレーニングパイプラインに3つの変更を提案する。
N = 256, q = 3329$, 暗号アプリケーションには興味深いケースがある。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:19:33 GMT)
How Much Can RAG Help the Reasoning of LLM? [9.6] Retrieval-Augmented Generation (RAG)は、現代のLarge Language Models (LLMs)で大きな人気を集めている。
RAGは推論プロセスにどのように役立つのか、RAGは推論能力を改善するのにどのように役立つのか、まだ疑問が残る。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:59:04 GMT)
How Much Can RAG Help the Reasoning of LLM? [9.6] Retrieval-Augmented Generation (RAG)は、現代のLarge Language Models (LLMs)で大きな人気を集めている。
RAGは推論プロセスにどのように役立つのか、RAGは推論能力を改善するのにどのように役立つのか、まだ疑問が残る。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:59:04 GMT)
Towards Interpretable Sequence Continuation: Analyzing Shared Circuits in Large Language Models [9.6] 本研究の目的は、トランスフォーマーモデルをアルゴリズム機能を実装する人間可読表現にリバースエンジニアリングすることである。
GPT-2 SmallとLlama-2-7Bの両方のキーサブ回路を回路解釈可能性解析により同定する。
このサブ回路は、インターバル回路、スペイン語の数字と月数継続、自然言語の単語問題など、様々な数学的なプロンプトに影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:34:02 GMT)
Re-examining Sexism and Misogyny Classification with Annotator Attitudes [9.5] Gender-Based Violence(GBV)はオンライン上の問題だが、既存のデータセットでは複数の可能なアノテータの視点をキャプチャできない。
我々はGBVのモデレーションパイプラインにおいて,(1)手動データラベリング,(2)自動分類の2つの重要な段階を再考する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:57:58 GMT)
RFBoost: Understanding and Boosting Deep WiFi Sensing via Physical Data Augmentation [9.5] ディープワイヤレスセンシング(DWS)は大規模なデータセットに大きく依存している。
数ショット/クロスドメイン学習の進歩にもかかわらず、DWSはまだデータ不足の問題に直面している。
本稿では,新しい物理データ拡張技術を含むフレームワークRFBoostを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:15:26 GMT)
NLIP_Lab-IITH Low-Resource MT System for WMT24 Indic MT Shared Task [9.5] 本稿では,WMT 24の低リソースインデックス言語翻訳タスクについて述べる。
我々の一次システムは、事前訓練されたモデルに基づく言語固有の微調整に基づいている。
我々は、eng$rightarrow$as, eng$rightarrow$kha, eng$rightarrow$lus, eng$rightarrow$mniの公式公試セットにおいて、50.6, 42.3, 54.9, 66.3のchrF2スコアを得る。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:02:43 GMT)
Precision, Stability, and Generalization: A Comprehensive Assessment of RNNs learnability capability for Classifying Counter and Dyck Languages [9.4] 本研究では,構造化形式言語におけるリカレントニューラルネットワーク(RNN)の学習可能性について検討する。
伝統的に、1次(LSTM)と2次(O2RNN)のRNNは、これらのタスクに有効であると考えられてきた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:22:49 GMT)
Combing Text-based and Drag-based Editing for Precise and Flexible Image Editing [9.4] テキストとドラッグ信号を組み合わせた新しい画像編集手法である textbfCLIPDrag を提案する。
CLIPDragは、既存の単一のドラッグベースのメソッドやテキストベースのメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:46:09 GMT)
An Insight into Security Code Review with LLMs: Capabilities, Obstacles and Influential Factors [9.3] セキュリティコードレビューは時間と労力を要するプロセスです。
既存のセキュリティ分析ツールは、一般化の貧弱、偽陽性率の高い、粗い検出粒度に悩まされている。
大きな言語モデル(LLM)は、これらの課題に対処するための有望な候補と考えられている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:02:55 GMT)
Continuity bounds for quantum entropies arising from a fundamental entropic inequality [9.2] 2つの量子状態の間のフォン・ノイマンエントロピーの差について、厳密な上限を確立する。
これは、よく知られた Audenaert-Fannes の不等式を意味する新しいエントロピー不等式をもたらす。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:03:07 GMT)
M2Distill: Multi-Modal Distillation for Lifelong Imitation Learning [9.2] M2Distillは、生涯の模倣学習のためのマルチモーダル蒸留に基づく方法である。
我々は、前段階から現在の段階まで、様々なモダリティにわたる潜在表現のシフトを規制する。
学習したポリシーが、新しいスキルをシームレスに統合しながら、以前に学習したタスクを実行する能力を維持していることを保証します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:53:00 GMT)
M2Distill: Multi-Modal Distillation for Lifelong Imitation Learning [9.2] M2Distillは、生涯の模倣学習のためのマルチモーダル蒸留に基づく方法である。
我々は、前段階から現在の段階まで、様々なモダリティにわたる潜在表現のシフトを規制する。
学習したポリシーが、新しいスキルをシームレスに統合しながら、以前に学習したタスクを実行する能力を維持していることを保証します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:53:00 GMT)
DiffIR2VR-Zero: Zero-Shot Video Restoration with Diffusion-based Image Restoration Models [9.1] 本稿では,事前学習画像復元拡散モデルを用いたゼロショット映像復元手法を提案する。
本手法は,ゼロショット映像復元において最高の性能を発揮することを示す。
本手法は任意の2次元復元拡散モデルで動作し,広範に再トレーニングを行うことなく,映像強調作業のための汎用的で強力なツールを提供する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:37:13 GMT)
Autoregressive Moving-average Attention Mechanism for Time Series Forecasting [9.1] 本稿では,各種の線形アテンション機構に適応可能な自己回帰(AR)移動平均アテンション構造を提案する。
本稿では、まず、時系列予測(TSF)タスクに対して、これまで見過ごされていたデコーダのみの自己回帰変換モデルが、最良のベースラインに匹敵する結果が得られることを実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:45:50 GMT)
Camel: Communication-Efficient and Maliciously Secure Federated Learning in the Shuffle Model of Differential Privacy [9.1] フェデレートラーニング(FL)は、複数のクライアントが集約のための勾配更新のみを共有することで、モデルを共同でトレーニングすることを可能にする、急速に魅力的なパラダイムになっています。
プライバシーに敏感なグラデーションアップデートを保護するため、ローカルな差分プライバシーメカニズムの研究が続けられている。
我々は,DP のシャッフルモデルにおいて,コミュニケーション効率が高く,かつ悪意のある FL フレームワークである Camel を提示する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:13:44 GMT)
Can Mamba Always Enjoy the "Free Lunch"? [9.0] トランスフォーマーは、現在のLarge Language Models (LLM) の基盤となっている。
マンバは推論中の一定レベルのサイズのために徐々に注目を集めている。
この結果から,任意のDP問題を解くために,Mambaの総コストは標準かつ効率的な変換器に匹敵することがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:31:24 GMT)
Large Language Models are In-context Teachers for Knowledge Reasoning [8.9] 本研究では,教師が無意味な事例の推論を学生に教えるため,インコンテクスト教育(ICT)について検討する。
我々は,大規模言語モデル (LLM) が,人間と比較して,自己や他のLLMに対して,より効果的なテキスト内教師として機能するかどうかを問う。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:00:24 GMT)
Verbalized Graph Representation Learning: A Fully Interpretable Graph Model Based on Large Language Models Throughout the Entire Process [8.8] 完全に解釈可能な言語グラフ表現学習法(VGRL)を提案する。
従来のグラフ機械学習モデルとは対照的に、VGRLはこのパラメータ空間をテキスト記述に制約する。
VGRLの有効性を実証的に評価するために,いくつかの研究を行った。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:56:56 GMT)
Verbalized Graph Representation Learning: A Fully Interpretable Graph Model Based on Large Language Models Throughout the Entire Process [8.8] 完全に解釈可能な言語グラフ表現学習法(VGRL)を提案する。
従来のグラフ機械学習モデルとは対照的に、VGRLはこのパラメータ空間をテキスト記述に制約する。
VGRLの有効性を実証的に評価するために,いくつかの研究を行った。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:56:56 GMT)
MMLU-SR: A Benchmark for Stress-Testing Reasoning Capability of Large Language Models [8.8] 大規模言語モデル(LLM)の真の理解能力を測定するための新しいデータセットMMLU-SRを提案する。
我々は、キーワードをダミー語に置き換え、その定義に従って標準化されたテスト質問を修正した。
このような置換後のモデル性能は大幅に低下し,理解力の低下が示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:29:29 GMT)
Cyber Food Swamps: Investigating the Impacts of Online-to-Offline Food Delivery Platforms on Healthy Food Choices [8.7] オンラインフードデリバリープラットフォームがユーザーの健康的な食品選択に与える影響は、まだ不明である。
男性、低所得者、若年者、大都市にいる者は、O2Oプラットフォームを介してファーストフードを注文する傾向にある。
ファーストフードの注文の比率が高いのは「サイバーフード湿地」であり、アクセス可能なファーストフードレストランの比率が高いことが特徴である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:41:17 GMT)
Soda-Eval: Open-Domain Dialogue Evaluation in the age of LLMs [8.7] 本稿では,Sodaをベースとした注釈付きデータセットであるSoda-Evalについて紹介する。
そこで,Soda-Eval をベンチマークとして,オープンアクセス命令チューニング LLM の性能について検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:32:01 GMT)
Soda-Eval: Open-Domain Dialogue Evaluation in the age of LLMs [8.7] 本稿では,Sodaをベースとした注釈付きデータセットであるSoda-Evalについて紹介する。
そこで,Soda-Eval をベンチマークとして,オープンアクセス命令チューニング LLM の性能について検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:32:01 GMT)
Using Prompts to Guide Large Language Models in Imitating a Real Person's Language Style [8.7] 本研究では,同じゼロショットプロンプトの指導の下で,3つの異なる大言語モデルの言語スタイルの模倣能力を比較する。
また、3つの異なるプロンプトによって個別にガイドされる場合、同じ大きな言語モデルの模倣能力を比較する。
Llama 3にTree-of-Thoughts (ToT) Promptingメソッドを適用することで、実際の人の言語スタイルを持つ会話型AIが作られた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:30:34 GMT)
Retrieval-Augmented Hierarchical in-Context Reinforcement Learning and Hindsight Modular Reflections for Task Planning with LLMs [8.6] 本研究では,大規模言語モデルを対象とした検索言語強化学習(RAHL)を提案する。
RAHLはLLMベースの高レベルポリシーを使用して複雑なタスクをサブタスクに分解する。
その結果, RAHLは5エピソードで9%, 42%, 10%のパフォーマンス向上が達成できた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:50:34 GMT)
Diversify, Rationalize, and Combine: Ensembling Multiple QA Strategies for Zero-shot Knowledge-based VQA [8.5] 知識に基づく教育(DietCoke)のための多様性,エビデンス・トランニケーション,組み合わせを提案する。
DietCokeは、補完的な質問回答戦術の束を利用して、文章の合理性を使って回答を集約する。
実験により、DietCokeは最先端のLCMベースのベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:00:13 GMT)
Cometh: A continuous-time discrete-state graph diffusion model [8.4] グラフデータの特異性に合わせて連続時間離散状態グラフ拡散モデルであるCometを提案する。
VUNサンプルの面では、Cometは平面グラフデータセットで99.5%のほぼ完全なパフォーマンスを取得し、大きなGuacaMolデータセットでDiGressを12.6%上回っている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:45:39 GMT)
Consensus Knowledge Graph Learning via Multi-view Sparse Low Rank Block Model [8.4] 本稿では,マルチビュースパース低ランクブロックモデル (msLBM) フレームワークを提案する。
この結果から,マルチソースデータセットを活用することで,コンセンサス知識グラフをより正確に学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:13:24 GMT)
The Vital Role of Gradient Clipping in Byzantine-Resilient Distributed Learning [8.3] ビザンチン耐性の分散機械学習は、不正行為や敵対的労働者の存在下で、堅牢な学習性能を達成することを目指している。
最先端(SOTA)の頑健な分散勾配降下法(DGD)は理論的に最適であることが証明されているが、その実験的な成功は、しばしば前凝集勾配クリッピングに依存している。
本稿では,アダプティブロバストクリッピングARC(Adaptive Robust ClippingARC)と呼ばれる適応型クリッピング戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:58:58 GMT)
Quantum Signal Processing and Quantum Singular Value Transformation on $U(N)$ [8.3] 量子信号処理と量子値変換は、ブロック符号化行列の量子コンピュータへの変換を実装する強力なツールである。
ブロック符号化された入力から同時に多重化を実現するフレームワークを提案する。
また、所望の変換を与える量子回路を構築するアルゴリズムも提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:34:25 GMT)
T-FAKE: Synthesizing Thermal Images for Facial Landmarking [8.2] スパースと密集したランドマークを持つ新しい大規模合成熱データセットであるT-FAKEデータセットを紹介する。
我々のモデルは、スパース70点のランドマークと密度478点のランドマークアノテーションの両方で優れた性能を示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:20:44 GMT)
MetaOptimize: A Framework for Optimizing Step Sizes and Other Meta-parameters [8.1] 本稿ではメタファクタを動的に調整するメタフレームワークについて紹介する。
より具体的には、Metaは任意の一階最適化アルゴリズムをラップし、特定の形態の後悔を最小限に抑えるために、ステップサイズの調整をオンザフライで行うことができる。
また、複数の最適化アルゴリズムへの適応性とともに、手作り学習率の最高のスケジュールに匹敵する性能を示すメタの低複雑性な変種も導入する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:08:12 GMT)
Self-supervised Spatio-Temporal Graph Mask-Passing Attention Network for Perceptual Importance Prediction of Multi-point Tactility [8.1] 我々は,自己教師付き学習と時空間グラフニューラルネットワークに基づいて,触覚の重要度を複数の点で予測するモデルを開発した。
その結果,多点触覚認知のシナリオにおいて,様々な点の知覚的重要性を効果的に予測できることが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:45:50 GMT)
Any-Quantile Probabilistic Forecasting of Short-Term Electricity Demand [8.1] 電力システムは、決定論的に説明できない複数の要因から生じる不確実性の下で運用される。
ディープラーニングの最近の進歩は、ポイント予測の精度を大幅に向上させるのに役立っている。
任意の量子を予測できる分布予測のための新しい一般手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:56:14 GMT)
In-context Learning in Presence of Spurious Correlations [8.1] 本研究では,突発的特徴を含む分類課題に対して,文脈内学習者を訓練する可能性について検討する。
従来の文脈内学習者の訓練手法は、刺激的な特徴に影響を受けやすいことが判明した。
与えられた分類タスクに対して,そのような学習者を訓練するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:26:36 GMT)
Should Cross-Lingual AMR Parsing go Meta? An Empirical Assessment of Meta-Learning and Joint Learning AMR Parsing [8.0] 言語間AMR解析は、トレーニングデータがソース言語でのみ利用できる場合、ターゲット言語でAMRグラフを予測するタスクである。
Langedijkら (2022) からインスピレーションを得て, 言語間AMR解析におけるメタラーニングの利用について検討した。
我々は,これらのモデルを$k$-shotシナリオで評価し,クロアチア語,ファルシ語,韓国語,中国語,フランス語での有効性を評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:24:02 GMT)
LLM-TOPLA: Efficient LLM Ensemble by Maximising Diversity [7.9] アンサンブルの成分LLM間の多様性と性能の相関を捉えるために,焦点の多様性指標を導入する。
我々は,N$ベースLLMのプールからトップkサブアンサンブルを選択するために,多様性に最適化されたアンサンブルプルーニングアルゴリズムを開発した。
我々のプルーニング法では、最高性能のLLMサブアンサンブルが$S$で、しばしば$N$よりもずっと小さいことを推奨している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:31:15 GMT)
Avoiding Catastrophe in Online Learning by Asking for Help [7.9] 本稿では,災害の可能性を最小化するオンライン学習問題を提案する。
時間的地平線が大きくなるにつれて,メンターの双方が0に近づいたことを後悔するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:23:43 GMT)
KidLM: Advancing Language Models for Children -- Early Insights and Future Directions [7.8] 本研究では,子供用,時には子供用のコーパスを収集し,検証する,ユーザ中心のデータ収集パイプラインを提案する。
本研究では,ドメイン固有の児童言語データに基づいてマスキング確率を動的に調整する新たな学習目標であるStratified Maskingを提案する。
実験により,本モデルは下級テキストの理解に優れ,ステレオタイプを避けて安全性を維持し,子どもの独特な嗜好を捉えていることが示された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:35:44 GMT)
Enriching Music Descriptions with a Finetuned-LLM and Metadata for Text-to-Music Retrieval [7.7] Text-to-Music Retrievalは、広範な音楽データベース内のコンテンツ発見において重要な役割を担っている。
本稿では,TTMR++と呼ばれる改良されたテキスト・音楽検索モデルを提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:33:34 GMT)
Electric polarization and discrete shift from boundary and corner charge in crystalline Chern insulators [7.7] システムの任意の部分領域の総電荷に対して、$mathscrS_texto$ および $vecmathscrP_texto$ の一般的な式を提供する。
チャーン絶縁体は、その隙間のないキラルエッジモードに拘わらず、本質的に2次元電気分極の曖昧な定義が最近まで不明である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:00:01 GMT)
Decoding Game: On Minimax Optimality of Heuristic Text Generation Strategies [7.6] 我々は,テキスト生成をストラテジストとネイチャーの2プレイヤーゼロサムゲームとして再定義する,包括的な理論的枠組みであるデコードゲームを提案する。
逆数自然は可能性に対して暗黙の正則化を課し、トラルニケーション正規化法は、この正則化の下での最適戦略の第一次近似である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:18:27 GMT)
Distributional Counterfactual Explanations With Optimal Transport [7.6] 対実的説明 (CE) は、ブラックボックスの意思決定モデルに関する洞察を提供するための事実上の方法である。
本稿では,観測データの分布特性に焦点を移すDCE(distributal counterfactual explanation)を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:23:26 GMT)
The Wallpaper is Ugly: Indoor Localization using Vision and Language [7.6] テキスト記述と環境中の位置の画像との類似点を学習する。
このスコアは、言語クエリに最もよくマッチする場所を特定し、ユーザの位置を推定します。
1つのモデル、微調整のCLIPは、評価において人間より優れていた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:08:01 GMT)
Rapid and Precise Topological Comparison with Merge Tree Neural Networks [7.4] 本稿では,Merge Tree Neural Network (MTNN)について紹介する。
まず,グラフの効率的なエンコーダとして出現したグラフニューラルネットワークをトレーニングして,ベクトル空間にマージツリーを埋め込む方法を示す。
次に、木とノードの埋め込みと新しいトポロジカルアテンション機構を統合することにより、類似性の比較をさらに改善する新しいMTNNモデルを定式化する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:54:25 GMT)
Attribute Diversity Determines the Systematicity Gap in VQA [7.4] 視覚的質問応答における系統的ギャップについて検討する。
トレーニングデータの量を増やすことで、体系的なギャップを減らさないことが分かりました。
特に、我々の実験は、トレーニング中に異なる属性タイプの組み合わせが見られるほど、結果のモデルがより体系的であることを示唆しています。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:38:09 GMT)
MDMP: Multi-modal Diffusion for supervised Motion Predictions with uncertainty [7.4] 本稿では,運動予測のための多モード拡散モデルを提案する。
骨格データと行動のテキスト記述を統合し、定量性のある不確実性を伴う洗練された長期動作予測を生成する。
我々のモデルは、長期動作を正確に予測する上で、既存の生成技術よりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:49:00 GMT)
A generalized cycle benchmarking algorithm for characterizing mid-circuit measurements [7.3] MCM(Mid-circuit Measurement)は、フォールトトレラント量子計算の開発において重要な要素である。
ノイズの多いMCMを特徴付けるサイクルベンチマーク (CB) 型アルゴリズムを開発した。
MCMにおける計測ノイズと状態準備ノイズの独立性をテストするために学習した情報を利用する方法を示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:41:43 GMT)
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion [7.1] 視覚に基づくセマンティックシーンコンプリート(SSC)は、様々な3次元知覚タスクに広く応用されているため、多くの注目を集めている。
既存のスパース・トゥ・デンス・アプローチでは、様々な入力画像間で共有コンテキストに依存しないクエリを使用するのが一般的である。
セマンティックシーン補完を実現するためにCGFormerというニューラルネットワークを導入する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:36:08 GMT)
Make Interval Bound Propagation great again [7.1] 医療データ分析,自律運転,対人訓練など,実生活に動機づけられたさまざまなシナリオにおいて,我々は,堅牢なディープネットワークに関心を持っている。
本稿では,所定の事前学習ネットワークのロバスト性を計算する方法と,ロバストネットワークの構築方法について述べる。
ニューラルネットワークのラップ効果を軽減するために、厳密な計算に特化した2つの古典的なアプローチを適用する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:39:46 GMT)
C3PA: An Open Dataset of Expert-Annotated and Regulation-Aware Privacy Policies to Enable Scalable Regulatory Compliance Audits [7.1] C3PAは、専門家がアノテートしたプライバシポリシの最初の規制対応データセットである。
CCPA固有の開示義務に対する応答に関連する、専門家ラベル付きプライバシポリシテキストセグメントが48K以上含まれている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:04:39 GMT)
ShieldDiff: Suppressing Sexual Content Generation from Diffusion Models through Reinforcement Learning [7.1] テキスト・ツー・イメージ(T2I)モデルは、不快な内容の安全でない画像を生成する可能性がある。
我々の研究では、T2IモデルからNSFW(職場では安全ではない)コンテンツ生成を排除することに重点を置いています。
本稿では,CLIP(Contrastive Language- Image Pre-Trening)とヌード報酬(nudity rewards)から構成される独自の報酬関数を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:37:56 GMT)
MultiVerse: Efficient and Expressive Zero-Shot Multi-Task Text-to-Speech [7.0] MultiVerseは、ゼロショットのマルチタスクTSシステムであり、ゼロショットおよびクロスランガル条件下でTSや音声スタイルの転送を行うことができる。
我々は、フィルタ関連およびソース関連表現をモデル化するためのプロンプトを利用して、ソースフィルタ理論に基づくアンタングルメントを用いる。
我々の新しい韻律モデリング技術は、与えられた韻律と高い韻律的類似性を持つ音声を生成するMultiVerseの能力に大きく貢献する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:10:25 GMT)
Landauer's principle and black hole area quantization [7.0] この記事では、シュワルツシルトブラックホールの領域量子化の文脈における情報理論からランダウアーの原理を評価する。
ランダウアーの原理は、ブラックホールのミクロ状態の数が2n$になるとき、飽和形で一貫して成り立つことを正当化する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:58:58 GMT)
UFLUX v2.0: A Process-Informed Machine Learning Framework for Efficient and Explainable Modelling of Terrestrial Carbon Uptake [7.0] 光合成によって固定された炭素植物の量であるGrossプライマリ生産性は、グローバルな炭素循環と生態系の機能を理解する上で重要な要素である。
生態学的プロセスの知識に基づいて構築されたプロセスベースのモデルは、それらの仮定と近似から生じるバイアスに影響を受けやすい。
本研究では、最先端の生態知識と高度な機械学習技術を統合するプロセスインフォームドモデルであるUFLUX v2.0を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:28:30 GMT)
Verification of Neural Control Barrier Functions with Symbolic Derivative Bounds Propagation [7.0] 本稿では,ReLUに基づくニューラルCBFの有効検証フレームワークを提案する。
シンボル境界は、ニューラルCBFヤコビアンおよび非線形系力学の内積によって伝播可能であることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:42:25 GMT)
Compute Or Load KV Cache? Why Not Both? [7.0] Cakeは、双方向並列化KVキャッシュ生成戦略を採用した、新しいKVキャッシュローダである。
プレフィックスキャッシュ位置から保存されたKVキャッシュを同時に動的にロードし、ローカルGPU上でKVキャッシュを計算する。
最大68.1%のTTFT(Time To First Token)削減を計算専用法と比較し、94.6%のTTFT削減をI/O専用法と比較する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:11:09 GMT)
GraphCroc: Cross-Correlation Autoencoder for Graph Structural Reconstruction [6.8] グラフオートエンコーダ(GAE)はノード埋め込みからグラフ構造を再構築する。
我々はGAE表現能力を著しく向上する相互相関機構を導入する。
また、さまざまな下流タスクに適したフレキシブルエンコーダアーキテクチャをサポートする新しいGAEであるGraphCrocを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:59:45 GMT)
PersoBench: Benchmarking Personalized Response Generation in Large Language Models [6.8] 我々はペルソベンチ(PersoBench)という,ペルソベンチ(PersoBench)という,個人認識対話生成における大規模言語モデル(LLM)のパーソナライズ能力を評価するベンチマークを提案する。
本分析は, 3つの人格認識データセットを用いて, 流布度, 多様性, 一貫性, パーソナライゼーションなど, 応答品質の多次元性を評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:29:41 GMT)
Cross-lingual Transfer for Automatic Question Generation by Learning Interrogative Structures in Target Languages [6.6] 本稿では,モノリンガル,並列,ラベル付きデータを対象言語で必要とせずに動作可能な,単純かつ効率的なXLT-QG法を提案する。
提案手法は,GPT-3.5-turboに匹敵する性能を実現する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:29:35 GMT)
SAG: Style-Aligned Article Generation via Model Collaboration [6.6] 大規模言語モデル(LLM)は、パーソナライズされたスタイリッシュなコンテンツ生成に対する需要を増大させている。
本稿では, LLM と SLM の長所を利用した新しい協調学習フレームワークを提案する。
GPT-4と比較すると,ROUGE-Lでは0.78,BLEU-4では0.55の改善が得られた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:24:42 GMT)
Decoupling Layout from Glyph in Online Chinese Handwriting Generation [6.6] テキスト行レイアウト生成器とスタイル化フォント合成器を開発した。
レイアウトジェネレータは、テキスト内容と提供されたスタイル参照に基づいて、コンテキスト内学習を行い、各グリフに対する位置を自己回帰的に生成する。
文字埋め込み辞書、マルチスケールの書体スタイルエンコーダ、及び1DのU-Netベースの拡散デノイザからなるフォントシンセサイザは、所定のスタイル参照から抽出された書体スタイルを模倣しつつ、その位置に各フォントを生成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:28:20 GMT)
Decoupling Layout from Glyph in Online Chinese Handwriting Generation [6.6] テキスト行レイアウト生成器とスタイル化フォント合成器を開発した。
レイアウトジェネレータは、テキスト内容と提供されたスタイル参照に基づいて、コンテキスト内学習を行い、各グリフに対する位置を自己回帰的に生成する。
文字埋め込み辞書、マルチスケールの書体スタイルエンコーダ、及び1DのU-Netベースの拡散デノイザからなるフォントシンセサイザは、所定のスタイル参照から抽出された書体スタイルを模倣しつつ、その位置に各フォントを生成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:28:20 GMT)
Scattering Spectra Models for Physics [6.5] 本稿では定常場に対する散乱スペクトルモデルを提案する。
我々は、物理学で遭遇する幅広い分野について、正確で堅牢な統計的記述を提供することを示した。
これらのジェネリックモデルは、データ探索、分類、パラメータ推論、対称性検出、コンポーネント分離に使用できる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:46:04 GMT)
An X-Ray Is Worth 15 Features: Sparse Autoencoders for Interpretable Radiology Report Generation [6.5] 既存のビジョンランゲージモデル(VLM)は幻覚に悩まされ、解釈性に欠け、高価な微調整を必要とする。
我々は,SAE-Radを導入し,スパースオートエンコーダ(SAE)を用いて,事前学習された視覚変換器から人間の解釈可能な特徴へ潜在表現を分解する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:40:21 GMT)
Efficient self-consistent learning of gate set Pauli noise [6.3] ゲートセットパウリ雑音学習の課題について検討し、量子ゲートのセット、状態準備、測定はすべて、カスタマイズされたノイズアンサッツを備えた未知のパウリ雑音チャネルに悩まされる。
ゲートノイズに関する学習可能な情報はすべて、ノイズアンザッツに関する軽度な仮定の下で、相対的精度で学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:19:57 GMT)
A Multi-task Learning Framework for Evaluating Machine Translation of Emotion-loaded User-generated Content [6.2] ユーザ生成コンテンツ(UGC)の機械翻訳は、スラング、感情、皮肉や皮肉といった文学的デバイスを扱うなど、ユニークな課題を生んでいる。
感情ラベルと人手による翻訳誤りを含む感情関連データセットを利用する。
文レベル評価スコアと単語レベルラベルで拡張し、文レベルと単語レベルの翻訳評価と感情分類に適したデータセットを作成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:49:57 GMT)
Interactive GDPR-Compliant Privacy Policy Generation for Software Applications [6.2] ソフトウェアアプリケーションを使用するには、ユーザが個人情報を提供するように要求されることがある。
プライバシーが重要な関心事になっているため、世界中で多くの保護規制が存在している。
本稿では,包括的かつ適合したプライバシポリシを生成するアプローチを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:22:16 GMT)
Remaining Useful Life Prediction: A Study on Multidimensional Industrial Signal Processing and Efficient Transfer Learning Based on Large Language Models [6.1] 本稿では,大言語モデル(LLM)をRUL予測に用いる革新的な回帰フレームワークを提案する。
ターボファンエンジンのRUL予測タスクの実験では、提案モデルが最先端(SOTA)法を超越していることが示されている。
微調整のための最小限のターゲットドメインデータでは、モデルは完全なターゲットドメインデータに基づいて訓練されたSOTAメソッドよりも優れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:21:53 GMT)
Authentication by Location Tracking in Underwater Acoustic Networks [6.1] 本稿では,2段階のコンテキストベース認証機構を提案する。
水中装置の位置を推定し,それに基づいて将来の位置を推定する。
予測位置と推定位置の2乗誤差に対して認証チェックを行う。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:26:01 GMT)
Media Framing through the Lens of Event-Centric Narratives [6.0] 我々は、フレーミングデバイスを説明するには、物語の作り方を見る必要があると論じる。
我々のフレームワークは、移民と銃規制という2つの異なる領域において、米国のニュースにおけるフレーミングを分析するのに利用できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:21:42 GMT)
Training on more Reachable Tasks for Generalisation in Reinforcement Learning [5.9] マルチタスク強化学習では、エージェントは一定のタスクセットでトレーニングを行い、新しいタスクに一般化する必要がある。
近年の研究では、探索の増加がこの一般化を改善することが示されているが、その理由は不明である。
マルチタスク強化学習における到達可能性の概念を導入し、初期探索フェーズがエージェントが訓練する到達可能なタスクの数を増やすことを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:15:31 GMT)
FaithCAMERA: Construction of a Faithful Dataset for Ad Text Generation [5.7] 我々は社内の広告クリエーターと協力して、FaithCAMERAという別のATG評価データセットを開発する。
実験の結果,不誠実なエンティティを含むトレーニングデータを削除することで,エンティティレベルでの忠実度や情報性が向上するが,文レベルでは両者を減少させることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:13:24 GMT)
Authorship Obfuscation in Multilingual Machine-Generated Text Detection [5.7] オーサシップ難読化(AO)法は、機械生成テキスト(MGT)検出を回避できる。
我々は、11言語でよく知られた10のAO法と37のMGT検出法をベンチマークした。
その結果, ホモグリフ攻撃が特に成功した全てのテスト言語において, テストされたAOメソッドが自動検出の回避を引き起こす可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:45:22 GMT)
Explainable Earth Surface Forecasting under Extreme Events [5.7] 我々は、新しいDeepExtremeCubesデータセットに基づいて、畳み込み長短期メモリベースのアーキテクチャをトレーニングする。
DeepExtremeCubesには、全世界で約40,000のSentinel-2ミニキューブ(2016年1月から2022年10月まで)が含まれている。
このモデルはテストセットでR$2$スコア0.9055を達成した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:54:24 GMT)
Explainable Earth Surface Forecasting under Extreme Events [5.7] 我々は、新しいDeepExtremeCubesデータセットに基づいて、畳み込み長短期メモリベースのアーキテクチャをトレーニングする。
DeepExtremeCubesには、全世界で約40,000のSentinel-2ミニキューブ(2016年1月から2022年10月まで)が含まれている。
このモデルはテストセットでR$2$スコア0.9055を達成した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:54:24 GMT)
Epistemic Monte Carlo Tree Search [5.6] 深層探査における探索の不確かさを考慮し, 深層探査に利用するために, EMCTS(Epistemic MCTS)を導入する。
アセンブリ言語 SUBLEQ でコードを記述するという難易度の高いタスクにおいて,本手法と組み合わせた AZ は,ベースライン AZ よりもはるかに高いサンプリング効率を実現する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:59:30 GMT)
CUDLE: Learning Under Label Scarcity to Detect Cannabis Use in Uncontrolled Environments [5.6] CUDLE(Cannabis Use Detection with Label efficiency)は,実世界のウェアラブルセンサデータを用いて,自己教師付き学習を活用する新しいフレームワークである。
CUDLEは、対照的な学習フレームワークを通じて、センサ由来のデータを使用して大麻の消費モーメントを特定する。
分析の結果,CUDLEの精度は73.4%,教師付きアプローチでは71.1%,ラベル数が減少するにつれてパフォーマンスギャップが拡大していることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:57:12 GMT)
Foundational Inference Models for Dynamical Systems [5.5] 我々は,ODEによって決定されると仮定される時系列データの欠落を補うという古典的な問題に対して,新たな視点を提供する。
本稿では,いくつかの(隠れた)ODEを満たすパラメトリック関数を通じて,ゼロショット時系列計算のための新しい教師付き学習フレームワークを提案する。
我々は,1と同一(事前学習)の認識モデルが,63個の異なる時系列に対してゼロショット計算を行なえることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 10:41:18 GMT)
An Enhanced Harmonic Densely Connected Hybrid Transformer Network Architecture for Chronic Wound Segmentation Utilising Multi-Colour Space Tensor Merging [5.5] 静脈、動脈、糖尿病、圧傷は世界中でますます一般的になりつつある。
HarDNetセグメンテーションアーキテクチャは、特徴学習を強化するために、ネットワークの初期層にコントラスト除去コンポーネントを統合する。
本研究は, 創傷画像のみを訓練したモデルを用いて, 慢性的な創傷セグメント化のための黒色色調に焦点を当てた最初の研究である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:26:51 GMT)
Promoting Constructive Deliberation: Reframing for Receptiveness [5.4] 本稿では,先行コメントに対する信号受容性に対する不一致応答の自動再フレーミングを提案する。
リフレーミングの6つの戦略を特定します。Redditデータセットを使用して、各戦略に従ってコメントに対する返信を自動的にリフレッシュします。
その結果,本フレームワークで生成した応答は,元の応答よりもはるかに受容性が高いと認識され,汎用的な受容性ベースラインであることが判明した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:55:31 GMT)
Enriching Ontologies with Disjointness Axioms using Large Language Models [5.4] 大型モデル(LLM)は、クラス不整合公理を識別し、主張することで一貫性を提供する。
本研究の目的は,LLMに埋め込まれた暗黙の知識を活用して,存在論的不一致を分類することである。
以上の結果から, LLMは効果的なプロンプト戦略によって導かれることにより, 不整合性関係を確実に識別できることが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:00:06 GMT)
Comparing zero-shot self-explanations with human rationales in multilingual text classification [5.3] 命令調整 LLM は計算や複雑な XAI 法の適用を必要としない自己説明を生成する。
入力論理の形で自己説明を評価することによって、この能力が良い説明をもたらすかどうかを解析する。
以上の結果から,自己説明はLRPよりも人間のアノテーションと密接に一致し,忠実度は同等であることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:14:12 GMT)
Uncovering Software-Based Power Side-Channel Attacks on Apple M1/M2 Systems [5.3] ソフトウェアインターフェースに露出したオンチップのパワーメーターは、物理的アクセスなしで電源サイドチャネル攻撃に使用される可能性がある。
このようなソフトウェアベースのパワーサイドチャネル攻撃は、Appleのシリコンにも適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:19:12 GMT)
Collaborative and Efficient Personalization with Mixtures of Adaptors [5.2] マルチタスク学習問題に対処するパラメータ効率の枠組みを提案する。
FLoRAL(Federated Low-Rank Adaptive Learning)と呼ぶフレームワークがあります。
人工データセットと実世界のフェデレートされたマルチタスク問題に関する有望な実験結果を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:11:15 GMT)
A Survey on Group Fairness in Federated Learning: Challenges, Taxonomy of Solutions and Directions for Future Research [5.1] 機械学習におけるグループフェアネスは、異なるグループ間で平等な結果を達成することに焦点を当てた研究の重要領域である。
フェデレーション学習は、クライアント間の不均一なデータ分散による公平性の必要性を増幅する。
連合学習におけるグループフェアネスの総合的な調査は行われていない。
データパーティショニング、ロケーション、適用戦略といった重要な基準に基づいて、これらのアプローチの新しい分類法を作成します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:39:28 GMT)
Lightning UQ Box: A Comprehensive Framework for Uncertainty Quantification in Deep Learning [5.1] 不確実性定量化(UQ)は、現実世界のタスクにディープニューラルネットワーク(DNN)を適用する上で不可欠なツールである。
textttLightning UQ Box:UQに対する様々なアプローチを適用し評価するための統一インターフェースを紹介する。
我々は、(i)赤外線衛星画像から熱帯サイクロン風速を推定すること、(ii)空のRGB画像から太陽パネルの出力を推定することの2つの課題に焦点を当てた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:54:21 GMT)
An Intelligent Quantum Cyber-Security Framework for Healthcare Data Management [4.8] 本稿では,医療データ管理におけるセキュリティとプライバシの潜在的な問題を克服する,包括的な量子ベースのフレームワークを提案する。
提案したフレームワークは、高度な量子アプローチとより有能な量子アプローチを機械学習とを結合することで、医療データ管理全体を提供する。
提案されたIQ-HDMフレームワークと最先端の手法の実験的評価と比較は、医療データセキュリティに関連するサイバー脅威に対処する上で、67.6%の大幅な改善を概説している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:04:48 GMT)
Aligning Large Language Models with Diverse Political Viewpoints [4.8] ChatGPTのような大規模な言語モデルは、政治的偏見を顕著に表している。
これを解決するため、スイスの国会に立候補する候補者が書いた10000件のコメントから、LLMを様々な政治的視点で調整する。
このデータに沿ったモデルは、ChatGPTのような商用モデルと比較して、スイスの政党によるより正確な政治的視点を生み出すことができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 01:33:53 GMT)
Many-Shot In-Context Learning in Multimodal Foundation Models [4.8] 大規模言語モデルはテキスト内学習(ICL)において効果的である
マルチモーダル基礎モデルの最近の進歩は、前例のない長いコンテキストウインドウを可能にしている。
GPT-4oとGemini 1.5 Proを、複数のドメインにまたがる14のデータセットでベンチマークします。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:51:47 GMT)
Refinement of Monocular Depth Maps via Multi-View Differentiable Rendering [4.7] 本稿では,複数の画像から一貫した詳細な深度マップを生成するための新しい手法を提案する。
我々は、位相的に完全だが計量的に不正確な深度マップを生成する単眼深度推定の進歩を活用する。
提案手法は,高密度で詳細で高品質な深度マップを作成でき,また屋内シナリオの挑戦も可能であり,最先端の深度復元手法よりも優れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:50:28 GMT)
CoCoHD: Congress Committee Hearing Dataset [4.6] 我々は、1997年から2024年までの86委員会における聴聞を32,697レコードでカバーする連邦議会聴聞データセット(CoCoHD)を提案する。
このデータセットは、医療、LGBTQ+の権利、気候正義といった重要な問題に関する政策言語の研究を可能にする。
化石燃料消費に関するエネルギー商務委員会(Energy and Commerce Committee)のスタンスを分析し,1000件のエネルギー関連文に関する事例研究でその可能性を実証した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:49:18 GMT)
Numerical Claim Detection in Finance: A New Financial Dataset, Weak-Supervision Model, and Market Analysis [4.6] ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
ここでは、利益の急落と楽観的な指標への回帰の依存を観察する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:46:03 GMT)
Probabilistic forecasting of power system imbalance using neural network-based ensembles [4.6] 可変選択ネットワーク(VSN)の適応であるC-VSNのアンサンブルを提案する。
毎分、我々のモデルは現在の2四半期のバランスと今後の2四半期のバランスを予測し、これらの予測の不確実さを推定する。
高い不均衡の状況では、我々のモデルは最先端の23.4%を上回ります。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:15:02 GMT)
MBDS: A Multi-Body Dynamics Simulation Dataset for Graph Networks Simulators [4.5] 物理現象をモデル化する主要な手法として,グラフネットワークシミュレータ (GNS) が登場している。
我々は,1D,2D,3Dシーンを含む高品質な物理シミュレーションデータセットを構築した。
私たちのデータセットの重要な特徴は、物理世界のより現実的なシミュレーションを促進する、正確な多体ダイナミクスを取り入れることである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:03:06 GMT)
Private Blotto: Viewpoint Competition with Polarized Agents [4.5] 個別エージェントが独立に振る舞う重要な違いの変種であるPrivate Blottoゲームについて検討する。
結果関数(複数のラベルを1つの項目にまとめる)が重要な影響を与えることを示す。
我々は、ソーシャルメディアプラットフォームや政治コンペティションにおける実例を動機付けるために、我々の結果がもたらす意味を議論することで結論づける。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:34:57 GMT)
Multidimensional Electrical Networks and their Application to Exponential Speedups for Graph Problems [4.5] 我々は、Kirchhoffの代替法則とOhmの代替法則を、新しい多次元量子ウォークフレームワークに基づいて定義することにより、多次元電気ネットワークを開発する。
この枠組みは多次元量子ウォークアルゴリズムを用いて得られた電気の流れをサンプリングすることを可能にする。
この接続を確立することで、多次元電気ネットワークは量子ウォークを超えてより多くの応用が期待できる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:33:40 GMT)
Robust Learning in Bayesian Parallel Branching Graph Neural Networks: The Narrow Width Limit [4.4] ベイズ並列分岐グラフニューラルネットワーク(BPB-GNN)の幅制限について検討する。
BPB-GNNの幅がトレーニング例の数に比べて有意に小さい場合、各ブランチはより堅牢な学習を示す。
本結果は,並列分岐ネットワークにおいて,新たに定義された狭帯域方式を特徴付けるものである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:40:00 GMT)
Harnessing quantum chaos in spin-boson models for all-purpose quantum-enhanced sensing [4.3] 多体量子カオスは、絡み合った状態の準備を加速するツールとして大きなポテンシャルを持っている。
我々のアプローチは技術的ノイズや不完全性に対して堅牢であることを示し、複雑な絡み合った状態を利用する新たな機会を開く。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:14:10 GMT)
Generative AI in the Software Engineering Domain: Tensions of Occupational Identity and Patterns of Identity Protection [4.3] 我々は、ソフトウェア技術者が生成人工知能(GAI)を理解する方法と理由を理解するために、職業的アイデンティティの理論レンズと自己決定理論を構築している。
技術者のセンスメイキングは、下級生や上級生が、能力、自律性、関連性に対するニーズが、GAIによって異なる影響を受けていると感じているため、ドメインの専門知識に依存していることが分かりました。
本稿では、組織やシステムデザイナが、技術変革が労働者の職業的アイデンティティに与える影響をいかに促進できるかに関する設計ガイドラインを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:20:39 GMT)
Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition [4.2] 本稿では,限定ラベル付きデータを用いた下流タスクにおける基礎モデルの性能向上を目的とした,半教師付き微調整手法を提案する。
我々は、MNIST、その拡張されたバリエーション、CIFAR-10、SVHN、GalaxyMNISTを含む複数のデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:15:49 GMT)
Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition [4.2] 本稿では,ラベル付きデータに制限のある下流タスクにおいて,事前学習した基礎モデルの性能向上を目的とした半教師付き微調整手法を提案する。
我々は、MNIST、その拡張されたバリエーション、CIFAR-10、SVHN、GalaxyMNISTを含む複数のデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:15:49 GMT)
On Lai's Upper Confidence Bound in Multi-Armed Bandits [4.1] 我々は、Tze Leung Lai が多武装の盗賊のトピックに精力的に貢献したことに敬意を表します。
我々は、高い信頼度境界指数に対して、急激な非漸近的後悔境界を確立する。
我々の結果は、機械学習の文献にもっと注目に値する、Laiの独創的な作品の側面を強調します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:19:45 GMT)
On Lai's Upper Confidence Bound in Multi-Armed Bandits [4.1] 我々は、Tze Leung Lai が多武装の盗賊のトピックに精力的に貢献したことに敬意を表します。
我々は,高信頼度有界指数に対する非漸近的後悔境界を定めている。
我々の結果は、機械学習の文献にもっと注目に値する、Laiの独創的な作品の側面を強調します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:19:45 GMT)
SpeciaLex: A Benchmark for In-Context Specialized Lexicon Learning [4.1] SpeciaLexは、特殊レキシコンベースの制約に従う言語モデルの能力を評価するためのベンチマークである。
本稿では,15のオープン・クローズド・ソース LLM の実証評価を行い,モデルスケール,オープンネス,セットアップ,信頼性などの要因が,ベンチマークで評価した場合のパフォーマンスに与える影響について考察する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:20:11 GMT)
EmojiHeroVR: A Study on Facial Expression Recognition under Partial Occlusion from Head-Mounted Displays [4.1] EmoHeVRDB (EmojiHeroVR Database) には3,556個のラベル付き顔画像と1,778個の再現された感情が含まれている。
EmojiHeVRDBには、Meta Quest Pro VRヘッドセットを介してキャプチャされた63の表情のアクティベートに関するデータが含まれている。
ベストモデルはテストセットで69.84%の精度を達成した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:29:04 GMT)
Human-in-the-loop Fairness: Integrating Stakeholder Feedback to Incorporate Fairness Perspectives in Responsible AI [4.0] 公正は人工知能(AI)を用いたリスクの高い意思決定への関心が高まっている
普遍的に受け入れられる公正度尺度はなく、公正性は文脈依存であり、公正と見なされるものに関して矛盾する視点があるかもしれない。
私たちの作業は、ステークホルダーが特定の決定インスタンスとその公正性に関する結果に対してフィードバックをすることができるアプローチに従っています。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:23:27 GMT)
Learning Semantic Structure through First-Order-Logic Translation [4.0] 言語モデルは、どのオブジェクトに適用されるかの述語を混乱させることがある。
一般化能力を評価するために設計された合成データセット上で、いくつかの大きな言語モデルを微調整する。
その結果,LLMのFOL翻訳は述語構造を学習するのに適していることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:39:34 GMT)
How Language Models Prioritize Contextual Grammatical Cues? [4.0] 複数のジェンダーキュー語が存在する場合、言語モデルがジェンダー合意をどのように扱うかを検討する。
この結果から,エンコーダベースのモデルとデコーダベースのモデルでは,予測にコンテキスト情報を優先し,使用する方法に顕著な違いが認められた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:09:05 GMT)
Manikin-Recorded Cardiopulmonary Sounds Dataset Using Digital Stethoscope [4.0] 心臓と肺の音は、医療監視に不可欠です。
近年の聴診器技術の進歩により、患者の音を精度良く捉えられるようになった。
私たちの知る限りでは、このデータセットは心呼吸音と混合呼吸音の両方を提供する最初のデータセットです。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:53:16 GMT)
Spatial-aware decision-making with ring attractors in reinforcement learning systems [3.9] リング誘引器は、学習速度と予測性能を改善する生物学的に妥当なメカニズムを提供する。
RL作用選択過程における環誘引子の応用は、環上の特定の位置への作用のマッピングを含む。
その結果, Atari 100kベンチマークの最先端モデルでは, 大幅な改善が見られた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:26:42 GMT)
Dorami: Privilege Separating Security Monitor on RISC-V TEEs [3.9] Dorami - ファームウェアからセキュリティモニタを分離する特権分離アプローチを提案する。
Doramiは既存のISA機能を再使用してアイソレーションを強制し、大きなオーバーヘッドなしに目標を達成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:56:02 GMT)
Integrating Natural Language Prompting Tasks in Introductory Programming Courses [3.9] 本報告では、導入プログラミングコースに2つのプロンプトに焦点を当てたアクティビティを組み込むことについて検討する。
第一に、学生は自然言語のプロンプトを書き、構文上の問題解決を強調することで、計算問題を解く必要がある。
2つ目は、プロンプトとコードの関係を理解するために、提供されたフラグメントに相当するコードを生成するプロンプトを作成することである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:03:25 GMT)
CST-YOLO: A Novel Method for Blood Cell Detection Based on Improved YOLOv7 and CNN-Swin Transformer [3.9] 血液細胞検出はコンピュータビジョンにおける典型的な小規模物体検出問題である。
YOLOv7アーキテクチャに基づく血液細胞検出のためのCST-YOLOモデルを提案し,それをCNN-Swin Transformer (CST) で拡張する。
実験の結果,提案したCST-YOLOはそれぞれ92.7%,95.6%,91.1%のmAP@0.5が得られた。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:21:44 GMT)
CAFCT-Net: A CNN-Transformer Hybrid Network with Contextual and Attentional Feature Fusion for Liver Tumor Segmentation [3.9] 肝腫瘍分節化のためのコンテクスト・アテンショナル機能FusionsEnhanced Convolutional Network (CNN) と Transformer Hybrid Network (CAFCT-Net) を提案する。
実験の結果,提案モデルの平均断面積は76.54%,Dice係数は84.29%であった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:16:26 GMT)
Efficient Training of Neural Stochastic Differential Equations by Matching Finite Dimensional Distributions [3.9] 連続マルコフ過程を比較するための新しいスコアリングルールを開発する。
このスコアリングルールにより、シグネチャカーネルに関連する計算オーバーヘッドを回避できます。
計算効率と生成品質の両面において,FDMが既存の手法よりも優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:26:38 GMT)
Demystifying the Token Dynamics of Deep Selective State Space Models [3.8] SSM(Selective State Space Model)は、シーケンシャルなデータモデリングの有効性で有名になった。
その卓越した経験的性能にもかかわらず、深い選択性SSMに関する包括的な理論的理解はいまだ解明されていない。
本稿では,事前学習したマンバモデルにおけるトークンの動的特性について検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:06:17 GMT)
Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate Group Conversations [3.7] Multi-User Chat Assistant (MUCA) は、グループディスカッションに適したLLMベースのフレームワークである。
MUCAは、サブトピックジェネレータ(Sub-topic Generator)、ダイアログアナライザー(Dilog Analyzer)、会話戦略アービタ(Conversational Strategies Arbitrator)の3つの主要なモジュールで構成されている。
MUCAの最適化を容易にするために,LLMに基づくマルチユーザシミュレータ(MUS)を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:09:00 GMT)
Standardize: Aligning Language Models with Expert-Defined Standards for Content Generation [3.7] 専門家が定義した標準に合わせるために,大規模な言語モデルをガイドする,検索スタイルのインコンテキスト学習ベースのフレームワークであるStandardizeを導入する。
その結果,オープンおよび商用LCMの精度が45%から100%向上する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:28:41 GMT)
Self-Training for Sample-Efficient Active Learning for Text Classification with Pre-Trained Language Models [3.5] 我々は,4つのテキスト分類ベンチマークで評価した,新しい効果的な自己学習戦略であるHASTを紹介する。
その結果、4つのデータセットのうち3つに対して、再現された自己学習手法よりも優れており、以前の実験に匹敵する分類結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:55:45 GMT)
PersonalSum: A User-Subjective Guided Personalized Summarization Dataset for Large Language Models [3.5] 我々はPersonalSumと呼ばれる高品質でパーソナライズされた手作業による要約データセットを提案する。
このデータセットは、公開読者の焦点が、大規模言語モデルによって生成された一般的な要約と異なるかどうかを調査する最初のものである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:12:39 GMT)
Annotation Guidelines for Corpus Novelties: Part 1 -- Named Entity Recognition [3.5] 本書では、その注釈中に適用されるガイドラインについて記述する。
注釈者による指示や、注釈付き小説から取り出された多くの例を含んでいる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:16:02 GMT)
Annotation Guidelines for Corpus Novelties: Part 1 -- Named Entity Recognition [3.5] 本書では、その注釈中に適用されるガイドラインについて記述する。
注釈者による指示や、注釈付き小説から取り出された多くの例を含んでいる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:16:02 GMT)
Mamba in Vision: A Comprehensive Survey of Techniques and Applications [3.5] Mambaは、コンピュータビジョンにおいて、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)が直面する課題を克服するための、新しいアプローチとして登場した。
MambaはSelective Structured State Space Modelsを活用して、線形計算の複雑さで長距離依存を効果的に捉えることで、これらの制限に対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:58:49 GMT)
Uncertainty-Aware Environment Simulation of Medical Devices Digital Twins [3.2] 本稿では,医療機器のディジタル双生児の環境をモデル化し,シミュレーションするためのモデルベースアプローチ(EnvDT)を提案する。
実世界のIoTベースのヘルスケアアプリケーションに接続された3つの薬品ディスペンサー、Karie, Medido, Pillyを使用して、EnvDTを実証的に評価した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:17:52 GMT)
MeDeT: Medical Device Digital Twins Creation with Few-shot Meta-learning [3.2] 本稿では,医療機器のデジタルツイン(DT)を生成し,進化するデバイスにDTを適用するメタラーニングに基づくアプローチを提案する。
我々は、現実世界の医療用IoTアプリケーションと統合された5つの広く使われている医療機器を用いて、OsloCityのコンテキストでMeDeTを評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:43:53 GMT)
DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation [3.2] Deformable Neural Vessel Representations (DeNVeR)は、X線ビデオにおける血管のセグメンテーションの教師なしアプローチである。
DeNVeRは光フローと層分離を使用し、テストタイムトレーニングを通じてセグメンテーション精度と適応性を向上する。
本稿では,画像診断と治療計画のための堅牢でデータ効率のよいツールとして,医用画像の進歩を示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:36:11 GMT)
Align Your Intents: Offline Imitation Learning via Optimal Transport [3.2] 模擬エージェントは,専門家の観察からのみ,望ましい行動を学ぶことができることを示す。
AILOT法では,データに空間距離を交互に組み込んだインテントの形で,状態の特殊表現を行う。
AILOTはD4RLベンチマークで最先端のオフライン模倣学習アルゴリズムより優れていることを報告した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:24:42 GMT)
Reverb: Open-Source ASR and Diarization from Rev [3.1] Revは、これらのリリースが音声技術の研究とイノベーションを加速させることを期待している。
今日リリースされた音声認識モデルは、様々な長文の音声認識領域で、既存のすべてのオープンソースの音声認識モデルを上回っている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:13:58 GMT)
Optimizing Sparse Generalized Singular Vectors for Feature Selection in Proximal Support Vector Machines with Application to Breast and Ovarian Cancer Detection [3.1] 本稿では,一般化特異値問題(GSVP)のスパース解の計算手法を提案する。
これらの問題の解は、勾配近位降下アルゴリズムを一定のステップサイズで適用することによって決定される。
乳癌および卵巣癌データセット間で, ほぼ完全にバランスの取れた精度を, いくつかの特徴を用いて報告した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:34:37 GMT)
Training Over a Distribution of Hyperparameters for Enhanced Performance and Adaptability on Imbalanced Classification [3.1] 条件付き損失訓練(LCT)は、厳しい階級不均衡の下で信頼性の高い分類器の訓練に使用できる。
LCTはいくつかのモデルの性能を近似し、CIFARおよび実際の医用画像アプリケーションにおけるモデル全体の性能を改善する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:47:11 GMT)
Foundation Inference Models for Markov Jump Processes [3.0] 境界状態空間上のマルコフジャンプ過程(MJP)のゼロショット推論手法を提案する。
1つの(事前訓練された)モデルと同一の(事前訓練された)モデルは、ゼロショットの方法で、異なる次元の状態空間で進化する隠れMJPを推論することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:16:30 GMT)
Semantic Segmentation Based Quality Control of Histopathology Whole Slide Images [3.0] We developed a software pipeline for quality control (QC) of histopathology whole slide images (WSIs)。
異なるレベルのぼかし、組織領域、組織折り、ペンマークなど、さまざまな領域を区分する。
TCGAは、28の臓器から11,000以上の病理像を含むWSIデータセットとして最大である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:03:04 GMT)
Optimization Proxies using Limited Labeled Data and Training Time -- A Semi-Supervised Bayesian Neural Network Approach [2.9] 制約のある最適化問題は、在庫管理電力グリッドのような様々なエンジニアリングシステムで発生する。
本研究では,ベイジアンネットワーク(BNN)を用いて,制限されたデータと制限されたモデル時間の下での制約付き最適化問題の解法を提案する。
提案手法は,従来のBNNおよびディープニューラルネットワーク(DNN)アーキテクチャよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:10:20 GMT)
Towards Reproducible LLM Evaluation: Quantifying Uncertainty in LLM Benchmark Scores [2.9] 我々は、大きな言語モデルの能力をテストするために設計されたベンチマークを使用して、基準方向を推論する。
本稿では,ベンチマークスコアの不確かさを定量的に定量化するための簡易な手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:04:28 GMT)
MoJE: Mixture of Jailbreak Experts, Naive Tabular Classifiers as Guard for Prompt Attacks [2.9] 本稿では,大規模言語モデル(LLM)における脱獄予防の重要性を論じる。
我々は,既存の最先端ガードレールの限界を超えるよう設計された,新しいガードレールアーキテクチャであるMoJEを紹介する。
MoJEは、モデル推論中に最小限の計算オーバーヘッドを維持しながら、ジェイルブレイク攻撃の検出に優れる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:16:19 GMT)
Does SpatioTemporal information benefit Two video summarization benchmarks? [2.9] 我々は、ビデオ要約のタスクに類似したスプリアス関係が影響を及ぼすかどうかを問う。
まず、時間的に不変なモデルでベースラインを推定し、そのようなモデルがベンチマークデータセット上でどれだけうまくランクされているかを確認する。
次に、ビデオの時間的順序を乱して、既存の最先端モデルに与える影響を調査します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:20:04 GMT)
A fixed phase tunable directional coupler based on coupling tuning [2.8] Mach-Zehnder Interferometers (MZIs) は、大規模回路における反射率調整のための主要なビルディングブロックである。
MZIは、0-1反射率を達成するために完全なバランスの取れた方向のカップラを必要とするため、製造エラーを起こしやすい。
本研究では,薄膜窒化リチウムプラットフォームにおける結合定数チューニングに基づくTDCの設計を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:34:30 GMT)
A fixed phase tunable directional coupler based on coupling tuning [2.8] Mach-Zehnder Interferometers (MZIs) は、大規模回路における反射率調整のための主要なビルディングブロックである。
MZIは、0-1反射率を達成するために完全なバランスの取れた方向のカップラを必要とするため、製造エラーを起こしやすい。
本研究では,薄膜窒化リチウムプラットフォームにおける結合定数チューニングに基づくTDCの設計を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:34:30 GMT)
Improving Online Bagging for Complex Imbalanced Data Stream [2.7] 安全でないマイノリティ事例の存在をよりよく考慮するために,オンラインバッグの再サンプル化の拡張を提案する。
合成複素不均衡データストリームを用いた計算実験は、オンラインバッグ再サンプリングアンサンブルの以前の変種よりも有利であることを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:38:37 GMT)
Applying the Lower-Biased Teacher Model in Semi-Supervised Object Detection [2.7] 半教師対象検出タスクに適したアンバイアスド教師モデルの強化であるローワーバイアスド教師モデルを提案する。
このモデルの主な革新は、教師モデルへのローカライズ損失の統合であり、擬似ラベル生成の精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:54:55 GMT)
Applying the Lower-Biased Teacher Model in Semi-Suepervised Object Detection [2.7] 半教師対象検出タスクに適したアンバイアスド教師モデルの強化であるローワーバイアスド教師モデルを提案する。
このモデルの主な革新は、教師モデルへのローカライズ損失の統合であり、擬似ラベル生成の精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:54:55 GMT)
FedStein: Enhancing Multi-Domain Federated Learning Through James-Stein Estimator [2.7] Federated Learning (FL)は、分散クライアント間の協調的なインサイトトレーニングを可能にすることで、データのプライバシを促進する。
その固有の利点にもかかわらず、FLは独立して同じ分散データを扱う際に、パフォーマンスと収束性の重大な課題に直面している。
本稿では,FedStein: Enhancing Multi-Domain Federated Learning through the James-Stein Estimatorを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:13:31 GMT)
Generating bilingual example sentences with large language models as lexicography assistants [2.7] 本稿では,資源レベルの異なる言語におけるバイリンガル辞書の例文の生成と評価におけるLLMの性能について検討する。
GDEX(Good Dictionary Example)基準に対するLCM生成例の品質評価を行った。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:45:48 GMT)
Images Speak Volumes: User-Centric Assessment of Image Generation for Accessible Communication [2.6] 本稿では,画像のカスタマイズを迅速かつ容易に行うことにより,テキスト・画像生成モデルがギャップを埋めるかどうかを検討する。
我々は、7、4つのオープンソース、3つのクローズドソース画像生成モデルをベンチマークし、その結果の画像を広範囲に評価した。
いくつかのモデルは優れた性能を示すが、人間の監督なしに大規模に使用する準備ができていない。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:40:15 GMT)
3D Segmentation of Neuronal Nuclei and Cell-Type Identification using Multi-channel Information [2.6] 本稿では, 神経核の3次元再構成を改良し, セグメンテーションを可能にする手法を提案する。
神経細胞核と3Dセグメンテーションの良好な識別比を提供することができた。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:13:02 GMT)
Llettuce: An Open Source Natural Language Processing Tool for the Translation of Medical Terms into Uniform Clinical Encoding [2.6] 本稿では,医学用語をOMOP標準概念に変換する複雑さに対処するオープンソースツールであるLlettuceを紹介する。
コンプライアンスを重視して開発されたLlettuceは、ローカルにデプロイして、高性能を維持しながらデータ保護を保証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:11:15 GMT)
GROD: Enhancing Generalization of Transformer with Out-of-Distribution Detection [2.6] トランスフォーマーネットワークは自然言語処理(NLP)とコンピュータビジョン(CV)タスクに優れている。
彼らは、out-of-Distribution(OOD)データセットを一般化する上で、課題に直面している。
本稿では,OOD検出に基づく新しい手法を提案し,このアルゴリズムをGROD(Generate Rounded OOD Data)アルゴリズムと呼ぶ。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:36:48 GMT)
A Global Medical Data Security and Privacy Preserving Standards Identification Framework for Electronic Healthcare Consumers [2.6] 異なる国は、医療データのセキュリティとプライバシーに関する様々な基準を持っている。
本稿では,これらのルールをグローバルに標準化するための,新しい包括的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:22:55 GMT)
The Effect of Acute Stress on the Interpretability and Generalization of Schizophrenia Predictive Machine Learning Models [2.6] 統合失調症は重度の精神疾患であり、早期診断は結果を改善する鍵となる。
脳波は統合失調症の研究に有用なツールとして現れており、機械学習が診断にますます応用されている。
本稿では、統合失調症の予測のためのMLモデルの精度を評価し、脳波記録中のストレスがモデルパフォーマンスに与える影響について検討する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:41:12 GMT)
BN-SCAFFOLD: controlling the drift of Batch Normalization statistics in Federated Learning [2.6] 機械学習(ML)モデルを分散的にトレーニングするための学習パラダイムとして、フェデレートラーニング(FL)が注目を集めている。
バッチ正規化(BN)はディープニューラルネットワーク(DNN)においてユビキタスである
BNは異種FLにおけるDNNの性能を阻害すると報告されている。
BN-DNN設定における分散還元アルゴリズムの収束を解析するための統一理論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:53:20 GMT)
Survey on Code Generation for Low resource and Domain Specific Programming Languages [2.5] LLM(Large Language Models)は、人気のあるプログラミング言語のコード生成機能を示す。
低リソースプログラミング言語(LRPL)とドメイン特化言語(DSL)のパフォーマンスは依然として大きな課題です。
LRPLやDSLは金融や科学といった専門分野の開発効率を高めるため、これらの課題に対処することが不可欠である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:45:17 GMT)
Deep Domain Isolation and Sample Clustered Federated Learning for Semantic Segmentation [2.5] 本稿では,2次元セグメンテーションタスクにおける参加者間の共変量変化の影響を初めて検討する。
我々は、モデルの勾配空間内で直接画像領域を分離するディープドメイン分離(DDI)を開発する。
我々は,このクラスタリングアルゴリズムをSCFL(Sample Clustered Federated Learning)フレームワークを通じて活用する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:43:07 GMT)
On Uncertainty In Natural Language Processing [2.5] この論文は、自然言語処理における不確実性が言語的、統計的、神経的な観点からどのように特徴づけられるかを研究する。
本研究では,非交換不能な共形予測に基づく自然言語生成における校正サンプリング手法を提案する。
最後に,補助予測器を用いた大規模ブラックボックス言語モデルの信頼性の定量化手法を開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:08:02 GMT)
Learning test generators for cyber-physical systems [2.4] サイバー物理システムに対するブラックボックス実行時検証手法は、入力と出力が時間とともに信号として表現されるシステムにおけるエラーを発見するために用いられる。
既存の方法、例えば要求のファルシフィケーションは、システム正当性に対する反例である単一の入力を見つけることに集中することが多い。
テストジェネレータの作成方法を示し、単一の要件に対して、複数の多種多様な反例を生成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:34:02 GMT)
CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment [2.4] 画像類似度メトリクスは、画像処理、コンピュータビジョン、機械学習で使用されるため、コンピュータビジョンアプリケーションにおいて重要な役割を果たす。
PSNR、MSE、SSIM、ISSM、FSIMといった既存のメトリクスは、画像の小さな変更に対する速度、複雑さ、感度のいずれにおいても制限に直面していることが多い。
本稿では,画像の微妙な変化に敏感でありながらリアルタイムに組み合わせた新しい画像類似度指標CSIMについて検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:06:09 GMT)
CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment [2.4] 画像類似度メトリクスは、画像処理、コンピュータビジョン、機械学習で使用されるため、コンピュータビジョンアプリケーションにおいて重要な役割を果たす。
PSNR、MSE、SSIM、ISSM、FSIMといった既存のメトリクスは、画像の小さな変更に対する速度、複雑さ、感度のいずれにおいても制限に直面していることが多い。
本稿では,画像の微妙な変化に敏感でありながらリアルタイムに組み合わせた新しい画像類似度指標CSIMについて検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:06:09 GMT)
Efficient Matrix Factorization Via Householder Reflections [2.3] 我々は$mathbfH$と$mathbfX$を$mathbfY$から正確に回収することが、$mathbfY$の$Omega$列で保証されていることを示す。
この研究のテクニックが、辞書学習のための代替アルゴリズムの開発に役立つことを願っている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:42:20 GMT)
GOSt-MT: A Knowledge Graph for Occupation-related Gender Biases in Machine Translation [2.3] 機械翻訳(MT)システムにおけるジェンダーバイアスは、しばしば有害なステレオタイプを補強する重大な課題を引き起こす。
本稿では,GOSt-MTナレッジグラフの作成を通じて,職業関連性バイアスを研究する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:13:42 GMT)
Parallel Corpus Augmentation using Masked Language Models [2.3] マルチLingual Masked Language Model を用いて、コンテキスト内の代替語をマスキングし、予測する。
センテンス・エンベディング(Sentence Embeddings)を使用して、お互いの翻訳の可能性が高い文対をチェックし、選択する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:15:07 GMT)
Measuring and Controlling Solution Degeneracy across Task-Trained Recurrent Neural Networks [2.2] 我々は、行動、神経力学、重量空間という3つのレベルにまたがる縮退を解析するための統一的なフレームワークを提供する。
我々は、機械学習と神経科学領域にわたる多様なタスクで訓練されたRNNを分析した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:23:55 GMT)
Shrinking: Reconstruction of Parameterized Surfaces from Signed Distance Fields [2.2] 符号付き距離場(SDF)から明示的パラメータ化曲面を再構成する新しい手法を提案する。
本手法では, パラメータ化初期球面を対象のSDF形状に適合させ, 微分可能性と表面パラメータ化を連続的に保持する。
これにより、テクスチャマッピング、幾何学処理、アニメーション、有限要素解析などの下流アプリケーションが可能になる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:39:15 GMT)
Exploring Learnability in Memory-Augmented Recurrent Neural Networks: Precision, Stability, and Empirical Insights [2.1] 本研究では,Pushdown Automataと理論的に等価であるメモリレスおよびメモリ拡張RNNの学習可能性について検討する。
完全にトレーニングされたコンポーネントフリーズモデルの実験では、メモリコンポーネントの凍結によりパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:29:51 GMT)
ASTE Transformer Modelling Dependencies in Aspect-Sentiment Triplet Extraction [2.1] Aspect-Sentiment Triplet extract (ASTE) は、ある文から三重項(アスペクトフレーズ、意見フレーズ、感情極性)を抽出するタスクである。
最近の最先端手法は、まず与えられた文から可能な全てのスパンを抽出することで、このタスクにアプローチする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:09:15 GMT)
Conditional Enzyme Generation Using Protein Language Models with Adapters [2.1] ProCALMは、タンパク質言語モデルへのアダプタを用いたタンパク質の条件生成のためのアプローチである。
ProCALMの具体的実装は、酵素機能と分類の条件付け表現を組み込むためにProGen2を微調整することを含む。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:41:47 GMT)
An Approach To Enhance IoT Security In 6G Networks Through Explainable AI [2.0] 6G通信は、特にIoTにおいて、画期的な機能を提供する6Gによって大きく進化した。
IoTを6Gに統合することで、高度なテクノロジによって導入された脆弱性による攻撃面の拡大という、新たなセキュリティ上の課題が提示される。
本研究は、木に基づく機械学習アルゴリズムを用いて複雑なデータセットを管理し、機能の重要性を評価することで、これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:14:25 GMT)
A Large Language Model-based Framework for Semi-Structured Tender Document Retrieval-Augmented Generation [2.0] 大規模言語モデル(LLM)は文書生成の可能性を示しているが、ほとんどのLLMは調達に特別な知識を欠いている。
我々は、検索強化技術を用いて、プロのドキュメント生成を実現し、調達文書の正確性と関連性を確保する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:46:07 GMT)
Explicit, Implicit, and Scattered: Revisiting Event Extraction to Capture Complex Arguments [2.0] 先行研究は、イベント固有の引数の抽出をスパン抽出問題として定式化する。
既存のEEフレームワークではモデル化できない2つの重要な引数タイプを紹介します。
オンライン健康談話から7,464の論証アノテーションを含む新しいデータセットであるDiscourseEEを開発した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:54:30 GMT)
Non-destructive Fault Diagnosis of Electronic Interconnects by Learning Signal Patterns of Reflection Coefficient in the Frequency Domain [1.9] 本稿では,早期故障検出と相互接続欠陥の正確な診断のための新しい非破壊的手法を提案する。
提案手法は, 周波数範囲にわたる係数反射の信号パターンを利用して, 根本原因同定と重大度評価の両立を可能にする。
実験結果から,本手法は断層検出および診断に有効であり,実世界の産業応用に拡張できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:50:46 GMT)
Diffusion Models are Evolutionary Algorithms [1.8] 拡散モデルは、自然に選択、突然変異、生殖隔離を含む進化的アルゴリズムを実行することを示す。
本稿では,反復的 denoising を利用した進化的アルゴリズムである拡散進化法を提案する。
また、高次元複素パラメータ空間における進化的タスクの解を求めるラテント空間拡散進化についても紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:55:52 GMT)
Diffusion Models are Evolutionary Algorithms [1.8] 拡散モデルは、自然に選択、突然変異、生殖隔離を含む進化的アルゴリズムを実行することを示す。
本稿では,反復的 denoising を利用した進化的アルゴリズムである拡散進化法を提案する。
また、高次元複素パラメータ空間における進化的タスクの解を求めるラテント空間拡散進化についても紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:55:52 GMT)
Adversarial Attacks on Data Attribution [1.7] 本稿では,修正データセットを生成する2つの手法を提案する。
シャドウアタックはデータ属性に基づく報酬を少なくとも200%増加させ、アウタリエアタックは185%から643%の報酬インフレーションを達成する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:11:00 GMT)
SDCL: Students Discrepancy-Informed Correction Learning for Semi-supervised Medical Image Segmentation [1.7] 半教師付き医用画像セグメンテーション(SSMIS)は、限られた医療ラベル付きデータの問題を緩和する可能性を実証している。
本研究では,2人の生徒と1人の教師を含む学生の離散型情報修正学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:17:19 GMT)
Ecosystem-wide influences on pull request decisions: insights from NPM [1.7] プルベースの開発モデルは、オープンソースプロジェクトにおけるグローバルなコラボレーションを促進する。
NPMエコシステム内の20,052のGitHubプロジェクトから、約1.8万のプルリクエストと2100万のイシューのデータセットを収集しています。
これらのうち98%はデータセット内の別のプロジェクトに依存しており、依存するプロジェクト間のコラボレーションを研究することができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:14:39 GMT)
Investigating Imperceptibility of Adversarial Attacks on Tabular Data: An Empirical Analysis [1.7] 敵対的攻撃は、機械学習モデルに対する潜在的な脅威である。
これらの攻撃は入力データに対する知覚不能な摂動を通じて誤った予測を引き起こす。
本研究は、敵攻撃の非受容性を評価するための重要な特徴とそれに対応する指標のセットを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:35:27 GMT)
GAS-Norm: Score-Driven Adaptive Normalization for Non-Stationary Time Series Forecasting in Deep Learning [1.6] 入力データの平均値と分散値の変化がディープニューラルネットワーク(DNN)の予測能力をいかに破壊するかを示す。
本稿では,GAS(Generalized Autoregressive Score)モデルとDeep Neural Networkを組み合わせた適応時系列正規化と予測の新しい手法であるGAS-Normを紹介する。
その結果,GAS-Normと組み合わせた場合,25項目中21項目の予測モデルでは,他の正規化手法と比較して精度が向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:26:12 GMT)
Exploring gauge-fixing conditions with gradient-based optimization [1.6] この研究は、ランダウゲージ、クーロンゲージ、最大木ゲージをカバーするのに十分な広さを持つゲージ固定の微分可能なパラメータ化を導入する。
随伴状態法は勾配に基づく最適化を可能にし、任意の目標損失関数を最小化するゲージ固定スキームを選択する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:01:41 GMT)
Neural Sampling from Boltzmann Densities: Fisher-Rao Curves in the Wasserstein Geometry [1.6] 正規化されていないボルツマン密度$rho_D$から、$f_t$で与えられるボルツマン曲線を学習することで、サンプリングを行う。
M'at'e と Fleuret に触発されて、f_t$ のみをパラメータ化し、適切な $v_t$ を修正する方法を提案する。
これはランゲヴィン力学に関連するクルバック・リーブラー発散のワッサーシュタインフローに対応する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:54:11 GMT)
A Multi-model Approach for Video Data Retrieval in Autonomous Vehicle Development [1.6] 本稿では,sqlの代わりに自然言語記述を用いて,ログコレクション内の特定のシナリオを検索可能なパイプラインを提示し,評価する。
提案手法は平均3.3のスコアを達成し,マルチモデルアーキテクチャの可能性を実証した。
また、クエリプロセスを視覚化し、結果を視覚化するインターフェースも提示する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:38:27 GMT)
Output Scouting: Auditing Large Language Models for Catastrophic Responses [1.6] 近年、Large Language Models(LLMs)の使用が個人に重大な害を与え、AI安全性への関心が高まっている。
LLMの安全性が問題となる理由の1つは、モデルが有害な出力を発生させる確率が少なくともゼロでない場合が多いことである。
本稿では,任意の確率分布に適合する任意のプロンプトに対して,意味論的に流動的なアウトプットを生成することを目的としたアウトプット・スカウトを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:18:53 GMT)
Paraphrase Identification with Deep Learning: A Review of Datasets and Methods [1.6] 一般的なデータセットにおける特定のパラフレーズ型の表現不足が,盗作を検知する能力にどのように影響するかを検討する。
パラフレーズのための新しいタイポロジーを導入し、検証する。
我々は、AIに基づくパラフレーズ検出を強化するために、将来の研究とデータセット開発のための新しい方向を提案する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:53:45 GMT)
Comparison of Reservoir Computing topologies using the Recurrent Kernel approach [1.5] Reservoir Computing (RC) は、高速で効率的な計算能力によって近年人気を集めている。
標準RCは、その表現力を分析するのに役立つリカレントカーネルの限界において等価であることが示されている。
しかし、Leaky RC、Sparse RC、Deep RCのような確立されたRCパラダイムの多くは、そのような方法で体系的に分析されていない。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:16:14 GMT)
Truncated Kernel Stochastic Gradient Descent on Spheres [1.5] 球面高調波構造に着想を得て,T-カーネルSGDアルゴリズムを提案する。
T-カーネルSGDは、反復中に仮説空間を動的に調整することでバイアスと分散のバランスをとるのにより効果的である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:51:16 GMT)
Truncated Kernel Stochastic Gradient Descent on Spheres [1.5] 球面高調波の構造に着想を得て,T-カーネルSGDアルゴリズムを提案する。
T-カーネルSGDは「トランケーション」演算を採用し、勾配降下における直列ベースのカーネル関数の適用を可能にする。
従来のカーネルSGDとは対照的に、TカーネルSGDはバイアスと分散のバランスをとるのにより効果的である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:51:16 GMT)
Towards Assuring EU AI Act Compliance and Adversarial Robustness of LLMs [1.4] 大規模な言語モデルは誤用しがちで、セキュリティの脅威に弱い。
欧州連合の人工知能法は、特定の文脈においてAIの堅牢性を強制しようとするものである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:38:49 GMT)
Knowledge-Augmented Reasoning for EUAIA Compliance and Adversarial Robustness of LLMs [1.4] EUAIA(EU AI Act)は、敵の堅牢性を確立するために必要なプロセスと交差するAIシステムの要件を導入している。
本稿では,2つの特性をブリッジする機能アーキテクチャを提案する。
我々は,知識強化に基づく推論レイヤで開発者と監査者を支援することを目的としている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:23:14 GMT)
Developing Assurance Cases for Adversarial Robustness and Regulatory Compliance in LLMs [1.4] 我々は,大規模言語モデル(LLM)における対向ロバスト性および規制遵守のための保証事例開発のためのアプローチを開発する。
我々は、これらの攻撃を緩和し、EU AI Actへのコンプライアンスを確保することを目的とした、配置のさまざまな段階でガードレールを組み込んだ階層化されたフレームワークを提案する。
当社の手法を2つの模範的保証ケースで説明し、さまざまなコンテキストが、堅牢で準拠のAIシステムを保証するために、どのように適切な戦略を要求するかを強調した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:14:29 GMT)
ConceptLens: from Pixels to Understanding [1.3] ConceptLensは、隠れたニューロンの活性化を可視化することによって、ディープニューラルネットワーク(DNN)の複雑な動作を照明する革新的なツールである。
ディープラーニングとシンボリックな方法を統合することで、ConceptLensは、ニューロンの活性化を引き起こすものを理解するユニークな方法を提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:49:12 GMT)
Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.3] 本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:37:02 GMT)
Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.3] 本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:37:02 GMT)
Metamorphic Testing of Image Captioning Systems via Image-Level Reduction [1.3] 本稿では,画像レベルの縮小変換を施した変成テストを行うためのREICを提案する。
画像レベルの縮小変換では、REICは任意のオブジェクトを人工的に操作しないため、非現実的なフォローアップ画像の生成を回避できる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:50:40 GMT)
Examining Racial Stereotypes in YouTube Autocomplete Suggestions [1.3] 我々は、YouTubeのオートコンプリートが、人種に関する情報を探索するユーザーのための情報ソースとしてどのように機能するかを検討する。
批判的談話分析を用いて、人種バイアスが現れる5つの主要な社会文化的文脈を同定する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:53:25 GMT)
Comparative study of regression vs pairwise models for surrogate-based heuristic optimisation [1.3] 本稿では, シュロゲート問題の定式化を, 適合度を近似する回帰モデル(表面シュロゲートモデル)と, 分類モデル(ペアワイズ・シュロゲートモデル)を結合する新しい方法の両方として扱う。
オンライン機械学習に基づくサロゲートモデルを用いる場合の全体探索の性能は、予測モデルの精度だけでなく、正または負のケースに対するバイアスの種類にも依存する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:19:06 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] 本研究では,古典的学習パリティ(LPN)問題の2つの変種に対する学習アルゴリズムについて検討する。
我々は,幅広いパラメータに対する技術状況を改善するための新しいアルゴリズムフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:06:19 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] 本研究では,古典的学習パリティ(LPN)問題の2つの変種に対する学習アルゴリズムについて検討する。
我々は,幅広いパラメータに対する技術状況を改善するための新しいアルゴリズムフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:06:19 GMT)
Generalized symmetry in non-Hermitian systems [1.1] 非エルミート量子力学の数学的定式化にはコンセンサスがない。
異なる方法論は非エルミート力学の研究に用いられる。
この研究は、非エルミート・ハミルトニアンのさらなる探索の基礎となる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:28:41 GMT)
NRGBoost: Energy-Based Generative Boosted Trees [1.1] 本稿では,XGBoostのような人気パッケージに実装された第2次ブースティングに類似したエネルギーベース生成促進アルゴリズムを提案する。
提案アルゴリズムは,任意の入力変数に対して推論タスクを処理可能な生成モデルを生成する一方で,複数の実世界のデータセット上でGBDTと類似の識別性能を実現できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:54:02 GMT)
Searching for Best Practices in Medical Transcription with Large Language Model [1.1] 本稿では,Large Language Model (LLM) を用いて,高精度な医療書面を生成する手法を提案する。
提案手法は,単語誤り率(WER)を低くし,重要な医療用語の正確な認識を確保するために,高度な言語モデリング技術を統合する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:41:16 GMT)
A higher-order transformation approach to the formalization and analysis of BPMN using graph transformation systems [1.1] 本稿ではBPMNの実行セマンティクスの形式化を提案する。
私たちのアプローチは、BPMNモデルからグラフ変換システムへの高次の変換に基づいています。
このアプローチの能力を示すため、オープンソースのWebベースツールとして実装しました。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:47:53 GMT)
Benchmarking the Fidelity and Utility of Synthetic Relational Data [1.0] 我々は、関係データ合成、共通ベンチマークデータセット、および合成データの忠実性と有用性を測定するためのアプローチに関する関連研究についてレビューする。
ベストプラクティスと、新しい堅牢な検出アプローチをベンチマークツールに組み合わせて、6つのメソッドを比較します。
実用面では、モデル予測性能と特徴量の両方において、実データと合成データの適度な相関が観察されるのが一般的である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:23:45 GMT)
Multi-Dialect Vietnamese: Task, Dataset, Baseline Models and Challenges [1.0] ベトナム全土で話されている63の方言の多様性を包括的に分析したベトナム語多方言データセットについて紹介する。
我々のデータセットは、約19,000の発話からなる102.56時間の音声からなり、関連するテキストには120万以上の単語が含まれている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:17:56 GMT)
AutoLoRA: AutoGuidance Meets Low-Rank Adaptation for Diffusion Models [1.0] 低ランク適応(LoRA)は条件付き生成拡散モデルに適用できる微調整技術である。
本稿では,LoRAアプローチを微調整した拡散モデルのための新しいガイダンス手法であるAutoLoRAを紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:57:11 GMT)
End-to-End Reaction Field Energy Modeling via Deep Learning based Voxel-to-voxel Transform [0.9] 本稿では,ニューラルネットワークに基づく偏微分方程式解法の最近の進歩に触発された,新しい機械学習手法PBNeFを紹介する。
本手法はPB方程式の入力および境界静電条件を学習可能なボクセル表現に定式化する。
PBNeFは従来のPBソルバに比べて100倍以上のスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:11:17 GMT)
MedVisionLlama: Leveraging Pre-Trained Large Language Model Layers to Enhance Medical Image Segmentation [0.8] 本研究では、予め訓練されたLCMトランスブロックを統合することで、医用画像セグメンテーションのためのビジョントランス(ViT)の強化について検討する。
凍結LDM変換器ブロックをViTモデルエンコーダに組み込んだ手法により,セグメント化性能が大幅に向上した。
改良されたモデルでは、平均Diceスコアが0.74から0.79に向上し、精度、精度、ジャカード指数が向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:19:33 GMT)
MedVisionLlama: Leveraging Pre-Trained Large Language Model Layers to Enhance Medical Image Segmentation [0.8] 本研究では、予め訓練されたLCMトランスブロックを統合することで、医用画像セグメンテーションのためのビジョントランス(ViT)の強化について検討する。
凍結LDM変換器ブロックをViTモデルエンコーダに組み込んだ手法により,セグメント化性能が大幅に向上した。
改良されたモデルでは、平均Diceスコアが0.74から0.79に向上し、精度、精度、ジャカード指数が向上した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:19:33 GMT)
færdXel: An Expert System for Danish Traffic Law [0.8] faerdXelはデンマークの交通法分野における象徴的な推論のためのツールです。
本稿ではデンマークの交通法分野における象徴的推論ツールであるfaerdXelを紹介する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:07:36 GMT)
From Epilepsy Seizures Classification to Detection: A Deep Learning-based Approach for Raw EEG Signals [0.8] 側頭葉てんかんの3分の1は薬剤耐性を示す。
抗敗血症薬開発の鍵となるのはてんかん発作の検出と定量化である。
本研究では,脳波信号に適用した深層学習モデルに基づく発作検出パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:52:37 GMT)
Self-Supervised Keypoint Detection with Distilled Depth Keypoint Representation [0.8] Distill-DKPは,キーポイント検出のためのクロスモーダルな知識蒸留フレームワークである。
Distill-DKPは、深度に基づく教師モデルから埋め込みレベルの知識を抽出し、画像に基づく学生モデルを指導する。
実験により、Distill-DKPは従来の教師なし手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:14:08 GMT)
Deep Model Interpretation with Limited Data : A Coreset-based Approach [0.8] 本稿では,コアセット選択手法を用いて,大規模データセットの代表的なサブセットを抽出する,コアセットに基づく解釈フレームワークを提案する。
本稿では,モデル解釈手法のロバスト性を評価するための類似性に基づく評価プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:32:31 GMT)
Deep Model Interpretation with Limited Data : A Coreset-based Approach [0.8] 本稿では,コアセット選択手法を用いて,大規模データセットの代表的なサブセットを抽出する,コアセットに基づく解釈フレームワークを提案する。
本稿では,モデル解釈手法のロバスト性を評価するための類似性に基づく評価プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:32:31 GMT)
Continuous-Variable Quantum Key Distribution with key rates far above the PLOB bound [0.8] ガウス集団攻撃における秘密鍵レートの分析を行った。
一方向誤り訂正の場合の上限であるDevetak-Winter値$I(X;Y) - I(E;Y)$よりもはるかに高い秘密鍵レートを得る。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:22:30 GMT)
Aircraft Radar Altimeter Interference Mitigation Through a CNN-Layer Only Denoising Autoencoder Architecture [0.8] 我々は,CNN層のみのオートエンコーダアーキテクチャを用いて,レーダ高度計の測位精度を向上させることができることを示す。
最大4万個のIQサンプルのFMCWレーダー信号を確実に再構成することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:32:05 GMT)
SOI: Scaling Down Computational Complexity by Estimating Partial States of the Model [0.7] 最小限のアプライアンスで使用されるマイクロコントローラ(MCU)は、いまだに適度に大きく、最先端の人工ニューラルネットワーク(ANN)を実行できない。
本稿では,ANNの計算複雑性を低減することを目的とした,Scattered Online Inference (SOI) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:53:15 GMT)
Killing Two Flies with One Stone: An Attempt to Break LLMs Using English->Icelandic Idioms and Proper Names [0.7] 本稿は,英語・アイスランド語翻訳における慣用的表現と固有名称について述べる。
まず、一般的な英語の慣用表現の翻訳におけるMTシステムの能力を評価する。
2つ目のテストスイートはアイスランドの地名に翻訳され、正しく入力される場所名で構成されている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:57:00 GMT)
Cogs in a Machine, Doing What They're Meant to Do -- The AMI Submission to the WMT24 General Translation Task [0.7] 本稿では、WMT24の一般翻訳課題に「Arni Magnusson Institute」のチームを提出する。
我々は、英語からアイスランド語への翻訳の方向について研究している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:48:32 GMT)
RePlay: a Recommendation Framework for Experimentation and Production Use [0.7] RePlayは推奨システムを構築するためのエンドツーエンドパイプラインを含むフレームワークである。
Pandas、Polars、Sparkの各ステージで、パイプラインに適したスタックを使用することができる。
これにより、ライブラリは計算をスケールし、クラスタにデプロイできる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:26:24 GMT)
To Err Is Human, but Llamas Can Learn It Too [0.7] 本研究では,言語モデル(LM)を用いた文法的誤り訂正の強化について検討する。
Llama 2-based LMs for error generation, and found that this approach yields synthetic error to a same error。
我々はこれらの人工的誤りの助けを借りてGEC Llamaモデルを訓練し、過去の最先端の誤り訂正モデルより優れていた。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:34:48 GMT)
Towards an Improved Metric for Evaluating Disentangled Representations [0.7] 切り離された表現学習は、表現を制御可能、解釈可能、転送可能にする上で重要な役割を果たす。
領域におけるその重要性にもかかわらず、信頼性と一貫した量的絡み合い計量の探求は依然として大きな課題である。
そこで本稿では, 直感的概念の強調と係数-符号関係の改善を生かしたemphEDIという測度を導入することにより, 絡み合いの定量化のための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:32:59 GMT)
Oracle Separation Between Quantum Commitments and Quantum One-wayness [0.7] 量子コミットメントが存在するが、(効果的に検証可能な)片方向状態生成器が存在しないような、ユニタリな量子オラクルが存在することを示す。
最近の研究は、一方の状態発生器からコミットメントを構築することができることを示したが、他方の方向は未解決のままである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:26:21 GMT)
Universal adapters between quantum LDPC codes [0.7] 量子低密度パリティチェック符号ブロック内で, 共同論理パウリ測定を行うコードアダプタを提案する。
この構成は、$O(tdlog2d)$追加の量子ビットとチェックと$O(d)$時間を使って、$t$weight $O(d)$演算子を合同論理的に測定する。
例えば$t=2$でアダプタを拡張することで、$O(d2)$追加のキュービットとチェックを使用して、Dehnツイストを介して任意のLDPCコード上でターゲット論理CNOTゲートを実行するトーリックコードアダプタを構築します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:34:42 GMT)
Probabilities of Chat LLMs Are Miscalibrated but Still Predict Correctness on Multiple-Choice Q&A [0.6] チャット用に微調整された14の大規模言語モデル (LLMs) について検討し、その最大ソフトマックス確率 (MSPs) が多重選択Q&Aにおいて常に誤校正されていることを発見した。
この仮説は、基礎となるQ&Aタスクでよく機能するモデルに対して成り立つことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:29:58 GMT)
Jacobian Descent for Multi-Objective Optimization [0.6] 勾配降下は単目的最適化に限られる。
Jacobian descent (JD) はベクトル値の目的関数のヤコビ行列を用いてパラメータを反復的に更新する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:48:21 GMT)
Global and Preference-based Optimization with Mixed Variables using Piecewise Affine Surrogates [0.6] 本稿では,線形制約付き混合変数問題の解法として,新しいサロゲートに基づく大域的最適化アルゴリズムを提案する。
目的関数はブラックボックスとコスト対評価であり、線形制約は予測不可能な事前知識である。
本稿では,2種類の探索関数を導入し,混合整数線形計画解法を用いて実現可能な領域を効率的に探索する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 00:32:32 GMT)
Explaining the (Not So) Obvious: Simple and Fast Explanation of STAN, a Next Point of Interest Recommendation System [0.6] いくつかの機械学習手法は本質的に説明可能であるため、完全にブラックボックスではない。
これによって開発者は、複雑で高価な説明可能性技術を開発することなく、アウトプットを理解することができる。
我々は、協調フィルタリングとシーケンス予測に基づく次の関心点推薦システムSTANにおいて、この哲学/パラダイムを実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:14:58 GMT)
Matching aggregate posteriors in the variational autoencoder [0.6] 変分オートエンコーダ(VAE)は、よく研究され、深い、潜伏変数モデル(DLVM)である。
本稿では,VAE に付随する目的関数を改良することにより,VAE の欠点を克服する。
提案手法はEmphaggregate variational autoencoder (AVAE) と命名され,VAEの理論的枠組みに基づいて構築されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 23:28:46 GMT)
Attribute-Based Semantic Type Detection and Data Quality Assessment [0.6] 本研究では,属性に基づくセマンティック型検出とデータ品質評価を中心とした,革新的な手法を提案する。
属性ラベル内の意味情報とルールベースの分析と包括的フォーマット・省略辞書を組み合わせることで,本手法は実用的な意味型分類システムを導入する。
最先端のセマンティック型検出システムであるSherlockとの比較分析により,本手法の利点が示された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 09:22:44 GMT)
SDA-GRIN for Adaptive Spatial-Temporal Multivariate Time Series Imputation [0.5] 空間的および時間的依存関係は、欠落したサンプルをインプットするために利用できます。
本研究では,空間依存の動的変化を捉えることのできる空間動的グラフリカレントインプットネットワーク(SDA-GRIN)を提案する。
実世界の4つのデータセット上でSDA-GRINを評価する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:32:08 GMT)
Local Measurement Scheme of Gravitational Curvature using Atom Interferometers [0.4] 本稿では、2つの共位置干渉計の差分信号が重力ポテンシャルの曲率に比例した位相シフトを逸脱する手法を提案する。
我々は、ハノーファーVLBAI施設の文脈で、そのような位置のグラディオメトリック干渉計を数値シミュレーションする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:37:57 GMT)
Why Would You Suggest That? Human Trust in Language Model Responses [0.4] フレーミングと説明の存在がユーザ信頼とモデルパフォーマンスにどのように影響するかを分析する。
今後の研究は、人間と機械のチームリングシステムにおける信頼度の評価を、より深く掘り下げることを目的としている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 16:46:00 GMT)
Enhanced Transformer architecture for in-context learning of dynamical systems [0.4] 本稿では,従来のメタモデリングフレームワークを3つの重要な革新を通じて強化する。
これらの修正の有効性は、Wiener-Hammerstein系クラスに焦点をあてた数値的な例を通して示される。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:05:15 GMT)
Reinforcement learning for anisotropic p-adaptation and error estimation in high-order solvers [0.4] 強化学習(RL)を用いた高次h/pにおける異方性p適応の自動化と最適化のための新しい手法を提案する。
我々は,シミュレーションを行う際の最小限のオーバーコストを示す,主解法から切り離されたオフライントレーニング手法を開発した。
我々は、局所的な離散化誤差の定量化を可能にする、安価なRLベースの誤差推定手法を導出する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:49:30 GMT)
On the feasibility of quantum teleportation protocols implemented with Silicon devices [0.3] シリコンベースのスピン量子ビット(量子ビット)は、スケーラブルな量子コンピューティングの候補として期待されている。
本稿では,シリコンの電気的に定義された量子ドット構造上に実装された絡み合いに基づく量子情報応用の計算的検討を行う。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 13:55:40 GMT)
GRVFL-MV: Graph Random Vector Functional Link Based on Multi-View Learning [0.3] マルチビュー学習(GRVFL-MV)モデルに基づく新しいグラフランダムベクトル関数リンクを提案する。
提案モデルは,マルチビュー学習(MVL)の概念を取り入れて,複数の視点で学習する。
また、グラフ埋め込み(GE)フレームワークを使用して、すべてのビューの幾何学的性質も取り入れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:05:45 GMT)
Rapid optimization in high dimensional space by deep kernel learning augmented genetic algorithms [0.3] Deep Kernel Learning (DKL)は、選択された候補構造の空間を効率的にナビゲートするが、生成能力に欠ける。
本研究は, DKLをベースとしたサロゲートモデルにおいて, GAの生成能を両立させ, 新しい候補を創出するアプローチを提案する。
本稿では,フェロSIMモデルの最適化によるこのアプローチの有効性を実証し,多様な課題に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:18:17 GMT)
Do Not Trust Power Management: A Survey on Internal Energy-based Attacks Circumventing Trusted Execution Environments Security Properties [0.2] 2015年以降、エネルギー管理機構を利用したソフトウェア対応のハードウェア攻撃が出現している。
彼らの目標は、TEEのセキュリティ保証をバイパスし、暗号鍵のような機密情報を公開することである。
本稿では,これらの攻撃の包括的知識調査と文献対策の評価について述べる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 12:47:26 GMT)
The Potential of Citizen Platforms for Requirements Engineering of Large Socio-Technical Software Systems [0.2] 参加型市民プラットフォーム(Participatory citizen platform)は、政策立案と熟考型民主主義に市民をデジタル的により深く関与させる革新的なソリューションである。
本稿では,要件工学と組み合わせたプラットフォームについて論じ,ソフトウェア工学の文脈におけるパイロット研究の道を開く。
この論文は、公共セクターにおける大規模社会技術ソフトウェアシステムの研究にも貢献する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:18:26 GMT)
Bayes-CATSI: A variational Bayesian deep learning framework for medical time series data imputation [0.2] ベイジアン文脈対応時系列計算(Bayes-CATSI)フレームワークを提案する。
脳電図(EEG)、脳電図(EOG)、筋電図(EMG)、心電図(EKG)の時系列を考察する。
その結果,ベイズCATSIは不確実な定量化を提供するだけでなく,CATSIモデルよりも優れた計算性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:55:55 GMT)
Bayes-CATSI: A variational Bayesian approach for medical time series data imputation [0.2] ベイジアン文脈対応時系列計算(Bayes-CATSI)フレームワークを提案する。
脳電図(EEG)、脳電図(EOG)、筋電図(EMG)、心電図(EKG)の時系列を考察する。
その結果,ベイズCATSIは不確実な定量化を提供するだけでなく,CATSIモデルよりも優れた計算性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:55:55 GMT)
Dephasing in Fluxonium Qubits from Coherent Quantum Phase Slips [0.2] JJアレイスーパーインダクタからなる超伝導量子ビットでは、アレイ内の位相スリップがデコヒーレンスを引き起こす。
我々は、コヒーレント量子位相スリップ(CQPS)がクォービット周波数を摂動的に変化させることを示し、従って配列列島の電荷ノイズが劣化を引き起こすことを示した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:17:54 GMT)
Engineering quantum states with neutral atoms [0.2] QuEra Computingが開発したアナログ量子シミュレーションプラットフォームであるAquilaは、256個の中性原子の位置とコヒーレントな進化の制御をサポートする。
本研究では,ブロック状態から遠く離れたベル状態の絡み合いを生成するアナログ量子シミュレータのために設計された新しい実験プロトコルについて述べる。
また,測定結果の忠実度向上における読み出し誤差軽減手法の有効性についても検討した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:38:13 GMT)
Towards Linguistically-Aware and Language-Independent Tokenization for Large Language Models (LLMs) [0.1] 本稿では,最先端の大規模言語モデル(LLM)が採用するトークン化手法について述べる。
本研究は,これらのモデル間で観測されるトークン化の多様性を評価し,サブワードトークン化における言語表現の課題について検討する。
本研究の目的は、この領域以降のAIサービスの開発において、一般化可能な国際化(I18N)の実践を促進することである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:18:29 GMT)
Identifying Three-Dimensional Radiative Patterns Associated with Early Tropical Cyclone Intensification [0.1] 雲の放射フィードバックは初期の熱帯性サイクロンの増強に影響を及ぼす。
そこで我々は, 実数値シミュレーションTCの表面強度と放射の隠れた関係を学習するための線形変分デコーダ (VED) を提案する。
抽出した3次元放射構造を綿密に調べたところ, 内心深部対流と浅部雲からの長波放射強制力は強度に寄与することが示唆された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:44:54 GMT)
ROS2-Based Simulation Framework for Cyberphysical Security Analysis of UAVs [0.1] 本稿では,サイバー物理的セキュリティ攻撃と防衛テストの必要性に合わせた,無人航空機(UAV)の新たなシミュレータを提案する。
私たちのフレームワークには、モーションプランナ、コントローラ、通信モデル、アタックモデルが組み込まれています。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:23:54 GMT)
Vulnerability Detection via Topological Analysis of Attention Maps [0.0] 本研究では,トポロジカルデータ解析(TDA)のツールを用いた脆弱性検出手法を提案する。
その結果,従来の機械学習(ML)技術は,これらの注意行列から抽出したトポロジ的特徴を訓練することで,事前学習言語モデル(LLM)と競争的に動作できることが判明した。
これは、永続的ホモロジーを含むTDAツールが、脆弱性を特定するために重要な意味情報を効果的にキャプチャできることを示している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:40:11 GMT)
Unadjusted Hamiltonian MCMC with Stratified Monte Carlo Time Integration [0.0] 非調整ハミルトンモンテカルロ(uHMC)に対するランダム化時間積分器の提案
調整可能な乱数時間も用意されている。
uHMCアルゴリズムとVerlet時間積分の複雑さは一般に$Oleft((d/K)1/2 (L/K)2 varepsilon-1 logである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:01:35 GMT)
Trotterless Simulation of Open Quantum Systems for NISQ Quantum Devices [0.0] システムのクラウス演算子系列表現の導出に基づく新しいシミュレーション手法を提案する。
本手法は時間に依存しない深さの回路を生成するオープン量子系のクラスを同定する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:37:49 GMT)
Topology-Informed Machine Learning for Efficient Prediction of Solid Oxide Fuel Cell Electrode Polarization [0.0] 機械学習は固体酸化物燃料電池電極の研究と開発を迅速化するための強力な計算ツールとして登場した。
本稿では,計算トポロジから導出した永続化表現を利用した新しい手法を提案する。
人工ニューラルネットワークは、固体酸化物燃料電池電極の偏極曲線を正確に予測することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:00:37 GMT)
Topological Discrimination of Steep to Supersteep Gap as Evidence of Tunneling in Adiabatic Quantum Processes [0.0] 量子アニール過程の速度を制限するギャップは、3つの正則なモルフォロジーを必要とすることが示されている。
境界線に比例した下肢尾の位置は、超音速と急激な差別を許容する。
ツバメ尾境界相互作用の欠如は、軽度のギャップを特徴づける。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 04:36:55 GMT)
Tool-Assisted Learning of Computational Reductions [0.0] 我々は,削減学習が教育支援システムによってどのように支援されるか,という概念を概説する。
本稿では,そのようなシステムにおける概念の実装,具体的な Web ベースでインタラクティブな学習教材について紹介し,その経験を報告する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:35:24 GMT)
Time-Reversal Symmetry in RDMFT and pCCD with Complex-Valued Orbitals [0.0] 複素解は非動的電子相関効果が発音されるときにエネルギーを低下させることを示す。
具体的には、非動的電子相関効果が発音されるとき、複素解はエネルギーを低下させる。
N-representability violations(N-representability violations)によって引き起こされるこれらの不安定性と可能な問題を説明・議論するための数値的な例を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:22:03 GMT)
Thermodynamics of the quantum Mpemba effect [0.0] エネルギー固有基底において、状態が対角状態に変換された場合、指数的な平衡へのスピードアップが常に起こることを示す。
変換状態がより高い非平衡自由エネルギーを持つとき、熱力学的推論を用いて、これはテクスチゲヌイン量子Mpemba効果であると主張する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:01:12 GMT)
The influence of coordinated behavior on toxicity [0.0] 協調行動(CB)は、オンライン談話の活用や操作の戦術として現れる。
この研究は、X(以前はTwitterと呼ばれていた)におけるCBと有毒な会話の関係について考察する。
2019年イギリス総選挙に先立ち、100万人のユーザーがツイートした1100万件のデータセットを用いて、CBを表示するユーザーが通常有害なコンテンツを拡散していることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:25:02 GMT)
Team MTS @ AutoMin 2021: An Overview of Existing Summarization Approaches and Comparison to Unsupervised Summarization Techniques [0.0] 本稿では,クラスタリングに基づく教師なし要約手法を提案し,実生活記録上で動作可能な適応型音声認識ブロックを含むパイプラインを提供する。
提案手法は,ルージュ1,ルージュ2,ルージュ2,ルージュLの0.21,0.02,0.2,ルージュ1,ルージュ2,ルージュL,アデクシー,文法的正当性およびフラエンシ値0.0180,0.035,0.098,1.857,2.304,1.911を用いて,自動ミツニングタスクにおける事前学習の要約モデルより優れている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:23:50 GMT)
Statistical analysis of quantum trajectories in dissipative Landau-Zener model [0.0] マルコフ過程を行うランダウ・ツェナー・ハミルトニアンを持つ2レベル系における量子ジャンプの統計について述べる。
また, 浴槽温度, 環境との結合強度, スピンカップリング方向が量子ジャンプの統計に与える影響を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:41:08 GMT)
Specification Slicing for VDM-SL [0.0] 本稿では,プログラムスライシングに基づいて,VDM-SLの仕様スライシングを定義する。
VDM-SL のスライサは ViennaTalk で実装されており、ブラウザや VDM-SL 仕様を記述するデバッガで使用することができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:35:01 GMT)
SoundSignature: What Type of Music Do You Like? [0.0] SoundSignatureは、ユーザーのお気に入りの曲を分析するためにカスタムのOpenAIアシスタントを統合する音楽アプリケーションである。
このシステムには最先端の音楽情報検索(MIR)Pythonパッケージが組み込まれており、抽出された音響的・音楽的特徴と、アシスタントのアーティストやバンドに関する広範な知識を組み合わせている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:40:45 GMT)
Simulating Neutron Scattering on an Analog Quantum Processor [0.0] 本稿では,QuEraのAquilaプロセッサ上での中性子散乱をシミュレーションする手法を提案する。
ハードウェア上でのプロシージャの性能に関する数値シミュレーションと実験結果を提供する。
また,両部の絡み合いを実験的に確認した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:39:29 GMT)
Scalable construction of hybrid quantum photonic cavities [0.0] 本稿では、2つの異種光学材料間の選択波長で微調整可能なPhCキャビティを生成する概念を紹介する。
この空洞は、加工が容易な材料の上に、簡単な導波路ジオメトリでハード・トゥ・プロセス材料を突き刺して形成されている。
キャビティ結合ダイヤモンドカラーセンタの配列に基づく多重量子リピータの特に困難な設計問題に対する我々の概念をシミュレートする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:36:39 GMT)
Robustness investigation of cross-validation based quality measures for model assessment [0.0] 機械学習モデルの予測品質は、クロスバリデーションアプローチに基づいて評価される。
提案手法は,モデル予測における説明された変動量の定量化である。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:41:36 GMT)
Rethinking Selection in Generational Genetic Algorithms to Solve Combinatorial Optimization Problems: An Upper Bound-based Parent Selection Strategy for Recombination [0.0] 本研究は、アッパーバウンドベース親選択(UBS)と呼ばれる世代GA設定における組換え決定論的親選択戦略を提案する。
具体的には、UBS戦略の一環として、MABフレームワークと修正 UCB1アルゴリズムを用いて親選択問題を定式化し、探索と利用を管理する。
従来の選択戦略と比較してUBSの有効性を示すため,チームオリエンテーリングと2次割り当ての2つのNPハード最適化問題について検討した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:56:34 GMT)
Research on short-term load forecasting model based on VMD and IPSO-ELM [0.0] 本研究では,変分モード分解(VMD)と改善粒子群最適化(IPSO)アルゴリズムを統合し,エクストリーム学習マシン(ELM)を最適化する高度な統合予測手法を提案する。
シミュレーションの結果,提案手法は従来のELM法, PSO-ELM法, PSO-ELM法と比較して予測精度と収束速度を著しく向上することがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:20:33 GMT)
Question-Answering System for Bangla: Fine-tuning BERT-Bangla for a Closed Domain [0.0] 閉領域における細調整BERT-Banglaモデルを用いたベンガル語問答システムの開発について述べる。
このシステムは、キュレートされたデータから2500の質問応答対を抽出し、評価した。
この結果は,ドメイン固有なベンガル質問答えシステムに有望な可能性を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:57:08 GMT)
Quantum optimization with globally driven neutral atom arrays [0.0] 任意の接続性を持つ最適化問題をスケーラブルに符号化する手法を提案する。
これらの補助原子は、問題固有のプログラミングと不要な効果の緩和の両方に同時に使用できることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:09:10 GMT)
Quantum of action in entangled relativity [0.0] エンタングル付き相対性理論は、普遍次元定数の観点からは一般相対性理論よりも経済的であることを示す。
特に、$hbar$は、このフレームワークにおいて$G$に比例する。
我々は、このユニークな予測は、将来観察的に調査される可能性があると論じる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:00:49 GMT)
Quantum fractional revival governed by adjacency matrix Hamiltonian in unitary Cayley graphs [0.0] 我々は、隣接行列ハミルトンを用いたユニタリケイリーグラフにおける量子分数復元の存在を証明した。
量子分数復元は量子エンタングルメントに類似している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:47:43 GMT)
Quantum circuit complexity for linearly polarised light [0.0] オープンシステムに拡張する量子回路の複雑さの形式を探求する。
具体的には、混合量子状態がゲート列と相互作用する際のダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:55:06 GMT)
Quantum algorithm for the advection-diffusion equation and the Koopman-von Neumann approach to nonlinear dynamical systems [0.0] 非線形力学のクープマン・ヴォン・ノイマン定式化において, 対流拡散方程式と非単位離散化版の両方をシミュレートする明示的アルゴリズムを提案する。
提案アルゴリズムは普遍的であり、線形微分方程式と非線形微分方程式の幅広いクラスをモデル化するのに利用できる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 23:58:12 GMT)
Quantum Effects in Ion Transport: A Thermodynamic Resource Theory Approach [0.0] 非マルコビアン性は、イオン輸送過程の収量と効率を高める重要な量子資源として機能することを示す。
対照的に、イオン輸送タンパク質のエネルギー状態の重畳として表される量子コヒーレンスは、これらの指標を減少させるが、イオンチャネルとイオンポンプの区別において重要な役割を果たす。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:54:13 GMT)
Quantum Approximate Optimization Algorithm and Quantum-enhanced Markov Chain Monte Carlo: A Hybrid Approach to Data Assimilation in 4DVAR [0.0] 4次元変分データ同化(4D VAR)における計算課題に取り組むための新しいハイブリッド量子古典的フレームワークを提案する。
提案手法である量子変分粒子フィルタ(QVPF)は,QAOAを用いて粒子提案を最適化し,QMCMCを用いて効率よく粒子重みを計算し,再サンプリングを行い,計算負荷を低減しながら収束を加速する。
ハイブリッドモデルは量子アルゴリズムを変分粒子フィルタに統合することで精度を高め、特に気候モデリング、宇宙天気予報、防衛への応用に適している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:37:35 GMT)
Programmable time-frequency mode-sorting of single photons with a multi-output quantum pulse gate [0.0] 多出力量子パルスゲートに基づく単一光子に対する高次元モードソータを実証する。
この装置は、量子情報応用の実用的な実現を容易にする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:07:02 GMT)
ProcBench: Benchmark for Multi-Step Reasoning and Following Procedure [0.0] 本稿では,多段階推論の直接評価という,推論能力の特定の側面に焦点を当てたベンチマークを提案する。
我々のデータセットは、明示的な指示とそれに対応する質問のペアで構成されており、質問の解決に必要な手順は、その指示の中で完全に詳細に記述されている。
各ステップで様々なステップの解決と応答評価を必要とする問題を構築することにより、最先端のLCMの指示に従う能力の徹底的な評価を可能にする。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:21:24 GMT)
Positive maps and Entanglement Witnesses in different dimensions [0.0] エンタングルメント・ウィットネスに基づく一般密度行列におけるエンタングルメント検出のためのクローズドフォーム基準を導出する。
非単体写像に対応する非単体 EW が単体 EW よりも強力でないことを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:14:56 GMT)
Permutation-Invariant Quantum Codes with Transversal Generalized Phase Gates [0.0] 非付加的な符号は安定化器符号より優れていることを示す。
より少ない量子ビットを用いて$T$ゲートを実装した置換不変量子符号を構築する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:31:13 GMT)
Parametric approximation as open quantum systems problem [0.0] 散逸を伴うJaynes-Cummingsモデルを考えると、この場は減少を伴うパラメトリック近似に近い状態にあると仮定する。
パラメトリック近似に対する非単項補正とそれに対する動的ラムシフトの寄与を得る。
また, 劣化後の初期マルコフ的非マルコフ的挙動は, レーザー誘起密度行列の研磨により動的に寄与することを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:54:17 GMT)
Optimal Transport for $ε$-Contaminated Credal Sets [0.0] 我々は、$epsilon$-contamination の場合、Monge と Kantorovich の最適輸送問題の低い確率バージョンは一致しないことを示した。
機械学習と人工知能への本研究の応用についても論じる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:34:52 GMT)
On the Fragility of Active Learners for Text Classification [0.0] アクティブラーニング(AL)技術は、学習に最も価値のあるインスタンスを反復的に選択することで、ラベル付け予算を最適に活用する。
データセットに最も適したALアルゴリズムを選択するための所定の基準はない。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 05:56:18 GMT)
ORAssistant: A Custom RAG-based Conversational Assistant for OpenROAD [0.0] Retrieval-Augmented Generation(RAG)に基づくOpenROADの対話アシスタントORAsistant
ORAsistantは、一般的なユーザクエリにコンテキスト固有の応答を提供することで、RTL-GDSIIからOpenROADフローのユーザエクスペリエンスを改善することを目的としている。
ORAsistantの構築とテストには,基本LLMモデルとしてGoogle Geminiを使用します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:22:58 GMT)
Modeling and Analysis of Spatial and Temporal Land Clutter Statistics in SAR Imaging Based on MSTAR Data [0.0] 地塊の空間的および時間的特性について検討した。
適合性テストは、KL(Kullback-Leibler)のディバージェンス(Diversergence)測定値に基づいている。
解析の総合的な検証は、移動目標獲得・認識(MSTAR)データセットを利用して行われる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:47:49 GMT)
Mesh-Informed Reduced Order Models for Aneurysm Rupture Risk Prediction [0.0] グラフニューラルネットワーク(GNN)は、有限体積(FV)離散化によって得られるメッシュの自然なグラフ構造を利用する。
実験的な検証フレームワークは有望な結果をもたらし,その方法が次元の呪いを克服する有効な代替手段であることを確認した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:39:15 GMT)
Mathematical Formalism for Memory Compression in Selective State Space Models [0.0] 状態空間モデル(SSM)は、シーケンスデータの長距離依存性をモデル化するための強力なフレームワークとして登場した。
我々は、選択状態空間モデルにおけるメモリ圧縮を理解するための厳密な数学的枠組みを開発する。
選択型SSMは従来のRNNモデルと比較してメモリ効率と処理速度を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 05:45:48 GMT)
Management of high-tech companies in conditions of import substitution [0.0] この記事では、輸入代替の文脈で、ロシア経済のハイテクセクターの発展を分析する。
航空産業企業のための統合情報空間構築の課題について考察する。
投資過熱産業が特定され、市場補正やプロジェクト資産のバランスの取れた状態への返還に関する勧告が与えられる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:11:22 GMT)
M2AR: A Web-based Modeling Environment for the Augmented Reality Workflow Modeling Language [0.0] M2ARは新しいWebベースの2次元および3次元モデリング環境であり、プログラミング知識を必要とせずに拡張現実アプリケーションのモデリングと実行を可能にする。
このプラットフォームは、3D JavaScriptライブラリと混合現実没入型Web標準WebXRに基づいている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:52:46 GMT)
Looking into Concept Explanation Methods for Diabetic Retinopathy Classification [0.0] 基礎画像を用いて糖尿病網膜症に対する糖尿病患者全員のスクリーニングは不可能である。
深層学習は、眼底画像の自動解析とグルーピングの素晴らしい結果を示している。
説明可能な人工知能手法は、ディープニューラルネットワークを説明するために応用できる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:01:37 GMT)
Logistic Regression makes small LLMs strong and explainable "tens-of-shot" classifiers [0.0] 大規模な商用モデルではなく,小規模でローカルな生成言語モデルを使用することのメリットを,ユーザが享受できることが示される。
プライバシ、可用性、コスト、説明可能性といったこれらのアドバンテージは、商用アプリケーションにおいても、AIの広範な民主化においても重要です。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:24:59 GMT)
Leveraging Fundamental Analysis for Stock Trend Prediction for Profit [0.0] 本稿では,機械学習モデル,Long Short-Term Memory (LSTM), 1次元畳み込みニューラルネットワーク (1D CNN) およびロジスティック回帰 (LR) を用いて,基本解析に基づく株価トレンドの予測を行う。
我々は、2つの予測タスク、すなわち年次株価差(ASPD)と現在の株価と本質的価値(CSPDIV)の差を定式化するために、主要な金融比率とディスクキャッシュフロー(DCF)モデルを採用する。
この結果、LRモデルはCNNおよびLSTMモデルより優れており、ASPDの平均テスト精度は74.66%、DCSPIVは72.85%であることがわかった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 20:36:19 GMT)
Learning to steer with Brownian noise [0.0] 本稿では,境界速度追従問題のエルゴード版について考察し,意思決定者が基礎となるシステムパラメータの知識を欠いており,同時に制御しながら学習しなければならないことを仮定する。
本研究では,移動平均に基づくアルゴリズムを提案し,統計的手法と制御理論を統合するための枠組みを開発する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:19:34 GMT)
LLMProxy: Reducing Cost to Access Large Language Models [0.0] コスト削減の最適化を明示的にサポートする大規模言語モデルのプロキシを事例として挙げる。
LLM Proxyを設計し、モデル選択、コンテキスト管理、キャッシュの3つの主要な最適化をサポートする。
ケーススタディでは、LLM Proxyを使用して、ユーザに豊富な機能セットを提供するWhatsAppベースのQ&Aサービスを実装しています。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 15:23:28 GMT)
LARA: Linguistic-Adaptive Retrieval-Augmentation for Multi-Turn Intent Classification [0.0] LARAは言語適応型検索・拡張フレームワークで、6言語にわたるマルチターン分類タスクの精度を高める。
実験により,LARAは多ターン目的分類タスクにおける最先端性能を実現することが示された。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 03:21:09 GMT)
J-coupling NMR Spectroscopy with Nitrogen Vacancy Centers at High Fields [0.0] 我々は、高磁場下でNV中心を持つ同核およびヘテロ核のケースにおいて、Jカップリングにアクセスするためのプロトコルを提案する。
我々のプロトコルは、高分解能のJカップリング機能のみを含む明確なスペクトルへと導かれる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:36:59 GMT)
Investigating pump harmonics generation in a SNAIL-based Traveling Wave Parametric Amplifier [0.0] トラベリングウェーブパラメトリック増幅器(TWPA)は、非常に望ましい量子制限特性とブロードバンド特性のために弱いマイクロ波信号を含む実験に広く用いられている。
しかし、TWPAsのブロードバンド特性は、増幅性能を低下させる可能性のあるハーモニクス生成のような急激な非線形過程の活性化を認めるという欠点がある。
そこで本研究では,SNAIL(Superconducting Asymmetric Inductive Element)を用いたJosephson TWPAデバイスを,ポンプの第2および第3高調波の発生とともに増幅挙動に着目して実験的に検討した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:38:51 GMT)
Interpolation-Free Deep Learning for Meteorological Downscaling on Unaligned Grids Across Multiple Domains with Application to Wind Power [0.0] 風力発電は加速し、その効率性を確保するためには信頼性の高い風力確率予測が不可欠である。
数値風速予測モデルは計算に費用がかかるため、全てのメソスケール風速を捉えるには大きすぎる解像度で確率予測が生成される。
統計的ダウンスケーリングは、低分解能(LR)変数から高分解能(HR)気象変数への写像を学習することで、計算コストの低い実行可能な解を提供する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:04:40 GMT)
Interplay between external driving, dissipation and collective effects in the Markovian and non-Markovian regimes [0.0] 本研究では、ボゾン場に同時に結合した駆動光学系における開系現象について検討する。
フォトニック結晶に結合したマイクロキャビティの線形系について、環境相互作用と外部制御が適用されたコヒーレントドライブに有意な非マルコフ補正を引き起こすことを解析的に示す。
非線型性の影響を解析し、正確な擬モード解に対してベンチマークし、マルコフ体制の確立されたマスター方程式と比較する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 10:18:55 GMT)
Integrating problem structuring methods with formal design theory: collective water management policy design in Tunisia [0.0] 本稿では,問題構造化手法(PSM)と政策知識,概念,提案手法(P-KCP)を組み合わせることで,政策設計に革新的なアプローチを提案する。
この研究は、認知地図とバリューツリーを利用して、新しい地下水管理の実践を創出することを目的としている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:55:43 GMT)
Informed deep hierarchical classification: a non-standard analysis inspired approach [0.0] 出力層の前に配置された特定のプロジェクション演算子を備えた多出力ディープニューラルネットワークで構成されている。
このようなアーキテクチャの設計は、LH-DNN(Lexicographic Hybrid Deep Neural Network)と呼ばれ、異なる研究分野と非常に離れた研究分野のツールを組み合わせることで実現されている。
アプローチの有効性を評価するために、階層的な分類タスクに適した畳み込みニューラルネットワークであるB-CNNと比較する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:46:24 GMT)
Information scrambling in quantum-walks: discrete-time formulation of Krylov complexity [0.0] 離散時間量子ウォークにおける情報スクランブルについて検討する。
我々は,時間外順序付き相関器 (OTOC) とK-複雑度を情報スクランブルの探索として検討する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 22:29:02 GMT)
Inference with K-means [0.0] k-meansは、kセントロイドをランダムに割り当て、データポイントを最も近いセントロイドに割り当て、割り当てられたポイントの平均に基づいてセントロイドを更新する反復的クラスタリングアルゴリズムである。
オンライン平衡k平均手法を用いて,クラスタデータ分布から得られるデータポイントの最後の成分の予測について検討した。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:51:58 GMT)
Improving Mapper's Robustness by Varying Resolution According to Lens-Space Density [0.0] 本研究では,意味空間全体にわたる単一解像度スケールの仮定を除去するMapperアルゴリズムの改良を提案する。
これによりパラメータの選択が簡単になり、特にMapperで使用されるMorse関数$f$で、高度に可変なローカル密度を持つデータセットに対してである。
自然仮説によっては、Mapper が出力するグラフは、データの Rips 複合体の Reeb グラフとボトルネック距離で収束するが、通常の Mapper の被覆よりも位相的特徴を捉えることができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:51:44 GMT)
Implementation and Learning of Quantum Hidden Markov Models [0.0] 量子隠れマルコフモデル(QHMM)に対する一元的パラメータ化と効率的な学習アルゴリズムを提案する。
量子チャネルのよりリッチなダイナミクスを活用することで、従来のものに比べて量子発生器の効率が向上することを示した。
我々は,任意のQHMMを,中間回路計測による量子回路を用いて効率的に実装し,シミュレーションすることができることを示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:23:48 GMT)
Impact of Bivariate Gaussian Potentials on Quantum Walks for Spatial Search [0.0] 空間探索問題における量子ウォークの力学に対するポテンシャル場の影響について検討する。
その結果,標準偏差が小さい場合,量子ウォークはAKRアルゴリズムを密接に反映するが,標準偏差が大きくなるにつれて成功確率が急速に低下することを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 09:44:44 GMT)
Image First or Text First? Optimising the Sequencing of Modalities in Large Language Model Prompting and Reasoning Tasks [0.0] 本稿では,マルチモーダル内における画像とテキストのシークエンシングが,大規模言語モデル(LLM)の推論性能にどのように影響するかを検討する。
単一の画像を含む単純なタスクに対して、モダリティシークエンシングは精度に明確な影響を及ぼした。
複数の画像と複雑な推論ステップを含むより複雑なタスクでは、シークエンシングの効果が減少し、おそらくタスクの認知的要求が増大したためである。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:55:15 GMT)
HyperCMR: Enhanced Multi-Contrast CMR Reconstruction with Eagle Loss [0.0] HyperCMRは、心臓磁気共鳴(CMR)画像の再構築を促進するために設計された新しいフレームワークである。
CMRxRecon2024チャレンジデータセットで実施された実験は、HyperCMRがベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:29:38 GMT)
Historical Ink: 19th Century Latin American Spanish Newspaper Corpus with LLM OCR Correction [0.0] 19世紀のラテンアメリカの新聞のテキストのデータセットを導入し、この地域の歴史的・言語学的分析のための特別なコーパスにおける重要なギャップに対処している。
デジタルコーパスにおけるOCR誤り訂正と言語表面形状検出にLarge Language Modelを利用するフレキシブルなフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 18:43:47 GMT)
Hierarchical Ensemble-Based Feature Selection for Time Series Forecasting [0.0] 非定常性のための階層的積み重ねに基づく特徴選択のための新しいアンサンブルアプローチを導入する。
当社のアプローチでは,階層構造を用いた機能間の共依存を利用しています。
このアプローチの有効性は、合成およびよく知られた実生活データセット上で実証される。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 21:03:29 GMT)
Green vehicle routing problem that jointly optimizes delivery speed and routing based on the characteristics of electric vehicles [0.0] 本稿では,実車を用いたエネルギー消費モデルを構築した。
エネルギー消費モデルはまた、車両のスタート/ストップ、速度、距離、および負荷がエネルギー消費に与える影響も含んでいる。
改良された適応遺伝的アルゴリズムは、最もエネルギー効率のよい経路を解くために用いられる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:08:15 GMT)
Foundational Issues in Dynamical Casimir Effect and Analogue Features in Cosmological Particle Creation [0.0] ブラックホールからのホーキング放射のアナログ源としての移動鏡は広く研究されている。
このエッセイは、湾曲した時空における量子場理論の厳密さと完全性の一部を伝えることを目的としている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 06:32:35 GMT)
Fault-tolerant simulation of Lattice Gauge Theories with gauge covariant codes [0.0] 量子誤り訂正と格子ゲージ理論(LGT)の間には、強くて簡単な接続が存在することを示す。
このゲージ共変符号上の論理演算を同定し、対応するハミルトニアンがこれらの論理演算の項で表現できることを示す。
積公式と量子化法の両方を用いて、ゲージ共変符号内でハミルトニアンのフォールトトレラント時間進化を行う方法を示す。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 08:56:09 GMT)
Fast, tunable, high fidelity cZ-gates between superconducting qubits with parametric microwave control of ZZ-coupling [0.0] 超伝導量子ビットを用いた高フレキシブルパラメトリックカップリング方式を提案する。
完全に統合された2Dオンチップ・カプラの設計は、弱めの磁束調整しかできない。
ベンチマークの結果、パラメトリックSWAP c$Z$ gate は、平均忠実度が 99.44pm 0.09$% で、ゲート持続時間は 70ns であることがわかった。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:40:45 GMT)
Exactly solvable quantum spin-glass model with 1RSB-fullRSB transition [0.0] 横平均場型ランダム磁石を用いた新しい量子スピングラスモデル,シェリントン・カークパトリックモデルを導入する。
パラメータ領域全体の自由エネルギーの正確な表現を厳密に導出する。
得られた正確な解は、低温における1RSB-fullRSB転移の存在を示唆する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 01:47:38 GMT)
Exact Quantum Virial Expansion for the Optical Response of Doped Two-Dimensional Semiconductors [0.0] ドープ2次元半導体の光応答に対する量子仮想展開について述べる。
以下に示すように、これは高温または低ドーピング状態における摂動論的に正確な理論である。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 06:52:28 GMT)
Entangling power of spin-j systems: a geometrical approach [0.0] 高いエンタングリング能力を持つユニタリゲートは、そのエンタングリング能力のためにいくつかの量子強化技術に関係している。
スピン系の絡み合う力は、SU(2)不変量によって与えられる成分を持つベクトル間の内部積として再構成することで解析する。
極端ユニタリゲートは、ある状態のフシミ関数の凸結合と結びついているのと同様、高い回転対称性を持つ絡み合い分布を示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:28:55 GMT)
Entanglement-induced provable and robust quantum learning advantages [0.0] 我々は、表現性、推論速度、トレーニング効率の観点から、ノイズロストで無条件の量子学習の利点を厳格に確立する。
我々の証明は情報理論であり、この優位性の起源を示唆している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 02:39:07 GMT)
Entanglement-enhanced quantum sensing via optimal global control [0.0] 共役キャビティモードに結合した$N$スピンの対称ディック部分空間における任意の絡み合った状態を生成するための決定論的プロトコルを提案する。
この研究は、キャビティ内の冷たい閉じ込められた原子と絡み合うエンハンスドセンシングへの道を開き、また、閉じ込められたイオンの実験にも関係している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:59:08 GMT)
Entanglement-enhanced quantum sensing via optimal global control [0.0] 共役キャビティモードに結合した$N$スピンの対称ディック部分空間における任意の絡み合った状態を生成するための決定論的プロトコルを提案する。
この研究は、キャビティ内の冷たい閉じ込められた原子と絡み合うエンハンスドセンシングへの道を開き、また、閉じ込められたイオンの実験にも関係している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:59:08 GMT)
Entanglement in dual unitary quantum circuits with impurities [0.0] 不純物に摂動する量子回路における絡み合いのダイナミクスについて検討する。
不純物の有限距離内における半無限部分系と有限部分系の両方に対する絡み合いエントロピーを計算する。
このような非単調な振る舞いは、ランダムカオス回路でも生じうることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:57:01 GMT)
Entanglement asymmetry in conformal field theory and holography [0.0] エンタングルメント非対称性(英: entanglement asymmetric)は、量子サブシステムにおける対称性の破れの尺度である。
U(1)対称性を持つ共形場の量子論において、励起的「コヒーレント状態」のクラスの非対称性を研究する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:33:49 GMT)
Empowering Domain-Specific Language Models with Graph-Oriented Databases: A Paradigm Shift in Performance and Model Maintenance [0.0] 私たちの作業は、特定のアプリケーションドメインに固有の、大量の短いテキストドキュメントを管理し、処理する必要があることによるものです。
ドメイン固有の知識と専門知識を活用することで、このアプローチは、これらのドメイン内の実データを形成することを目的としています。
我々の研究は、ドメイン固有言語モデルとグラフ指向データベースのパートナーシップの変革の可能性を強調します。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:02:09 GMT)
Digital-analog quantum genetic algorithm using Rydberg-atom arrays [0.0] デジタルアナログ量子コンピューティング(DAQC)は、デジタルゲートとアナログ演算を組み合わせる。
Rydberg-atom emulator を用いたDAQCフレームワーク内の量子遺伝的アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 07:18:36 GMT)
Deterministic generation of photonic entangled states using decoherence-free subspaces [0.0] 我々は、光の量子状態の決定論的生成のための資源として、物質の集合状態を用いることを提案する。
発光体間の光子による相互作用は、明るい状態と暗い状態の出現をもたらす。
これらのゲートのシーケンシャルな応用は、フォトニックな絡み合った状態を生み出すことを実証する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:22:26 GMT)
Deep-learning-based continuous attacks on quantum key distribution protocols [0.0] ニューラルネットのパターン認識能力と連続計測を併用した新たな攻撃手法を設計する。
BB84プロトコルに適用した場合、スパイが量子通信チャネルに送信された量子ビットの状態に関する重要な情報を抽出しながらも、我々の攻撃に気づくことが困難であることを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:57:10 GMT)
CyberCortex.AI: An AI-based Operating System for Autonomous Robotics and Complex Automation [0.0] 我々は、異種AIベースのロボティクスと複雑な自動化アプリケーションを実現するために設計されたロボットOSであるCyberCortex AIを紹介する。
CyberCortex AIは、分散化された分散OSで、ロボットが互いに通信し、クラウドの高性能コンピュータと通信することを可能にする。
ロボットのセンサーと制御データは、その後ロボットにデプロイされるAIアルゴリズムのトレーニングを目的として、HPCシステムに向けてストリームされる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:32:08 GMT)
CyberCortex.AI: An AI-based Operating System for Autonomous Robotics and Complex Automation [0.0] 我々は、異種AIベースのロボティクスと複雑な自動化アプリケーションを実現するために設計されたロボットOSであるCyberCortex AIを紹介する。
CyberCortex AIは、分散化された分散OSで、ロボットが互いに通信し、クラウドの高性能コンピュータと通信することを可能にする。
ロボットのセンサーと制御データは、その後ロボットにデプロイされるAIアルゴリズムのトレーニングを目的として、HPCシステムに向けてストリームされる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:32:08 GMT)
Cyber Risk Taxonomies: Statistical Analysis of Cybersecurity Risk Classifications [0.0] 本論では,適応度とサンプル内性能に注目を移すことを優先して,サンプルのアウトオブサンプル予測性能に注目する。
以上の結果から,サイバーリスクイベントの不均一性を捉えるには,ビジネスモチベーションによるサイバーリスク分類があまりに制限的であり,柔軟性に乏しいことが示唆された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 04:12:34 GMT)
Crafting Narrative Closures: Zero-Shot Learning with SSM Mamba for Short Story Ending Generation [0.0] 作家たちは創造的なブロックの瞬間に遭遇し、物語の進行路が曖昧になる。
この論文は、革新的なソリューションとして、与えられたプロンプトに基づいてストーリーを完成させるツールを提供することによって、そのような状況に対処するように設計されている。
短いストーリープロンプトを入力することで、ユーザーは1文以上で説明されたストーリーの結論を受け取ることができ、それによってAI駆動の創造性によってストーリーテリングプロセスが強化される。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 18:56:32 GMT)
Correlation Spreading in Quantum Lattice Models with Variable-Range Interactions [0.0] 我々は, 急激な大域的クエンチを通じて平衡から遠ざかる短距離あるいは長距離相互作用を持つ孤立格子モデルにおける量子相関の拡散について検討した。
我々は,その因果性円錐は相関エッジと一連の局所極限からなる普遍的な2次元構造を示すことを示した。
長距離相互作用では、各構造の運動は弾道的であり、関連する拡散速度は、ポストクエンチハミルトニアンの準粒子分散関係の群と位相速度と関連している。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 03:43:10 GMT)
Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI [0.0] 本稿では,先進的なAI開発者や米国政府機関,その他の民間企業との早期情報共有を支援するプロセスとして,CDDC(Coordinated Disclosure of Dual-Use Capabilities)を提案する。
これは、米国政府、デュアルユースファンデーションモデル開発者、その他のアクターに、公衆の安全とセキュリティに大きな影響を与える可能性のあるAI機能の概要と、対応の最大時間を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 19:06:02 GMT)
Convolutional Variational Autoencoders for Spectrogram Compression in Automatic Speech Recognition [0.0] 本稿では、畳み込み変分オートエンコーダ(VAE)に基づく圧縮スペクトログラム表現の代替手法を提案する。
畳み込みVAEモデルは、13次元の埋め込みから短いオーディオスペクトログラム(25ms)の断片を再構成するために、LibriSpeechデータセットのサブサンプルで訓練された。
トレーニングされた40次元(300ms)の埋め込みモデルは、GoogleSpeechCommandsデータセットで音声コマンドのコーパスを生成するために使用された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:25:38 GMT)
Convolutional Variational Autoencoders for Spectrogram Compression in Automatic Speech Recognition [0.0] 本稿では、畳み込み変分オートエンコーダ(VAE)に基づく圧縮スペクトログラム表現の代替手法を提案する。
畳み込みVAEモデルは、13次元の埋め込みから短いオーディオスペクトログラム(25ms)の断片を再構成するために、LibriSpeechデータセットのサブサンプルで訓練された。
トレーニングされた40次元(300ms)の埋め込みモデルは、GoogleSpeechCommandsデータセットで音声コマンドのコーパスを生成するために使用された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:25:38 GMT)
Consultation on Industrial Machine Faults with Large language Models [0.0] 本稿では,Large Language Models (LLMs) を用いて故障診断精度を向上させる手法を提案する。
実験の結果,本手法はベースラインモデルよりも優れ,精度は91%であった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 08:22:16 GMT)
Confinement and false vacuum decay on the Potts quantum spin chain [0.0] 混合体三状態ポッツ量子鎖における量子クエンチ後の非平衡ダイナミクスを考察する。
イジングスピン鎖の類似した設定と比較すると、ポッツモデルはよりリッチな表現論を持つ。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 12:49:49 GMT)
Compressing multivariate functions with tree tensor networks [0.0] 1次元テンソルネットワークは、連続関数の数値アンザッツとしてますます利用されている。
構造木テンソルネットワークが、一般的に使用されるテンソルトレインよりもはるかに効率的なアンザッツを提供することを示す。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:20:52 GMT)
Comparative Survey of Cyber-Threat and Attack Trends and Prediction of Future Cyber-Attack Patterns [0.0] サイバーセキュリティの侵害は、大きな不確実性とリスクで常に増加している。
あらゆる規制なしに攻撃の多様性と国家アクターの関与が、サイバー兵器を州に魅力的なものにしている。
国家は匿名性と帰属の欠陥を活用して、認識された敵に激しく打撃を与えている。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 19:06:42 GMT)
Comparative Analysis and Ensemble Enhancement of Leading CNN Architectures for Breast Cancer Classification [0.0] 本研究は,病理組織像を用いた乳癌分類への新規かつ正確なアプローチを提案する。
さまざまな画像データセット間で、主要な畳み込みニューラルネットワーク(CNN)モデルを体系的に比較する。
そこで本研究では,スタンドアロンCNNモデルにおいて,例外的分類精度を実現するために必要な設定について検討した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 11:31:43 GMT)
Combined Dissipative and Hamiltonian Confinement of Cat Qubits [0.0] キャット量子ビットは、量子調和振動子の位相空間における非局所符号化から引き継がれた指数誤差バイアスを特徴とする。
本稿では,2光子散逸と2光子交換(TPE)ハミルトニアン(Hミルトニアン)を併用した2光子散逸に基づく新しい複合散逸法を提案する。
消散性やハミルトニアン方式に比べて性能が大幅に向上した高速かつバイアス保存ゲートを実証する。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 14:52:26 GMT)
Characterization of entanglement on superconducting quantum computers of up to 414 qubits [0.0] 我々はGHZ(Greenberger-Horne-Zeilinger)の絡み合いとIBMの量子デバイス上でのグラフ状態について検討する。
0.519 pm 0.014$のGHZ忠実度は32量子GHZ状態で測定され、その真のマルチパーティライト絡み(GME)が証明される。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 02:11:51 GMT)
Calculating potential energy surfaces with quantum computers by measuring only the density along adiabatic transitions [0.0] 位相推定の代わりに、逆実空間時間依存密度汎関数理論コーン・シャムポテンシャルを用いて線積分を行うことによりエネルギーを評価する。
この手法の精度は、断熱進化そのものの妥当性とポテンシャル反転過程に依存する。
完全なポテンシャルエネルギー曲線をまたいで化学的精度を得るために、正確な測定がほとんど得られないことが示されている。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 20:53:03 GMT)
CLIP-Clique: Graph-based Correspondence Matching Augmented by Vision Language Models for Object-based Global Localization [0.0] オブジェクトマップ上のローカライズのための最も有望なアプローチの1つは、セマンティックグラフマッチングを使用することである。
従来の問題に対処するために、視覚言語モデルを用いた対応マッチングを強化する。
さらに、inlierはグラフ理論のアプローチを用いて決定的に推定される。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 00:23:20 GMT)
Bound-state confinement after trap-expansion dynamics in integrable systems [0.0] スピン-1/2$異方性ハイゼンベルク鎖(XXZ$鎖)における有界輸送の研究
流体力学では、相互作用が十分に強い場合、境界状態は初期領域に留まる。
閉じ込めのフィンガープリントは局所スピン射影作用素の時空プロファイルで見ることができる。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 07:57:15 GMT)
Artificial consciousness. Some logical and conceptual preliminaries [0.0] 人工システムにおいて実現可能か,あるいは実現可能かというバランスのとれた議論のために,意識の次元とプロファイルを用いることの必要性を論じる。
本論文の主目的は, 人工意識領域における理論的問題について概観することである。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 11:41:53 GMT)
Applying the FAIR Principles to Computational Workflows [0.0] 計算ツールは、生産性、トレンド、プラットフォームへのアクセスの民主化、ノウハウの処理のためのツールとして、ますます認識されている。
デジタルオブジェクトは共有され、発見され、再利用されるため、Finderable、Accessible、Interoperable、ReusableといったFAIRの原則による計算上の利点がある。
我々は、私たちの議論を反映し、私たちの選択と適応を正当化するコメンデーションを提示する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 15:00:17 GMT)
An Intelligent Native Network Slicing Security Architecture Empowered by Federated Learning [0.0] ネットワークスライシングソリューションを改善するためのアーキテクチャ・インテリジェントセキュリティ機構を提案する。
我々は、汎用的および非ネイティブなテレメトリ記録を用いて、スライス内のDistributed Denial-of-Service(DDoS)と侵入攻撃を識別する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 21:12:23 GMT)
Algorithm to Verify Local Equivalence of Stabilizer States [0.0] グラフと安定化状態の局所的ユニタリ等価性を検証するアルゴリズムを提案する。
本手法は,モジュラー算術における線形方程式系の解法における問題点を軽減する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 22:51:11 GMT)
A novel translationally invariant supersymmetric chain with inverse-square interactions: partition function, thermodynamics and criticality [0.0] 我々は、ルート系に直接関連しない長距離相互作用を持つ翻訳不変su$(m|n)$スピン鎖の新しい族を導入する。
我々はこれらのモデルの対称性を研究し、この種のシステムのボソン-フェルミオン双対性特性の存在を確立した。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 13:52:41 GMT)
A novel TLS-based Fingerprinting approach that combines feature expansion and similarity mapping [0.0] 本研究の目的は,オープンソースのTLSフィンガープリント技術を改良して,粒度を高めることにある。
これはTLS指紋をHTTPヘッダーデータに濃縮し、高次元データを表す微細な粒状類似性可視化を作成することで実現される。
結果は分析され評価され、67の未知の悪意のあるドメインが既知の悪意のあるドメインと類似していることから検出された。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 16:47:13 GMT)
A local photon perspective on the momentum of light [0.0] 位置空間における量子化電磁場をモデル化するための局所光子アプローチを提案する。
光の運動量は、量子力学点粒子の運動量と類似して、フォトニック波パケットの空間変換のための生成物として定義する。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 17:40:19 GMT)
A deterministic and efficient source of frequency-polarization hyper-encoded photonic qubits [0.0] 共振器内の半導体量子ドットに基づいて、周波数と偏光で超符号化されたフォトニック量子ビットの生成を実証する。
我々のアプローチは、周波数符号化に基づく量子情報処理の分野に量子ドット源の利点をもたらす。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:13:31 GMT)
A Universal Model of Floquet Operator Krylov Space [0.0] 任意の空間次元において、フロケユニタリの下での分光時間進化は、作用素 Krylov 空間に写像できることが示されている。
フロケ動力学は、フロケ TFIM の位相位相図におけるクリロフパラメータと等質結合との相違が特徴的である。
論文参考訳(メタデータ) (Fri, 04 Oct 2024 17:08:26 GMT)
A Multimodal Framework for Deepfake Detection [0.0] AIを使って合成メディアを作るDeepfakesは、ビデオやオーディオを説得力を持って修正して、現実を正しく表現する。
我々の研究は、革新的なマルチモーダルアプローチを通じて、ディープフェイクの重要な問題に対処する。
枠組みは視覚的・聴覚的分析を併用し,精度は94%であった。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:59:10 GMT)
A Dynamic Approach to Stock Price Prediction: Comparing RNN and Mixture of Experts Models Across Different Volatility Profiles [0.0] MoEフレームワークは揮発性株のRNNと安定株の線形モデルを組み合わせて、ゲーティングネットワークを介して各モデルの重量を動的に調整する。
その結果,MoE法は様々な変動性プロファイルの予測精度を著しく向上させることがわかった。
MoEモデルの適応性は個々のモデルよりも優れており、Mean Squared Error(MSE)やMean Absolute Error(MAE)などのエラーを減らすことができる。
論文参考訳(メタデータ) (Fri, 4 Oct 2024 14:36:21 GMT)