論文の概要: Beyond Component Strength: Synergistic Integration and Adaptive Calibration in Multi-Agent RAG Systems
- arxiv url: http://arxiv.org/abs/2511.21729v1
- Date: Fri, 21 Nov 2025 07:53:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.178782
- Title: Beyond Component Strength: Synergistic Integration and Adaptive Calibration in Multi-Agent RAG Systems
- Title(参考訳): コンポーネント強度を超えて:マルチエージェントRAGシステムにおける相乗的統合と適応キャリブレーション
- Authors: Jithin Krishnan,
- Abstract要約: 本研究では,ハイブリッド検索,アンサンブル検証,適応しきい値設定などの拡張が,単独で使用する場合のメリットをほとんど示さないことを示す。
異なる検証戦略は安全に振る舞うことができるが、一貫性のないラベルを割り当てる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building reliable retrieval-augmented generation (RAG) systems requires more than adding powerful components; it requires understanding how they interact. Using ablation studies on 50 queries (15 answerable, 10 edge cases, and 25 adversarial), we show that enhancements such as hybrid retrieval, ensemble verification, and adaptive thresholding provide almost no benefit when used in isolation, yet together achieve a 95% reduction in abstention (from 40% to 2%) without increasing hallucinations. We also identify a measurement challenge: different verification strategies can behave safely but assign inconsistent labels (for example, "abstained" versus "unsupported"), creating apparent hallucination rates that are actually artifacts of labeling. Our results show that synergistic integration matters more than the strength of any single component, that standardized metrics and labels are essential for correctly interpreting performance, and that adaptive calibration is needed to prevent overconfident over-answering even when retrieval quality is high.
- Abstract(参考訳): 信頼できる検索強化生成(RAG)システムの構築には、強力なコンポーネントの追加以上のことが必要であり、それらがどのように相互作用するかを理解する必要がある。
回答可能な50の問合せ(15件,エッジケース10件,反対者25件)を用いて,ハイブリッド検索,アンサンブル検証,アダプティブしきい値付けなどの拡張は,単独で使用するとほとんど利益が得られず,同時に,幻覚を増すことなく,95%の禁忌(40%から2%)を達成できることを示した。
異なる検証戦略は安全に振る舞うことができるが、一貫性のないラベルを割り当てる(例えば、"abstained"と"un supported")。
以上の結果から, 相乗的統合は, 単一コンポーネントの強度よりも重要であり, 標準化されたメトリクスやラベルは, 性能の正しい解釈に不可欠であり, 検索品質が高い場合でも, 過度な回答を防止するために適応キャリブレーションが必要であることが示唆された。
関連論文リスト
- Semi-Supervised Regression with Heteroscedastic Pseudo-Labels [50.54050677867914]
両レベル最適化の観点から,疑似ラベルの影響を動的に調整する不確実性認識型擬似ラベル化フレームワークを提案する。
我々は、様々なベンチマークSSRデータセットにまたがって、我々のアプローチを検証するための理論的洞察と広範な実験を提供する。
論文 参考訳(メタデータ) (2025-10-17T03:06:23Z) - Formal Models and Convergence Analysis for Context-Aware Security Verification [0.0]
本稿では,ML強化適応システムに対する証明可能な保証を確立する,文脈認識型セキュリティ検証のための公式なフレームワークを提案する。
1)適応的検証が成功した場合のサンプル複雑性境界,(2)コンテキストリッチネスと検出能力に関する情報理論制限,(3)MLベースのペイロードジェネレータの収束保証。
論文 参考訳(メタデータ) (2025-10-14T12:21:36Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - When Fine-Tuning is Not Enough: Lessons from HSAD on Hybrid and Adversarial Audio Spoof Detection [3.7411108810335922]
音声検出は、音声認証、スマートアシスタント、通信セキュリティの課題である。
1,248のクリーンと41,044の劣化した発話を含むベンチマークを,人間,クローン,ゼロショットAI生成,ハイブリッドオーディオの4つのクラスに分けて提示する。
事前訓練されたモデルは、ハイブリッド条件下で過度に一般化および崩壊し、スプーフ特異的微調整は分離性を改善するが、目に見えない組成に苦しむ。
論文 参考訳(メタデータ) (2025-09-09T01:43:28Z) - VISION: Robust and Interpretable Code Vulnerability Detection Leveraging Counterfactual Augmentation [6.576811224645293]
グラフニューラルネットワーク(GNN)は、構造的および論理的コード関係をデータ駆動で学習することができる。
GNNは表面的なコード類似性から'spurious'相関を学習することが多い。
我々は、VISIONと呼ばれる堅牢で解釈可能な脆弱性検出のための統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-26T11:20:39Z) - Subtyping Breast Lesions via Generative Augmentation based Long-tailed Recognition in Ultrasound [8.410718166932798]
本稿では,高忠実度データ合成による分布バイアスを緩和する長鎖分類のためのフレームワークを提案する。
提案手法は,最先端手法と比較して有望な性能を実現する。
論文 参考訳(メタデータ) (2025-07-30T10:50:41Z) - Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.405085773954596]
Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:56:20Z) - SMAB: MAB based word Sensitivity Estimation Framework and its Applications in Adversarial Text Generation [10.111657705438654]
単語レベルの局所(文レベル)とグローバル(集約)の感性を計算するために,感性に基づく多言語帯域幅フレームワーク(SMAB)を導入する。
このアルゴリズムは直感的に高感度かつ低感度な単語をキャプチャする。
また,ゴールドデータがない場合,感度が精度の指標となることを示す。
論文 参考訳(メタデータ) (2025-02-10T22:46:57Z) - Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented Generation [96.78845113346809]
Retrieval-augmented Language Model (RALMs) は、知識集約型タスクにおいて、高い性能と幅広い適用性を示している。
本稿では,非偽文の検出に微細な復号力学を利用する軽量モニタであるSynCheckを提案する。
また、長文検索拡張生成のためのビームサーチによって導かれる忠実度指向の復号アルゴリズムであるFODを導入する。
論文 参考訳(メタデータ) (2024-06-19T16:42:57Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。