論文の概要: Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents
- arxiv url: http://arxiv.org/abs/2605.30335v1
- Date: Thu, 28 May 2026 17:58:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.746641
- Title: Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents
- Title(参考訳): 局所的コヒーレント・グローバル的非コヒーレント:多成分LDM剤における組成不コヒーレンスの境界
- Authors: Anany Kotawala,
- Abstract要約: 多成分LLMエージェントは、それぞれが共同問題の一部しか見えないコンポーネントから確率的クレームを組み立てる。
我々は、この局所的コヒーレントな、グローバルな非コヒーレントな失敗を構成的残差eps*を介して定式化する。
階層的なボイル・ダイクストラ射影は、その構成を決定論的に修復する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-component LLM agents assemble probabilistic claims from components that each see only part of a joint problem; the composition can violate basic probability axioms even when every component is locally coherent. We formalise this locally coherent, globally incoherent failure via the compositional residual eps*, the L2 distance from the composed quote to the joint coherent polytope, computable at runtime from system output and the declared cross-component coupling constraints. A product-structure dichotomy characterises when local coherence suffices, and a Rayleigh-quotient prediction matches the observed residual within 7% on three of four relation classes. A hierarchical Boyle-Dykstra projection repairs the composition deterministically; an anytime-valid e-process gives sequential coherence monitoring. Across 1,876 ensemble cliques on a four-LLM mid-tier panel (frontier-panel rerun in Section 5.5), eps* > 0 on 33-94% of cliques, translating to +0.115 nats per bet of regret on 1,770 resolved bets under the proportional allocation rule (the gain collapses to +0.006 under bettors that themselves coherentise). Three intuitive LLM-side mitigations(retrieval, partition-aware prompting, aggregator-LLM) each fail or regress.
- Abstract(参考訳): 多成分LLMエージェントは、それぞれが共同問題の一部しか見ていないコンポーネントから確率的クレームを組み立てる。
我々は、この局所的コヒーレントなグローバルな不整合障害を、構成的残差eps*、合成された引用から結合コヒーレントポリトープへのL2距離によって定式化し、システム出力から実行時に計算可能であり、宣言されたクロスコンポーネント結合制約を定式化する。
積構造二分法は局所的コヒーレンスが十分であるときに特徴付け、レイリー商予測は4つの関係クラスのうち3つのクラスで7%以内の残留率と一致する。
階層的なボイル・ダイクストラ射影は、組成を決定論的に修復する。
4つのLLM中間層パネル上の1,876個のアンサンブル・クランプ(第55節でフロンティア・パネルの再実行)、33-94%のクランプ上のeps* > 0 は、比例割り当て規則の下で1,770個の解決されたベットに対して、後悔の1回当たり+0.115ナットに翻訳される(利得は、それ自体がコヒーレントなベクターの下で +0.006 に崩壊する)。
3つの直感的なLCM側緩和(検索、パーティション対応プロンプト、アグリゲータ-LLM)は、それぞれフェールまたはリグレスである。
関連論文リスト
- OmniISR: A Unified Framework for Centralized and Federated Learning via Intermediate Supervision and Regularization [58.03221830946145]
我々は、純粋なCL、純粋なFL、ハイブリッドCL-FLトレーニングモードを融合する統合フレームワークであるOmniISRを提案する。
我々は,OmniISRが集中型パラダイムとフェデレーション型パラダイムの両方において,モデル性能を一貫して改善していることを示す。
論文 参考訳(メタデータ) (2026-05-19T04:13:27Z) - DINORANKCLIP: DINOv3 Distillation and Injection for Vision-Language Pretraining with High-Order Ranking Consistency [12.06248193140353]
対照的な言語イメージのpreCLIPは2つの構造的弱点に悩まされる。
RANKCLIPは、リストワイドのPlackett-Luceランキング一貫性を失うことで、最初の問題に部分的に対処する。
DINORANKCLIPは,両者を共同で扱う事前学習フレームワークである。
論文 参考訳(メタデータ) (2026-05-07T17:19:52Z) - GSAR: Typed Grounding for Hallucination Detection and Recovery in Multi-Agent LLMs [0.0]
クレームを4方向のタイポロジー(接地,非接地,矛盾,相補的)に分割する基盤性フレームワークを提案する。
GSARは、明示的な計算予算の下で、結合された回復を伴うエビデンス型スコアリングを結合した最初の基盤フレームワークである。
論文 参考訳(メタデータ) (2026-04-25T16:20:28Z) - PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution [2.28438857884398]
自然言語として知識を格納するLLMエージェントは、条件数の増加に伴って急激な検索劣化に悩まされる。
本稿では,3つの密結合コンポーネントによるテスト時間適応のための統合フレームワークであるPreCEPTを紹介する。
論文 参考訳(メタデータ) (2026-03-10T13:16:45Z) - Almost Asymptotically Optimal Active Clustering Through Pairwise Observations [59.20614082241528]
そこで本研究では, ノイズと能動的に収集された応答を用いて, M$アイテムを未知数の$K$個別グループにクラスタリングするための新しい分析フレームワークを提案する。
クラスタリングの精度に対する望ましい信頼性を達成するのに必要なクエリ数の基本的下位境界を確立する。
我々は、一般化された同値比統計の計算可能な変種を開発し、その下限に対する性能ギャップを正確に推定できることを実証的に示す。
論文 参考訳(メタデータ) (2026-02-05T14:16:47Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Local Minima Structures in Gaussian Mixture Models [14.87510193228802]
一般人口を有するガウス混合モデル(GMM)の負対数様機能(負対数様機能)の展望について検討する。
コンポーネントの数が大域的に最適ではないため、グローバルに分離されていない複数の局所ミニマが存在する。
本結果は, 真の混合条件が一定の分離条件を満たす場合に適用され, 成分数が有効である場合に有効である。
論文 参考訳(メタデータ) (2020-09-28T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。