論文の概要: Don't Make the LLM Read the Graph: Make the Graph Think
- arxiv url: http://arxiv.org/abs/2604.23057v1
- Date: Fri, 24 Apr 2026 22:56:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.126972
- Title: Don't Make the LLM Read the Graph: Make the Graph Think
- Title(参考訳): LLMにグラフを読み込ませる - グラフを思い起こさせる
- Authors: Yuqi Sun, Tianqin Meng, George Liu, Yashraj Panwar, Lakshya Chaudhry, Munasib Ilham, Aman Chadha,
- Abstract要約: 協調型マルチエージェントカードゲーム「はなび」において,明示的な信念グラフがLLM性能を向上させるか否かを検討する。
3000以上の対照試験により,4つの結果が得られた。
- 参考スコア(独自算出の注目度): 13.277447097714395
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate whether explicit belief graphs improve LLM performance in cooperative multi-agent reasoning. Through 3,000+ controlled trials across four LLM families in the cooperative card game Hanabi, we establish four findings. First, integration architecture determines whether belief graphs provide value: as prompt context, graphs are decorative for strong models and beneficial only for weak models on 2nd-order Theory of Mind (80% vs 10%, p<0.0001, OR=36.0); when graphs gate action selection through ranked shortlists, they become structurally essential even for strong models (100% vs 20% on 2nd-order ToM, p<0.001). Second, we identify "Planner Defiance," a model-family-specific failure where LLMs override correct planner recommendations at partial competence (90% override, replicated N=20); Gemini models show near-zero defiance while Llama 70B shows 90%, and models distinguish factual context (deferred to) from advisory recommendations (overridden). Third, full-game evidence confirms inter-agent conventions (+128% over baseline, p=0.003) outperform all single-agent interventions, and individual belief-graph components must be combined to produce gains. Fourth, preliminary scaling analysis (N=10/cell, exploratory) suggests graph depth has diminishing returns: shallow graphs provide the best cost-benefit ratio, while deeper ToM graphs appear harmful at larger player counts (-1.5 pts at 5-player, p=0.029).
- Abstract(参考訳): 協調型マルチエージェント推論において,明示的な信念グラフがLLM性能を向上させるか否かを検討する。
協力型カードゲーム「はなび」の4家族を対象とした3000以上の治験により, 4つの知見が得られた。
まず、統合アーキテクチャは、信念グラフが価値を提供するかどうかを決定する: 迅速な文脈として、グラフは強いモデルに対して装飾的であり、2階の心の理論上の弱いモデル(80%対10%、p<0.0001、OR=36.0)にのみ有益である。
次に,Llama 70Bが90%,Llama 70Bが90%,Llama 70Bが90%,LLMが90%の精度で正しいプランナーレコメンデーションをオーバーライドするモデルファミリー固有の障害であるPlanner Defianceを同定した。
第3に、ゲーム間慣行(+128%以上、p=0.003以上)は全ての単一エージェントの介入より優れており、個々の信念グラフコンポーネントは利得を得るために組み合わせなければならない。
第4に、予備的なスケーリング分析 (N=10/cell, Exploratory) では、グラフの深さはリターンを減少させ、浅いグラフは最高のコスト-ベネフィット比を提供し、深いToMグラフはより大きなプレイヤー数では有害である(5-playerでは-1.5 pts、p=0.029)。
関連論文リスト
- GraphCogent: Mitigating LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [13.356521655409422]
大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。
グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文 参考訳(メタデータ) (2025-08-17T14:28:38Z) - Synthetic Visual Genome [88.00433979509218]
本稿では,高品質な高次グラフを大規模に構築できる密接な注釈付き関係を持つ命令設計法であるROBINを紹介する。
我々のデータセットは合計146K画像と2.6Mオブジェクトの5.6M関係を含んでいる。
ROBIN-3Bモデルは300万件未満のインスタンスでトレーニングされているにもかかわらず、関係理解ベンチマークで3億件以上のインスタンスでトレーニングされた類似サイズのモデルを上回っている。
論文 参考訳(メタデータ) (2025-06-09T11:09:10Z) - G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning [58.73279333365234]
合成グラフ理論タスクにおける強化学習(RL)はグラフ推論能力を著しく拡張することができる。
RL on ErdosでG1はグラフ推論の大幅な改善を実現し、微調整された3BモデルはQwen2.5-72B-Instruct(24倍)よりも優れています。
我々の研究は、グラフ理論上のRLでLLMを微調整することで、強力なグラフ推論器を構築するための効率的でスケーラブルな経路を提供する。
論文 参考訳(メタデータ) (2025-05-24T04:33:41Z) - Compile Scene Graphs with Reinforcement Learning [69.36723767339001]
次世代予測は大規模言語モデル(LLM)の訓練の基本原理である
本稿では,マルチモーダルLLM(M-LLM)であるR1-SGGを紹介する。
私たちは、Hard Recall、Hard Recall+Relax、Soft Recallの3つのリコールベースのバリエーションを含む、グラフ中心の報酬セットを設計します。
論文 参考訳(メタデータ) (2025-04-18T10:46:22Z) - An Automatic Graph Construction Framework based on Large Language Models for Recommendation [49.51799417575638]
本稿では,大規模言語モデルに基づく自動グラフ構築フレームワークであるAutoGraphを紹介する。
LLMはユーザ好みとアイテムの知識を推論し、セマンティックベクターとして符号化する。
潜在因子は、ユーザ/イテムノードをリンクする余分なノードとして組み込まれ、結果として、深いグローバルビューセマンティクスを持つグラフとなる。
論文 参考訳(メタデータ) (2024-12-24T07:51:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。