論文の概要: SOM: Structured Opponent Modeling for LLM-based Agents via Structural Causal Model
- arxiv url: http://arxiv.org/abs/2605.07301v1
- Date: Fri, 08 May 2026 06:11:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.845533
- Title: SOM: Structured Opponent Modeling for LLM-based Agents via Structural Causal Model
- Title(参考訳): SOM:構造因果モデルによるLCM系エージェントの構造応答モデリング
- Authors: Shiyue Cao, Pei Xu, Likun Yang, Lei Cui, Xiaotang Chen, Kaiqi Huang,
- Abstract要約: 本稿では,対戦モデル構築と対戦モデル予測を明確に分離する2段階の対戦者モデリングフレームワークを提案する。
構築段階において、SOMは、変数間の依存関係を表現するグラフベースの形式主義である構造因果モデル(Structure Causal Model, SCM)を用いて、相手の観察と行動の間の直接リンクをキャプチャする。
予測段階では、LLMはSCMから導出される明確な経路に沿って構造化推論を行い、予測精度と安定性の両方を改善する。
- 参考スコア(独自算出の注目度): 25.22095743571866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately predicting opponents' behavior from interactions is a fundamental capability for large language model (LLM)-based agents in multi-agent and game-theoretic environments. Existing approaches often entangle opponent modeling with prediction, relying on implicit contextual reasoning and limiting adaptability in dynamic interactions. To this end, we propose Structured Opponent Modeling (SOM), a two-stage opponent modeling framework that distinctly separates opponent model construction and opponent prediction. At the construction stage, SOM employs a Structural Causal Model (SCM), a graph-based formalism for representing dependencies among variables, to capture directed links between opponents' observations and actions, yielding an explicit and structured opponent representation. At the prediction stage, the LLM performs structured reasoning along clear pathways derived from the SCM, improving both prediction accuracy and stability. Extensive experiments on diverse multi-agent benchmarks demonstrate that SOM consistently outperforms state-of-the-art LLM-based reasoning baselines, enabling more accurate and adaptable strategic decision-making in complex and dynamic multi-agent interactions.
- Abstract(参考訳): 相互作用から相手の行動を正確に予測することは、多エージェントおよびゲーム理論環境での大規模言語モデル(LLM)ベースのエージェントの基本的な能力である。
既存のアプローチは、しばしば、動的相互作用における暗黙の文脈的推論と適応性に頼り、予測と対立するモデリングを絡み合わせる。
そこで本研究では, 対向モデル構築と対向予測を明確に分離する2段階の対向モデルフレームワークである構造的対向モデリング(SOM)を提案する。
構築段階において、SOMは、変数間の依存関係を表現するグラフベースの形式主義である構造因果モデル(Structure Causal Model, SCM)を用いて、相手の観察と行動の間の直接リンクをキャプチャし、明示的で構造化された反対表現を生成する。
予測段階では、LLMはSCMから導出される明確な経路に沿って構造化推論を行い、予測精度と安定性の両方を改善する。
多様なマルチエージェントベンチマークに関する大規模な実験により、SOMは最先端のLCMベースの推論ベースラインを一貫して上回り、複雑で動的なマルチエージェントインタラクションにおけるより正確で適応可能な戦略的意思決定を可能にしている。
関連論文リスト
- Toward Formalizing LLM-Based Agent Designs through Structural Context Modeling and Semantic Dynamics Analysis [13.919694566467053]
この断片化は、LLMエージェントの特性と比較を可能にする分析可能な自己整合形式モデルが存在しないことに起因すると我々は主張する。
このギャップに対処するために、文脈構造の観点からLLMエージェントを解析・比較するための形式モデルであるtexttt Structure Context Model を提案する。
モンキー・バナナ問題の動的変種に対する完全な枠組みの有効性を実証し,本手法を用いて開発したエージェントが成功率を最大32ポイント向上することを示した。
論文 参考訳(メタデータ) (2026-02-09T05:15:11Z) - Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [77.98801218316505]
大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文 参考訳(メタデータ) (2026-02-08T03:14:39Z) - Foundation Model for Skeleton-Based Human Action Understanding [56.89025287217221]
本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文 参考訳(メタデータ) (2025-08-18T02:42:16Z) - On the Reasoning Capacity of AI Models and How to Quantify It [0.0]
大規模言語モデル(LLM)は、その推論能力の基本的な性質に関する議論を激化させている。
GPQAやMMLUのようなベンチマークで高い性能を達成する一方で、これらのモデルはより複雑な推論タスクにおいて制限を示す。
本稿では,モデル行動のメカニズムを解明するために,従来の精度指標を超える新しい現象論的手法を提案する。
論文 参考訳(メタデータ) (2025-01-23T16:58:18Z) - Interpreting token compositionality in LLMs: A robustness analysis [10.777646083061395]
Constituent-Aware Pooling (CAP)は、大規模言語モデルが言語構造をどのように処理するかを分析するために設計された方法論である。
CAPは様々なモデルレベルで構成型プールを通してモデル活性化に介入する。
本研究は,合成セマンティクス処理とモデル解釈可能性に関する,現在のトランスフォーマーアーキテクチャの基本的制約を明らかにする。
論文 参考訳(メタデータ) (2024-10-16T18:10:50Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。