論文の概要: Symbolic Reasoning Frameworks Modulate LLM Risk Aversion in Multi-Agent Strategic Settings
- arxiv url: http://arxiv.org/abs/2606.07552v1
- Date: Fri, 22 May 2026 08:24:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.710504
- Title: Symbolic Reasoning Frameworks Modulate LLM Risk Aversion in Multi-Agent Strategic Settings
- Title(参考訳): マルチエージェント戦略設定におけるLLMリスク回避のシンボリック推論フレームワーク
- Authors: Augustin Chan,
- Abstract要約: 大規模言語モデルでは、戦略エージェントとしてデプロイされた場合、固有の行動傾向を示す。
一つのエージェントに1ラウンドの反射プロンプトとして注入されるシンボリック推論フレームワークが、このバイアスを差分変調することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models exhibit innate behavioral tendencies when deployed as strategic agents -- notably a risk-averse "turtle" bias toward defensive play. We show that symbolic reasoning frameworks, injected as per-round reflective prompts into one agent, differentially modulate this bias and reshape the multi-agent ecosystem to produce framework-specific winner distributions. In a 7-player Warring States Diplomacy variant (41 games, 4 conditions, single-campaign memory accumulation), each framework produces a distinct ecosystem signature: under control, Yan dominates (7/11, 64%); under I-Ching yarrow divination, Yan and Chu co-dominate while Qin is completely suppressed (0/10); under Tarot, Qin dominates (5/10, Fisher vs. pooled p = 0.006); under scrambled-text ablation (incoherent oracle text preserving prompt structure), Qi dominates (5/10, Fisher vs. pooled p = 0.006). The framework-receiving agent (Han) never wins and shows no survival difference across conditions (Fisher p = 1.0), but Tarot consistently elevates Han's peak territory (mean 3.0 SCs vs. 2.1-2.5 others, Kruskal-Wallis p = 0.010). Neither framework's content predicts subsequent actions -- hexagram themes (chi-squared p = 0.95) and Tarot card postures (chi-squared p = 0.69) are both independent of action choice -- suggesting the modulation operates through the reflective process, not content-following. We present this as an observation paper establishing that alignment-framework choice at the agent level produces distinctive system-level consequences in multi-agent settings.
- Abstract(参考訳): 大規模言語モデルは、戦略的なエージェントとして展開される際に、本質的に振る舞いの傾向を示す。
シンボル推論フレームワークは1つのエージェントに1ラウンドの反射プロンプトとして注入され、このバイアスを差分変調し、フレームワーク固有の勝者分布を生成するためにマルチエージェントエコシステムを再形成する。
7人の戦国外交の変種(41のゲーム、4の条件、1つの記憶蓄積)では、それぞれのフレームワークが独自の生態系のシグネチャを生成する: 制御下ではヤンが7/11、64%、制御下ではヤンが7/11、64%、Qinが完全に抑制されている間はヤンとチュが共支配(0/10)、タロットではQinが5/10、フィッシャー対プールドp = 0.006)、スクランブルテキストアブレーション(インコヒーレントテキスト保存即応構造)、Qiが5/10、フィッシャー対プールドp = 0.006)。
フレームワーク受容剤(Han)は条件間での生存差を示さない(Fisher p = 1.0)が、タロットはハンのピーク領域を常に上昇させる(平均3.0 SCs vs. 2.1-2.5, Kruskal-Wallis p = 0.010)。
ヘキサグラムのテーマ (chi-squared p = 0.95) とタロットカードの姿勢 (chi-squared p = 0.69) はどちらもアクション選択とは独立であり、この変調はコンテントフォローではなくリフレクティブプロセスを通して行われることを示唆している。
本稿では,エージェントレベルでのアライメント・フレームワーク選択が,マルチエージェント設定において,システムレベルの顕著な結果をもたらすことを示す観察論文として提示する。
関連論文リスト
- The Shibboleth Effect: Auditing the Cross-Lingual Distributional Skew of Large Language Models [0.0]
本研究では,フロンティア大言語モデル(LLM)における言語間分布スキュー(シボレス効果)の持続的逆境条件について検討した。
我々は、東地中海紛争の構造的ダイナミクスを反映した多年制の地政学的な戦争ゲーム、ケルレアン海危機(Cerrulean Sea Crisis)を開発している。
論文 参考訳(メタデータ) (2026-06-09T16:42:00Z) - Game-Theoretic Multi-Agent Control for Robust Contextual Reasoning in LLMs [6.335875360476155]
マルチターンインタラクションにおける大規模言語モデル(LLM)は、独立した応答を生成するのではなく、進化するコンテキストを維持している。
GT-MCP(Game-Theoretic Secure Model Context Protocol)は,コンテキスト管理を閉ループ動的プロセスとして扱うコントローラ駆動型マルチエージェント手法である。
不安定性が検出されると、ロールバックベースの自己修復機構が検証済みのコンテキストを復元し、不要なフラグメントの伝播を防止する。
論文 参考訳(メタデータ) (2026-06-09T02:18:44Z) - Right Makes Might: Aligning Verified Hidden States Empowers RL Reasoning [55.264863369127774]
現在の方法では、それぞれの正しいロールアウトを単一の報酬ビットに減らし、隠れた状態間で共有される幾何学的構造を無視している。
本稿では,RLトレーニングにおけるアンカートークンにおける正ロールアウトの最終層を,トレーニングと推論の両方においてゼロオーバーヘッドで整列する補助損失関数Hidden-Alignを提案する。
8つの数学的推論ベンチマークでは、Hidden-AlignはDAPOベースラインの平均パス@1をQwen3-1.7B, 4B, 14Bで3.8, 6.2, 5.4ポイント改善し、3つのスケールで一貫したパス@kゲインを得る。
論文 参考訳(メタデータ) (2026-06-02T06:51:15Z) - CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios [13.03027919412076]
大規模言語モデル(LLM)は、攻撃的なサイバーセキュリティにおいて、自律的なエージェントとしてますます多くデプロイされている。
本稿では,異なるエージェントが異なる攻撃パターンを示すという興味深い現象を明らかにする。
我々はCyBiasBenchを紹介した。CyBiasBenchは総合的な630セッションのベンチマークで、3つのターゲット上の5つのエージェントと10の攻撃ファミリーを持つ4つのプロンプト条件を評価する。
論文 参考訳(メタデータ) (2026-05-08T14:57:53Z) - Can Attribution Predict Risk? From Multi-View Attribution to Planning Risk Signals in End-to-End Autonomous Driving [51.726472686971896]
エンド・ツー・エンドの自律運転モデルは、多視点入力から将来の軌跡を生成する。
既存の手法では、軌道生成の根底にある視覚的証拠を明らかにすることができない。
エンド・ツー・エンド・プランニングのための階層的属性・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-07T13:38:18Z) - StratFormer: Adaptive Opponent Modeling and Exploitation in Imperfect-Information Games [0.8574682463936006]
StratFormerはトランスフォーマーベースのメタエージェントで、不完全な情報ゲームで対戦相手を同時にモデル化し、活用することを学ぶ。
StratFormer は GTO 上で1人当たり平均 0.106 BB の攻撃ゲインを達成し、高い攻撃力を持つ相手に対して 0.821 のピークゲインを達成している。
論文 参考訳(メタデータ) (2026-04-28T16:03:14Z) - ClawArena: Benchmarking AI Agents in Evolving Information Environments [61.664633997138004]
ClawArenaは、進化する情報環境におけるAIエージェントの評価のためのベンチマークである。
それぞれのシナリオは、エージェントをノイズ、部分的、時には矛盾するトレースだけに露呈しながら、完全に隠された地上の真実を維持します。
評価は、マルチソースコンフリクト推論、動的信念修正、暗黙のパーソナライゼーションという3つの複合的な課題に基づいて構成される。
論文 参考訳(メタデータ) (2026-04-05T17:55:23Z) - "Who Am I, and Who Else Is Here?" Behavioral Differentiation Without Role Assignment in Multi-Agent LLM Systems [0.0]
本稿では,マルチエージェントの同時議論を組織化する実験プラットフォームを提案する。
異種群は同種群よりも行動の分化が著しく大きいことが判明した。
論文 参考訳(メタデータ) (2026-03-11T07:05:21Z) - See Less, Drive Better: Generalizable End-to-End Autonomous Driving via Foundation Models Stochastic Patch Selection [51.59559387222532]
エンドツーエンド自動運転の最近の進歩は、パッチアライメント機能で訓練されたポリシーが、アウト・オブ・ディストリビューション(OOD)よりも一般化していることを示している。
我々は、より堅牢で、一般化可能で、効率的な学習ポリシーのためのシンプルで効果的なアプローチである2.4-Patch-Selection(SPS)を提案する。
論文 参考訳(メタデータ) (2026-01-15T18:58:33Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Decentralized Optimistic Hyperpolicy Mirror Descent: Provably No-Regret
Learning in Markov Games [95.10091348976779]
我々はマルコフゲームにおいて、非定常的でおそらく敵対的な相手と遊べる単一のエージェントを制御する分散ポリシー学習について研究する。
我々は、新しいアルゴリズム、アンダーラインデ集中型アンダーラインハイプラインRpolicy munderlineIrror deunderlineScent (DORIS)を提案する。
DORISは、一般的な関数近似の文脈で$sqrtK$-regretを達成する。
論文 参考訳(メタデータ) (2022-06-03T14:18:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。