論文の概要: Dynamic Coalition Structure Detection in Natural Language-based Interactions
- arxiv url: http://arxiv.org/abs/2502.16339v1
- Date: Sat, 22 Feb 2025 20:12:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:52:46.519540
- Title: Dynamic Coalition Structure Detection in Natural Language-based Interactions
- Title(参考訳): 自然言語に基づく対話における動的協調構造検出
- Authors: Abhishek N. Kulkarni, Andy Liu, Jean-Raphael Gaglione, Daniel Fried, Ufuk Topcu,
- Abstract要約: 戦略的マルチエージェントシーケンシャル相互作用において、動的連立構造の検出は、自己関心のエージェントが結果にどう影響するかを理解するために重要である。
エージェントが自然言語を用いて連携を交渉する戦略的マルチエージェントゲームであるDiplomacyにおける動的多角的連立形成を予測する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 29.093071108373717
- License:
- Abstract: In strategic multi-agent sequential interactions, detecting dynamic coalition structures is crucial for understanding how self-interested agents coordinate to influence outcomes. However, natural-language-based interactions introduce unique challenges to coalition detection due to ambiguity over intents and difficulty in modeling players' subjective perspectives. We propose a new method that leverages recent advancements in large language models and game theory to predict dynamic multilateral coalition formation in Diplomacy, a strategic multi-agent game where agents negotiate coalitions using natural language. The method consists of two stages. The first stage extracts the set of agreements discussed by two agents in their private dialogue, by combining a parsing-based filtering function with a fine-tuned language model trained to predict player intents. In the second stage, we define a new metric using the concept of subjective rationalizability from hypergame theory to evaluate the expected value of an agreement for each player. We then compute this metric for each agreement identified in the first stage by assessing the strategic value of the agreement for both players and taking into account the subjective belief of one player that the second player would honor the agreement. We demonstrate that our method effectively detects potential coalition structures in online Diplomacy gameplay by assigning high values to agreements likely to be honored and low values to those likely to be violated. The proposed method provides foundational insights into coalition formation in multi-agent environments with language-based negotiation and offers key directions for future research on the analysis of complex natural language-based interactions between agents.
- Abstract(参考訳): 戦略的マルチエージェントシーケンシャル相互作用において、動的連立構造の検出は、自己関心のエージェントが結果にどう影響するかを理解するために重要である。
しかし、自然言語に基づくインタラクションは、意図に対する曖昧さとプレイヤーの主観的な視点をモデル化することの難しさによる連立検出に固有の課題をもたらす。
本稿では,大規模言語モデルとゲーム理論の最近の進歩を利用して,エージェントが自然言語を用いて連携を交渉する戦略的マルチエージェントゲームである外交における動的多角的連立形成を予測する手法を提案する。
方法は2つの段階からなる。
第1段階は、パーシングに基づくフィルタリング機能と、プレイヤーの意図を予測するために訓練された微調整言語モデルを組み合わせることで、2人のエージェントがプライベート対話で議論する一連の合意を抽出する。
第2段階では,ハイパーゲーム理論から主観的合理化可能性の概念を用いて新たなメトリクスを定義し,各プレイヤーに対する合意の期待値を評価する。
次に、両プレーヤーの合意の戦略的価値を評価し、第2プレイヤーが合意を尊重するという1人のプレイヤーの主観的信念を考慮し、第1段階で特定された各合意についてこの指標を算出する。
我々は,オンライン外交ゲームプレイにおける潜在的連立構造を効果的に検出できることを示す。
提案手法は,多エージェント環境における言語交渉による連立形成に関する基礎的な知見を提供するとともに,エージェント間の複雑な自然言語に基づく相互作用の分析について,今後の研究の鍵となる方向性を提供する。
関連論文リスト
- Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文 参考訳(メタデータ) (2024-10-22T09:25:21Z) - Deal, or no deal (or who knows)? Forecasting Uncertainty in
Conversations using Large Language Models [45.41542983671774]
言語モデルは、会話に固有の不確実性を表現するにはどうすればよいか?
本稿では,長期にわたる「会話予測」タスクの拡張であるFortUne Dialを提案する。
言語モデルが結果の不確実性を表わす2つの方法を研究する。
論文 参考訳(メタデータ) (2024-02-05T18:39:47Z) - Steering Language Models with Game-Theoretic Solvers [43.023261136434876]
大規模言語モデル(LLM)によって生成される自然言語対話の空間上で平衡解法が機能するフレームワークを導入する。
具体的には、対話の「ゲーム」におけるプレイヤー、戦略、ペイオフをモデル化することにより、自然言語の相互作用から従来のゲーム理論の記号論理への結合を生成する。
我々は,会議のスケジューリング,果物の取引,討論など,異なる交渉戦略を必要とする3つの領域に注目し,解決者によって指導されたLLMの言語を評価する。
論文 参考訳(メタデータ) (2024-01-24T22:22:00Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - MindDial: Belief Dynamics Tracking with Theory-of-Mind Modeling for Situated Neural Dialogue Generation [62.44907105496227]
MindDialは、Mind-of-mindモデリングで位置決め自由形式の応答を生成できる、新しい対話型フレームワークである。
本研究では、話者の信念と話者の聴取者の信念を予測できる明示的なマインドモジュールを導入する。
筆者らのフレームワークは,提案手法と微調整モデルの両方に適用され,共通地盤アライメントとネゴシエーションの両方を含むシナリオで評価される。
論文 参考訳(メタデータ) (2023-06-27T07:24:32Z) - Entity Divider with Language Grounding in Multi-Agent Reinforcement
Learning [28.619845209653274]
マルチエージェント設定におけるポリシーの一般化を促進するための自然言語の利用について検討する。
マルチエージェント強化学習, エンティティディバイザ(EnDi)における言語基盤構築のための新しい枠組みを提案する。
EnDiは、エージェントがエンティティレベルで独立してサブゴナル分割を学習し、関連するエンティティに基づいて環境に作用することを可能にする。
論文 参考訳(メタデータ) (2022-10-25T11:53:52Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Using Graph-Aware Reinforcement Learning to Identify Winning Strategies
in Diplomacy Games (Student Abstract) [9.34612743192798]
本稿では,オンライン政治戦略ゲームにおける多人数談話における複雑な社会現象の検出とモデル化の目標指向モデルへのアプローチを提案する。
まず,言語的特徴として社会言語的振る舞いを符号化し,次に強化学習を用いてプレイヤーに与えられる利点を推定する2段階のアプローチを開発した。
我々のグラフ認識アプローチは、コンテキストに依存しないセットアップに比べて堅牢なパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-12-31T07:38:36Z) - Probing Task-Oriented Dialogue Representation from Language Models [106.02947285212132]
本稿では,タスク指向対話タスクにおいて,どのモデルが本質的に最も有意義な表現を担っているかを明らかにするために,事前学習された言語モデルについて検討する。
我々は、アノテートラベルを教師付き方法で固定された事前学習言語モデルの上に、分類器プローブとしてフィードフォワード層を微調整する。
論文 参考訳(メタデータ) (2020-10-26T21:34:39Z) - DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act
Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。
既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。
本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文 参考訳(メタデータ) (2020-08-16T14:13:32Z) - Incorporating Pragmatic Reasoning Communication into Emergent Language [38.134221799334426]
我々は、言語コミュニケーションのダイナミクスを、かなり異なるインテリジェンスとインテリジェンスレベルに沿って研究する。
本稿では,短期的相互推論に基づく実用主義と長期言語創発主義を組み合わせた計算モデルを提案する。
我々の結果は、より自然で正確で、堅牢で、きめ細かな、簡潔な発話を実現するための道を開くことの重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2020-06-07T10:31:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。