論文の概要: Adapting to Teammates in a Cooperative Language Game
- arxiv url: http://arxiv.org/abs/2403.00823v1
- Date: Mon, 26 Feb 2024 23:15:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-10 23:49:57.941893
- Title: Adapting to Teammates in a Cooperative Language Game
- Title(参考訳): 協調言語ゲームにおけるチームメイトへの適応
- Authors: Christopher Archibald and Spencer Brosnahan
- Abstract要約: 本稿では,コードネームを再生するための適応エージェントを提案する。
私たちは、特定のチームメイトと対話する過程において、内部の専門家エージェントのどちらがベストマッチであるかを決定するために、アンサンブルアプローチを採用しています。
実験的な分析によると、このアンサンブルアプローチは個々のチームメイトに適応し、しばしばチームメイトにとって最高の内部エキスパートと同等に機能する。
- 参考スコア(独自算出の注目度): 1.082078800505043
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The game of Codenames has recently emerged as a domain of interest for
intelligent agent design. The game is unique due to the way that language and
coordination between teammates play important roles. Previous approaches to
designing agents for this game have utilized a single internal language model
to determine action choices. This often leads to good performance with some
teammates and inferior performance with other teammates, as the agent cannot
adapt to any specific teammate. In this paper we present the first adaptive
agent for playing Codenames. We adopt an ensemble approach with the goal of
determining, during the course of interacting with a specific teammate, which
of our internal expert agents, each potentially with its own language model, is
the best match. One difficulty faced in this approach is the lack of a single
numerical metric that accurately captures the performance of a Codenames team.
Prior Codenames research has utilized a handful of different metrics to
evaluate agent teams. We propose a novel single metric to evaluate the
performance of a Codenames team, whether playing a single team (solitaire)
game, or a competitive game against another team. We then present and analyze
an ensemble agent which selects an internal expert on each turn in order to
maximize this proposed metric. Experimental analysis shows that this ensemble
approach adapts to individual teammates and often performs nearly as well as
the best internal expert with a teammate. Crucially, this success does not
depend on any previous knowledge about the teammates, the ensemble agents, or
their compatibility. This research represents an important step to making
language-based agents for cooperative language settings like Codenames more
adaptable to individual teammates.
- Abstract(参考訳): Codenamesのゲームは、インテリジェントエージェント設計の関心領域として最近登場した。
このゲームは、チームメイト間の言語と調整が重要な役割を果たすため、ユニークなものです。
このゲームのためにエージェントを設計する以前のアプローチでは、アクションの選択を決定するために単一の内部言語モデルを使用していた。
これにより、エージェントが特定のチームメイトに適応できないため、一部のチームメイトでのパフォーマンスが良くなり、他のチームメイトでのパフォーマンスが劣ることが多い。
本稿では,コードネームを再生するための適応エージェントを提案する。
私たちはアンサンブルアプローチを採用し、特定のチームメートと対話する過程で、それぞれの言語モデルを持つ可能性のある内的専門家エージェントが最適な一致点を決定することを目標にしています。
このアプローチで直面している問題のひとつは、Codenamesチームのパフォーマンスを正確にキャプチャする単一の数値メトリックがないことだ。
以前のコードネーム研究は、エージェントチームを評価するために、いくつかの異なるメトリクスを使用してきた。
我々は,Codenamesチームのパフォーマンスを評価するために,単一チーム(ソリティア)ゲームか,あるいは他のチームとの競争ゲームかという,新しい単一指標を提案する。
次に,提案手法を最大化するために,各ターンで内部専門家を選定するアンサンブルエージェントを提示・解析する。
実験的な分析によると、このアンサンブルアプローチは個々のチームメイトに適応し、しばしばチームメイトにとって最高の内部エキスパートと同等に機能する。
重要なのは、この成功はチームメイトやアンサンブルエージェント、あるいは彼らの互換性に関する以前の知識に依存しません。
この研究は、Codenamesのような協調的な言語設定のための言語ベースのエージェントを、個々のチームメイトに適応させるための重要なステップである。
関連論文リスト
- Transformer Guided Coevolution: Improved Team Selection in Multiagent Adversarial Team Games [1.2338485391170533]
そこで本稿では,Masked Language Modelトレーニングを用いたトランスフォーマーに基づくディープニューラルネットワークを用いて,トレーニング対象者の最適なチームを選択するアルゴリズムを提案する。
我々は,マルチエージェント対逆ゲーム「Marine Capture-The-Flag」で本アルゴリズムを検証した結果,BERTeam が非自明なチーム構成を学習し,見知らぬ相手に対して良好に動作していることが判明した。
論文 参考訳(メタデータ) (2024-10-17T17:06:41Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Evaluation of Human-AI Teams for Learned and Rule-Based Agents in Hanabi [0.0]
我々は,ルールベースエージェントと学習ベースエージェントの両方を用いて,協力型カードゲームEmphHanabiにおける人間とAIエージェントのチームを評価する。
人間は、最先端の学習ベースのAIチームメイトよりも、ルールベースのAIチームメイトをはっきりと好みます。
論文 参考訳(メタデータ) (2021-07-15T22:19:15Z) - Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team
Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。
この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。
1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文 参考訳(メタデータ) (2021-05-18T17:27:37Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - My Team Will Go On: Differentiating High and Low Viability Teams through
Team Interaction [17.729317295204368]
オンラインチームの669の10分間のテキスト会話のデータセット上で、生存可能性分類モデルをトレーニングする。
その結果,ラッソ回帰モデルにより,可視性スコアの分類のしきい値が異なる.74--.92 AUC ROCの精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-10-14T21:33:36Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - On Emergent Communication in Competitive Multi-Agent Teams [116.95067289206919]
外部のエージェントチームによるパフォーマンスの競争が社会的影響として作用するかどうかを検討する。
以上の結果から,外部競争の影響により精度と一般化が向上し,コミュニケーション言語が急速に出現することが示唆された。
論文 参考訳(メタデータ) (2020-03-04T01:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。