論文の概要: Partner Modelling Emerges in Recurrent Agents (But Only When It Matters)
- arxiv url: http://arxiv.org/abs/2505.17323v1
- Date: Thu, 22 May 2025 22:24:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.717595
- Title: Partner Modelling Emerges in Recurrent Agents (But Only When It Matters)
- Title(参考訳): リカレントエージェントの創発をモデル化するパートナーモデル(ただし、重要な場合のみ)
- Authors: Ruaridh Mon-Williams, Max Taylor-Davies, Elizabeth Mieczkowski, Natalia Velez, Neil R. Bramley, Yanwei Wang, Thomas L. Griffiths, Christopher G. Lucas,
- Abstract要約: モデルフリーのRNNエージェントを訓練し、多様なパートナーの集団と協力する。
エージェントがタスク割り当てを制御することで、パートナー行動に影響を与えると、構造化されたパートナーモデリングが出現する。
我々の結果は、パートナーモデリングはモデルのないエージェントで自然に起こる可能性があるが、適切な社会的圧力を課す環境条件下でのみであることを示している。
- 参考スコア(独自算出の注目度): 4.845103288370202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans are remarkably adept at collaboration, able to infer the strengths and weaknesses of new partners in order to work successfully towards shared goals. To build AI systems with this capability, we must first understand its building blocks: does such flexibility require explicit, dedicated mechanisms for modelling others -- or can it emerge spontaneously from the pressures of open-ended cooperative interaction? To investigate this question, we train simple model-free RNN agents to collaborate with a population of diverse partners. Using the `Overcooked-AI' environment, we collect data from thousands of collaborative teams, and analyse agents' internal hidden states. Despite a lack of additional architectural features, inductive biases, or auxiliary objectives, the agents nevertheless develop structured internal representations of their partners' task abilities, enabling rapid adaptation and generalisation to novel collaborators. We investigated these internal models through probing techniques, and large-scale behavioural analysis. Notably, we find that structured partner modelling emerges when agents can influence partner behaviour by controlling task allocation. Our results show that partner modelling can arise spontaneously in model-free agents -- but only under environmental conditions that impose the right kind of social pressure.
- Abstract(参考訳): 人間は新しいパートナーの強みや弱みを推測し、共通の目標に向かってうまく働くことができる。
この能力でAIシステムを構築するためには、まずそのビルディングブロックを理解する必要がある。
そこで本研究では、モデルフリーのRNNエージェントを訓練し、多様なパートナーの集団と協力する。
Overcooked-AI’環境を使用して、数千の協力チームからデータを収集し、エージェントの内部を隠蔽した状態を解析します。
追加のアーキテクチャ的特徴、帰納的バイアス、補助的な目的の欠如にもかかわらず、エージェントはパートナーのタスク能力の構造化された内部表現を開発し、新しい協力者への迅速な適応と一般化を可能にした。
本研究では,これらの内部モデルについて,探索手法と大規模行動解析を用いて検討した。
特に,エージェントがタスク割り当てを制御することで,パートナー行動に影響を与えると,構造化されたパートナーモデリングが出現する。
我々の結果は、パートナーモデリングはモデルのないエージェントで自然に起こる可能性があるが、適切な社会的圧力を課す環境条件下でのみであることを示している。
関連論文リスト
- Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.452664740963066]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - Scaling Large Language Model-based Multi-Agent Collaboration [72.8998796426346]
近年の大規模言語モデル駆動型自律エージェントのブレークスルーにより、複数エージェントのコラボレーションが集団的推論を通じて各個人を上回ることが判明している。
本研究は、協調剤の連続的な添加が同様の利益をもたらすかどうかを考察する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - A Task-Interdependency Model of Complex Collaboration Towards
Human-Centered Crowd Work [0.5439020425818999]
我々は、相互依存を中心としたモデルを提示し、これはコラボレーションの核心にあるとよく理解されている現象である。
我々は、複雑な協調作業のスケールアップ、専門家の重要さの明確化、調整力と職業賃金の関係について説明する。
論文 参考訳(メタデータ) (2023-08-31T22:37:47Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Behaviour-conditioned policies for cooperative reinforcement learning
tasks [41.74498230885008]
現実世界の様々なタスクにおいて、エージェントは未知のパートナーエージェントタイプと協力する必要がある。
深層強化学習モデルは、必要な機能を提供するためにトレーニングすることができるが、サンプルの非効率性と遅い学習に苦しむことが知られている。
本研究では,行動パターンの異なるエージェントの集団を合成的に生成する手法を提案する。
また、生成されたデータを効率的に利用し、メタ学習能力を得ることができるエージェントアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-10-04T09:16:41Z) - Towards Open Ad Hoc Teamwork Using Graph-based Policy Learning [11.480994804659908]
我々は、さまざまなチーム構成の下でエージェントモデルと共同アクション値モデルを学ぶために、グラフニューラルネットワーク上に構築する。
私たちは、我々のアプローチが、他のエージェントが学習者に与える影響をうまくモデル化し、動的なチーム構成にしっかりと適応するポリシーを導いたことを実証的に実証します。
論文 参考訳(メタデータ) (2020-06-18T10:39:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。