論文の概要: LLM-Based Cooperative Agents using Information Relevance and Plan Validation
- arxiv url: http://arxiv.org/abs/2405.16751v1
- Date: Mon, 27 May 2024 01:47:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 19:25:57.208671
- Title: LLM-Based Cooperative Agents using Information Relevance and Plan Validation
- Title(参考訳): 情報レコメンデーションと計画検証を用いたLLM型協調エージェント
- Authors: SeungWon Seo, Junhyeok Lee, SeongRae Noh, HyeongYeop Kang,
- Abstract要約: 多エージェント協調は、3Dシーンと相互作用し、複雑な部分的な観察の下で分散エージェントと協調する。
現在のシステムは、観測を通して取得した情報を管理するのに非効率であることを示す。
空間データを意思決定プロセスに組み込むことの失敗は、エージェントが最適化された軌跡を構築する能力を制限する。
GPT-3.5を利用した新しい認知アーキテクチャREVECA(Relevance and Validation-Enhanced Cooperative Language Agent)を提案する。
- 参考スコア(独自算出の注目度): 5.299803738642663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the challenge of multi-agent cooperation, where agents achieve a common goal by interacting with a 3D scene and cooperating with decentralized agents under complex partial observations. This involves managing communication costs and optimizing interaction trajectories in dynamic environments. Our research focuses on three primary limitations of existing cooperative agent systems. Firstly, current systems demonstrate inefficiency in managing acquired information through observation, resulting in declining planning performance as the environment becomes more complex with additional objects or goals. Secondly, the neglect of false plans in partially observable settings leads to suboptimal cooperative performance, as agents struggle to adapt to environmental changes influenced by the unseen actions of other agents. Lastly, the failure to incorporate spatial data into decision-making processes restricts the agent's ability to construct optimized trajectories. To overcome these limitations, we propose the RElevance and Validation-Enhanced Cooperative Language Agent (REVECA), a novel cognitive architecture powered by GPT-3.5. REVECA leverages relevance assessment, plan validation, and spatial information to enhance the efficiency and robustness of agent cooperation in dynamic and partially observable environments while minimizing continuous communication costs and effectively managing irrelevant dummy objects. Our extensive experiments demonstrate the superiority of REVECA over previous approaches, including those driven by GPT-4.0. Additionally, a user study highlights REVECA's potential for achieving trustworthy human-AI cooperation. We expect that REVECA will have significant applications in gaming, XR applications, educational tools, and humanoid robots, contributing to substantial economic, commercial, and academic advancements.
- Abstract(参考訳): エージェントは3Dシーンと対話し、複雑な部分的な観察の下で分散エージェントと協調することで共通の目標を達成する。
これには、通信コストの管理と動的環境における相互作用軌跡の最適化が含まれる。
本研究は、既存の協調エージェントシステムの3つの主要な制限に焦点を当てる。
第一に、現在のシステムは、観測を通して取得した情報を管理するのに非効率であることが示され、その結果、環境が追加の対象や目標とより複雑になるにつれて、計画性能が低下する。
第二に、部分的に観察可能な環境での虚偽の計画の無視は、エージェントが他のエージェントの目に見えない行動に影響された環境変化に適応するのに苦労するため、最適以下の協調性能をもたらす。
最後に、空間データを意思決定プロセスに組み込むことの失敗は、エージェントが最適化された軌跡を構築する能力を制限する。
これらの制約を克服するために,GPT-3.5を利用した新しい認知アーキテクチャであるRelevance and Validation-Enhanced Cooperative Language Agent (REVECA)を提案する。
REVECAは、関連性評価、計画検証、空間情報を活用し、動的かつ部分的に観察可能な環境でのエージェント協調の効率性と堅牢性を高めるとともに、継続的な通信コストを最小化し、関連のないダミーオブジェクトを効果的に管理する。
GPT-4.0で駆動されるものを含む,従来の手法よりもREVECAの方が優れていることを示す。
さらに、ユーザ調査では、信頼できる人間とAIの協力を達成するためのREVECAの可能性を強調している。
我々はREVECAがゲーム、XRアプリケーション、教育ツール、ヒューマノイドロボットに重要な応用をもたらし、経済的、商業的、学術的な進歩に寄与することを期待している。
関連論文リスト
- mmCooper: A Multi-agent Multi-stage Communication-efficient and Collaboration-robust Cooperative Perception Framework [12.896563384343889]
mmCooperは、新しいマルチエージェント、マルチステージ、コミュニケーション効率、コラボロバストな協調認識フレームワークである。
実世界およびシミュレーションデータセットの広範な実験を通して,mmCooperの有効性を検証する。
論文 参考訳(メタデータ) (2025-01-21T16:34:16Z) - Fine-Grained Appropriate Reliance: Human-AI Collaboration with a Multi-Step Transparent Decision Workflow for Complex Task Decomposition [14.413413322901409]
本稿では,MST(Multi-Step Transparent)決定ワークフローがユーザ依存行動に与える影響について検討する。
MST決定ワークフローとの人間とAIのコラボレーションは、特定の文脈におけるワンステップのコラボレーションよりも優れていることを示す。
私たちの研究は、最適な人間とAIのコラボレーションを得るのに役立つ、オールサイズの意思決定ワークフローが存在しないことを強調しています。
論文 参考訳(メタデータ) (2025-01-19T01:03:09Z) - Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.452664740963066]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation [98.11670473661587]
CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
論文 参考訳(メタデータ) (2024-11-07T13:08:04Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
本稿では,高速なタスク分解とアロケーションプロセスを活用するマルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークを提案する。
提案フレームワークにフィードバックループを組み込んで,そのような問題解決プロセスの有効性と堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - United We Stand: Decentralized Multi-Agent Planning With Attrition [4.196094610996091]
分散計画は情報収集タスクのための協調型マルチエージェントシステムの鍵となる要素である。
本稿では,アクティブエージェントの集合の変化に時間的かつ効率的に適応できる分散アルゴリズムであるAttritable MCTSを提案する。
A-MCTSは高故障率でも効率よく適応できることを理論的および実験的に示す。
論文 参考訳(メタデータ) (2024-07-11T07:55:50Z) - Cooperative Cognitive Dynamic System in UAV Swarms: Reconfigurable Mechanism and Framework [80.39138462246034]
UAVスワムの管理を最適化するための協調認知力学システム(CCDS)を提案する。
CCDSは階層的かつ協調的な制御構造であり、リアルタイムのデータ処理と意思決定を可能にする。
さらに、CCDSは、UAVスワムのタスクを効率的に割り当てるための生体模倣機構と統合することができる。
論文 参考訳(メタデータ) (2024-05-18T12:45:00Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - Iterated Reasoning with Mutual Information in Cooperative and Byzantine
Decentralized Teaming [0.0]
我々は,政策グラディエント(PG)の下での最適化において,エージェントの方針がチームメイトの方針に準じることが,本質的に相互情報(MI)の下限を最大化することを示す。
我々の手法であるInfoPGは、創発的協調行動の学習におけるベースラインを上回り、分散協調型MARLタスクにおける最先端の課題を設定します。
論文 参考訳(メタデータ) (2022-01-20T22:54:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。