論文の概要: Multiagent Reinforcement Learning with Neighbor Action Estimation
- arxiv url: http://arxiv.org/abs/2601.04511v1
- Date: Thu, 08 Jan 2026 02:26:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:52.992671
- Title: Multiagent Reinforcement Learning with Neighbor Action Estimation
- Title(参考訳): 隣接行動推定を用いたマルチエージェント強化学習
- Authors: Zhenglong Luo, Zhiyong Chen, Aoxiang Liu,
- Abstract要約: 本稿では,エージェントの振る舞いを推論するための行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。
工学的応用レベルでは、このフレームワークはデュアルアームロボット操作タスクで実装され、検証されている。
- 参考スコア(独自算出の注目度): 5.226225544973531
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiagent reinforcement learning, as a prominent intelligent paradigm, enables collaborative decision-making within complex systems. However, existing approaches often rely on explicit action exchange between agents to evaluate action value functions, which is frequently impractical in real-world engineering environments due to communication constraints, latency, energy consumption, and reliability requirements. From an artificial intelligence perspective, this paper proposes an enhanced multiagent reinforcement learning framework that employs action estimation neural networks to infer agent behaviors. By integrating a lightweight action estimation module, each agent infers neighboring agents' behaviors using only locally observable information, enabling collaborative policy learning without explicit action sharing. This approach is fully compatible with standard TD3 algorithms and scalable to larger multiagent systems. At the engineering application level, this framework has been implemented and validated in dual-arm robotic manipulation tasks: two robotic arms collaboratively lift objects. Experimental results demonstrate that this approach significantly enhances the robustness and deployment feasibility of real-world robotic systems while reducing dependence on information infrastructure. Overall, this research advances the development of decentralized multiagent artificial intelligence systems while enabling AI to operate effectively in dynamic, information-constrained real-world environments.
- Abstract(参考訳): インテリジェントなパラダイムとしてのマルチエージェント強化学習は、複雑なシステム内での協調的な意思決定を可能にする。
しかし、既存のアプローチはエージェント間の明示的なアクション交換に頼り、実際のエンジニアリング環境では、通信の制約、遅延、エネルギー消費、信頼性の要求のため、しばしば実用的ではないアクション値関数を評価する。
本稿では,エージェントの振る舞いを推論するために,行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。
軽量な行動推定モジュールを統合することにより、各エージェントは、局所的に観測可能な情報のみを使用して、近隣エージェントの行動を推測し、明示的な行動共有なしに協調的な政策学習を可能にする。
このアプローチは標準のTD3アルゴリズムと完全に互換性があり、大規模マルチエージェントシステムにスケーラブルである。
工学的応用レベルでは、このフレームワークは2つのロボットアームが協調的にオブジェクトを持ち上げるという、デュアルアームのロボット操作タスクで実装され、検証されている。
実験により,本手法は,情報基盤への依存を低減しつつ,実世界のロボットシステムの堅牢性と展開可能性を大幅に向上させることを示した。
全体として、この研究は、分散化されたマルチエージェント人工知能システムの開発を前進させ、AIが動的で情報に制約された現実世界環境で効果的に動作できるようにする。
関連論文リスト
- InterAgent: Physics-based Multi-agent Command Execution via Diffusion on Interaction Graphs [72.5651722107621]
InterAgentはテキスト駆動型物理ベースのマルチエージェントヒューマノイド制御のためのエンドツーエンドフレームワークである。
本稿では,マルチストリームブロックを備えた自己回帰拡散トランスフォーマーを提案する。
また,空間依存性の微粒化を明示的に捉えた対話グラフのエクスセプション表現を提案する。
論文 参考訳(メタデータ) (2025-12-08T10:46:01Z) - Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey [11.537225726120495]
ファンデーションモデルは、断片化されたアーキテクチャをマルチモーダル推論とコンテキスト適応を備えたスケーラブルなバックボーンに統一することで、AIを再構築した。
FMを認知のコアとして、エージェントは自律性、一般化、自己回帰を達成するためにルールベースの振る舞いを超越する。
この調査は、適応的でリソース効率の良いエージェントAIシステムの、最初の体系的な特徴を提供する。
論文 参考訳(メタデータ) (2025-09-30T02:37:52Z) - Towards General Agentic Intelligence via Environment Scaling [78.66355092082253]
高度なエージェントインテリジェンスは、現実世界のアプリケーションに大規模言語モデルをデプロイするための前提条件である。
完全にシミュレートされた異種環境を自動的に構築するスケーラブルなフレームワークを設計する。
エージェントベンチマーク, tau-bench, tau2-Bench, ACEBenchの実験により, トレーニングモデルである AgentScaler が, モデルの関数呼び出し能力を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-09-16T17:57:20Z) - Emergence of Roles in Robotic Teams with Model Sharing and Limited Communication [0.0]
本稿では,単一エージェントに学習を集中させるマルチエージェント捕食システムにおける強化学習戦略を提案する。
このアプローチは、MARLや集中学習モデルのようなアプローチと比較して、計算とエネルギーの需要を大幅に削減することを目的としている。
論文 参考訳(メタデータ) (2025-05-01T14:05:46Z) - Cooperative Multi-Agent Planning with Adaptive Skill Synthesis [16.228784877899976]
本稿では、視覚言語モデル(VLM)を動的スキルライブラリと統合し、分散化されたクローズドループ決定のための構造化通信を行う新しいマルチエージェントアーキテクチャを提案する。
デモからブートストラップされたスキルライブラリは、プラナー誘導タスクを通じて進化し、適応戦略を実現する。
我々は、その最先端のMARLベースラインに対して、対称シナリオと非対称シナリオの両方で強力な性能を示す。
論文 参考訳(メタデータ) (2025-02-14T13:23:18Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Concept Learning for Interpretable Multi-Agent Reinforcement Learning [5.179808182296037]
本稿では,ドメインエキスパートからの解釈可能な概念を,マルチエージェント強化学習を通じて学習したモデルに組み込む手法を提案する。
これにより、専門家は、結果のコンセプトモデルについて、これらのハイレベルな概念を実行時に推論するだけでなく、パフォーマンスを改善するために介入し、正しい予測を行うことができる。
シミュレーションおよび実世界の協調競争型マルチエージェントゲームにおいて,政策性能とサンプル効率の利点を生かし,解釈可能性とトレーニング安定性の向上を図っている。
論文 参考訳(メタデータ) (2023-02-23T18:53:09Z) - Learning to Generate All Feasible Actions [4.333208181196761]
アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。
本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。
エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文 参考訳(メタデータ) (2023-01-26T23:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。