Fugu-MT 論文翻訳(概要): Multiagent Reinforcement Learning with Neighbor Action Estimation

論文の概要: Multiagent Reinforcement Learning with Neighbor Action Estimation

arxiv url: http://arxiv.org/abs/2601.04511v1
Date: Thu, 08 Jan 2026 02:26:57 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-09 17:01:52.992671
Title: Multiagent Reinforcement Learning with Neighbor Action Estimation
Title（参考訳）: 隣接行動推定を用いたマルチエージェント強化学習
Authors: Zhenglong Luo, Zhiyong Chen, Aoxiang Liu,
Abstract要約: 本稿では,エージェントの振る舞いを推論するための行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。工学的応用レベルでは、このフレームワークはデュアルアームロボット操作タスクで実装され、検証されている。
参考スコア（独自算出の注目度）: 5.226225544973531
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multiagent reinforcement learning, as a prominent intelligent paradigm, enables collaborative decision-making within complex systems. However, existing approaches often rely on explicit action exchange between agents to evaluate action value functions, which is frequently impractical in real-world engineering environments due to communication constraints, latency, energy consumption, and reliability requirements. From an artificial intelligence perspective, this paper proposes an enhanced multiagent reinforcement learning framework that employs action estimation neural networks to infer agent behaviors. By integrating a lightweight action estimation module, each agent infers neighboring agents' behaviors using only locally observable information, enabling collaborative policy learning without explicit action sharing. This approach is fully compatible with standard TD3 algorithms and scalable to larger multiagent systems. At the engineering application level, this framework has been implemented and validated in dual-arm robotic manipulation tasks: two robotic arms collaboratively lift objects. Experimental results demonstrate that this approach significantly enhances the robustness and deployment feasibility of real-world robotic systems while reducing dependence on information infrastructure. Overall, this research advances the development of decentralized multiagent artificial intelligence systems while enabling AI to operate effectively in dynamic, information-constrained real-world environments.
Abstract（参考訳）: インテリジェントなパラダイムとしてのマルチエージェント強化学習は、複雑なシステム内での協調的な意思決定を可能にする。しかし、既存のアプローチはエージェント間の明示的なアクション交換に頼り、実際のエンジニアリング環境では、通信の制約、遅延、エネルギー消費、信頼性の要求のため、しばしば実用的ではないアクション値関数を評価する。本稿では,エージェントの振る舞いを推論するために,行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。軽量な行動推定モジュールを統合することにより、各エージェントは、局所的に観測可能な情報のみを使用して、近隣エージェントの行動を推測し、明示的な行動共有なしに協調的な政策学習を可能にする。このアプローチは標準のTD3アルゴリズムと完全に互換性があり、大規模マルチエージェントシステムにスケーラブルである。工学的応用レベルでは、このフレームワークは2つのロボットアームが協調的にオブジェクトを持ち上げるという、デュアルアームのロボット操作タスクで実装され、検証されている。実験により,本手法は,情報基盤への依存を低減しつつ,実世界のロボットシステムの堅牢性と展開可能性を大幅に向上させることを示した。全体として、この研究は、分散化されたマルチエージェント人工知能システムの開発を前進させ、AIが動的で情報に制約された現実世界環境で効果的に動作できるようにする。

関連論文リスト

Multi-Agent Model-Based Reinforcement Learning with Joint State-Action Learned Embeddings [10.36125908359289]
モデルに基づくマルチエージェント強化学習フレームワークを提案する。我々は変分自動エンコーダで訓練された世界モデルを設計し、状態-作用学習埋め込みを用いてモデルを増強する。想像された軌道とSALEに基づく行動値とを結合することにより、エージェントは彼らの選択が集団的な結果にどのように影響するかをより深く理解する。
論文参考訳（メタデータ） (2026-02-13T01:57:21Z)
MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。 6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2026-02-03T09:47:49Z)
IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration [0.0]
本稿では,2次元屋内環境における課題に対処するために,MARL(Multi-Agent Reinforcement Learning)を実装した。政策訓練は、不確実性の下で創発的な協調行動と意思決定を達成することを目的としている。
論文参考訳（メタデータ） (2026-02-02T22:08:41Z)
Scalable Multiagent Reinforcement Learning with Collective Influence Estimation [5.050035210247092]
本稿では,集団影響推定ネットワークを付加したマルチエージェント学習フレームワークを提案する。タスクオブジェクトに対する他のエージェントの集団的影響を明示的にモデル化することにより、各エージェントはクリティカルな相互作用情報を推測することができる。実験の結果,提案手法は通信制限環境下での安定かつ効率的な協調を実現することがわかった。
論文参考訳（メタデータ） (2026-01-13T04:24:11Z)
InterAgent: Physics-based Multi-agent Command Execution via Diffusion on Interaction Graphs [72.5651722107621]
InterAgentはテキスト駆動型物理ベースのマルチエージェントヒューマノイド制御のためのエンドツーエンドフレームワークである。本稿では,マルチストリームブロックを備えた自己回帰拡散トランスフォーマーを提案する。また,空間依存性の微粒化を明示的に捉えた対話グラフのエクスセプション表現を提案する。
論文参考訳（メタデータ） (2025-12-08T10:46:01Z)
Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey [11.537225726120495]
ファンデーションモデルは、断片化されたアーキテクチャをマルチモーダル推論とコンテキスト適応を備えたスケーラブルなバックボーンに統一することで、AIを再構築した。 FMを認知のコアとして、エージェントは自律性、一般化、自己回帰を達成するためにルールベースの振る舞いを超越する。この調査は、適応的でリソース効率の良いエージェントAIシステムの、最初の体系的な特徴を提供する。
論文参考訳（メタデータ） (2025-09-30T02:37:52Z)
Towards General Agentic Intelligence via Environment Scaling [78.66355092082253]
高度なエージェントインテリジェンスは、現実世界のアプリケーションに大規模言語モデルをデプロイするための前提条件である。完全にシミュレートされた異種環境を自動的に構築するスケーラブルなフレームワークを設計する。エージェントベンチマーク, tau-bench, tau2-Bench, ACEBenchの実験により, トレーニングモデルである AgentScaler が, モデルの関数呼び出し能力を大幅に向上することを示した。
論文参考訳（メタデータ） (2025-09-16T17:57:20Z)
Emergence of Roles in Robotic Teams with Model Sharing and Limited Communication [0.0]
本稿では,単一エージェントに学習を集中させるマルチエージェント捕食システムにおける強化学習戦略を提案する。このアプローチは、MARLや集中学習モデルのようなアプローチと比較して、計算とエネルギーの需要を大幅に削減することを目的としている。
論文参考訳（メタデータ） (2025-05-01T14:05:46Z)
Cooperative Multi-Agent Planning with Adaptive Skill Synthesis [16.228784877899976]
本稿では、視覚言語モデル(VLM)を動的スキルライブラリと統合し、分散化されたクローズドループ決定のための構造化通信を行う新しいマルチエージェントアーキテクチャを提案する。デモからブートストラップされたスキルライブラリは、プラナー誘導タスクを通じて進化し、適応戦略を実現する。我々は、その最先端のMARLベースラインに対して、対称シナリオと非対称シナリオの両方で強力な性能を示す。
論文参考訳（メタデータ） (2025-02-14T13:23:18Z)
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。 IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文参考訳（メタデータ） (2024-07-09T17:33:24Z)
AntEval: Evaluation of Social Interaction Competencies in LLM-Driven Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文参考訳（メタデータ） (2024-01-12T11:18:00Z)
Interactive Autonomous Navigation with Internal State Inference and Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-11-27T18:57:42Z)
Concept Learning for Interpretable Multi-Agent Reinforcement Learning [5.179808182296037]
本稿では,ドメインエキスパートからの解釈可能な概念を,マルチエージェント強化学習を通じて学習したモデルに組み込む手法を提案する。これにより、専門家は、結果のコンセプトモデルについて、これらのハイレベルな概念を実行時に推論するだけでなく、パフォーマンスを改善するために介入し、正しい予測を行うことができる。シミュレーションおよび実世界の協調競争型マルチエージェントゲームにおいて,政策性能とサンプル効率の利点を生かし,解釈可能性とトレーニング安定性の向上を図っている。
論文参考訳（メタデータ） (2023-02-23T18:53:09Z)
Learning to Generate All Feasible Actions [4.333208181196761]
アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文参考訳（メタデータ） (2023-01-26T23:15:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。