論文の概要: Learning to Lead Themselves: Agentic AI in MAS using MARL
- arxiv url: http://arxiv.org/abs/2510.00022v1
- Date: Wed, 24 Sep 2025 11:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.100638
- Title: Learning to Lead Themselves: Agentic AI in MAS using MARL
- Title(参考訳): MARLを用いたMASにおけるエージェントAI
- Authors: Ansh Kamthan,
- Abstract要約: 本稿では,エージェント人工知能,エージェントが独立して,適応的かつ積極的に行動することで,マルチエージェントシステムにおけるタスク割り当てとコーディネーションを改善する方法について検討する。
協調型マルチエージェント強化学習環境における問題を定式化し、PyTorchにおけるIPPOと呼ばれる軽量なマルチエージェントプロキシポリシー最適化を実装した。
実験はPettingZoo環境で行われ、複数の均質なドローンやエージェントが、明示的なコミュニケーションなしに異なるターゲットをカバーするために自己組織化されなければならない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As autonomous systems move from prototypes to real deployments, the ability of multiple agents to make decentralized, cooperative decisions becomes a core requirement. This paper examines how agentic artificial intelligence, agents that act independently, adaptively and proactively can improve task allocation and coordination in multi-agent systems, with primary emphasis on drone delivery and secondary relevance to warehouse automation. We formulate the problem in a cooperative multi-agent reinforcement learning setting and implement a lightweight multi-agent Proximal Policy Optimization, called IPPO, approach in PyTorch under a centralized-training, decentralized-execution paradigm. Experiments are conducted in PettingZoo environment, where multiple homogeneous drones or agents must self-organize to cover distinct targets without explicit communication.
- Abstract(参考訳): 自律的なシステムがプロトタイプから実際のデプロイに移行するにつれ、複数のエージェントが分散化され、協調的な決定を下す能力がコア要件になります。
本稿では,多エージェントシステムにおけるタスクアロケーションとコーディネーションを,独立に,適応的に,積極的に行動するエージェントであるエージェント人工知能が,ドローンの配送と倉庫自動化への二次的関連性を重視しながら,どのようにしてタスクアロケーションとコーディネートを改善するかを検討する。
我々は、協調型マルチエージェント強化学習環境における問題を定式化し、PyTorchにおける集中学習型分散実行パラダイムの下で、IPPOと呼ばれる軽量なマルチエージェントプロキシポリシー最適化を実装した。
実験はPettingZoo環境で行われ、複数の均質なドローンやエージェントが、明示的なコミュニケーションなしに異なるターゲットをカバーするために自己組織化されなければならない。
関連論文リスト
- AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的ロールや集中制御の以前のアプローチとは異なり、AgentNetはエージェントがローカルの専門知識とコンテキストに基づいて接続とタスクのルーティングを調整することができる。
実験の結果,AgentNetは単一エージェントと集中型マルチエージェントのベースラインよりも高いタスク精度を実現することがわかった。
論文 参考訳(メタデータ) (2025-04-01T09:45:25Z) - MorphAgent: Empowering Agents through Self-Evolving Profiles and Decentralized Collaboration [11.01813164951313]
本稿では,新しい自律型・自己組織化型・適応型多エージェントシステムであるMorphAgentを紹介する。
このアプローチでは,3つの主要な指標を通じて最適化された自己進化エージェントプロファイルを採用し,エージェントが個々の専門知識を磨き直す。
実験の結果,MorphAgentはタスク性能や要求の変化に対する適応性という点で,既存のフレームワークよりも優れていた。
論文 参考訳(メタデータ) (2024-10-19T09:10:49Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z) - Goals are Enough: Inducing AdHoc cooperation among unseen Multi-Agent
systems in IMFs [5.187177458114381]
インテントベースのマネジメントは、次世代モバイルネットワークにおける顧客の期待を達成する上で重要な役割を果たす。
従来の手法では、それぞれの期待を独立して扱う傾向があるため、効率的な資源管理を行うことはできない。
本稿では,AIをベースとしたスーパーバイザエージェントを活用して,事前学習エージェントを並列に編成するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-26T14:21:36Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z) - Counterfactual Multi-Agent Policy Gradients [47.45255170608965]
本稿では,COMAポリシーグラデーションと呼ばれる新しいマルチエージェントアクター批判手法を提案する。
COMAは中央集権的な批評家を用いてQ-関数を推定し、エージェントのポリシーを最適化する。
我々は,StarCraftユニットのマイクロマネジメントにおけるテストベッドにおけるCOMAの評価を行った。
論文 参考訳(メタデータ) (2017-05-24T18:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。