論文の概要: When Should Agents Coordinate in Differentiable Sequential Decision Problems?
- arxiv url: http://arxiv.org/abs/2602.03674v1
- Date: Tue, 03 Feb 2026 15:55:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.143649
- Title: When Should Agents Coordinate in Differentiable Sequential Decision Problems?
- Title(参考訳): 異なる順序決定問題において、エージェントはいつ調整すべきか?
- Authors: Caleb Probine, Su Ann Low, David Fridovich-Keil, Ufuk Topcu,
- Abstract要約: 本研究では,多種多様な動作計画問題におけるコーディネートの価値について検討する。
エージェントのチームがいつ協調すべきかを決定するために、この2階推論を使用するアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 20.719399389679072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-robot teams must coordinate to operate effectively. When a team operates in an uncoordinated manner, and agents choose actions that are only individually optimal, the team's outcome can suffer. However, in many domains, coordination requires costly communication. We explore the value of coordination in a broad class of differentiable motion-planning problems. In particular, we model coordinated behavior as a spectrum: at one extreme, agents jointly optimize a common team objective, and at the other, agents make unilaterally optimal decisions given their individual decision variables, i.e., they operate at Nash equilibria. We then demonstrate that reasoning about coordination in differentiable motion-planning problems reduces to reasoning about the second-order properties of agents' objectives, and we provide algorithms that use this second-order reasoning to determine at which times a team of agents should coordinate.
- Abstract(参考訳): マルチロボットチームは、効果的に運用するために調整する必要があります。
チームが協調的でないやり方で活動し、エージェントが個別に最適な行動を選択すると、チームの成果が損なわれる可能性がある。
しかし、多くのドメインでは、調整にはコストのかかる通信が必要である。
本研究では,多種多様な動作計画問題における協調性の価値について検討する。
特に、協調行動はスペクトルとしてモデル化する: エージェントは共通のチームの目的を共同で最適化し、エージェントは個々の決定変数から一方的に最適な決定をする。
次に, エージェントの目的の2次特性を推論することで, 異なる動作計画問題におけるコーディネーションの推論が減少することを示し, エージェントのチームがどのタイミングでコーディネーションを行うべきかを決定するために, この2次推論を用いたアルゴリズムを提供する。
関連論文リスト
- TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size [54.0714652192002]
物理に基づくヒューマノイド制御は、現実的でハイパフォーマンスな単一エージェントの動作を可能にするために顕著な進歩を遂げた。
我々は,複数の協力エージェント間で協調的なHOIを処理するための,単一の分散政策を実現するためのフレームワークであるTeamHOIを提案する。
論文 参考訳(メタデータ) (2026-03-09T05:52:13Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Automated Task-Time Interventions to Improve Teamwork using Imitation
Learning [5.423490734916741]
私たちは、チームメンバー間の調整を改善するための自動化された介入アプローチTICを提示します。
我々はまず、過去のタスク実行データからチームの振る舞いの生成モデルを学ぶ。
次に、学習した生成モデルとチームのタスク目標(共有報酬)を使用して、実行時の介入をアルゴリズム的に生成する。
論文 参考訳(メタデータ) (2023-03-01T11:09:06Z) - Multi-Agent Coordination via Multi-Level Communication [29.388570369796586]
シークエンシャル・コミュニケーション(SeqComm)という新しいマルチレベル通信方式を提案する。
本稿では,新しいマルチレベル通信方式であるSeqCommを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:08:03Z) - Online Submodular Coordination with Bounded Tracking Regret: Theory,
Algorithm, and Applications to Multi-Robot Coordination [15.588080817106563]
私たちは、動的で非構造的で敵対的な環境で複数のロボットが協調する未来の自律性に動機付けられています。
本稿では,前兆を知っており,時間変化の時間的変動を考慮に入れた,有界な追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを提案する。
提案アルゴリズムは,Fisherらによるセミナル逐次グリーディアルゴリズムを予測不能な環境に一般化し,準モジュラリティとアルゴリズムを利用して,最良の専門家を追跡する。
論文 参考訳(メタデータ) (2022-09-26T05:31:34Z) - Formalizing the Problem of Side Effect Regularization [81.97441214404247]
本稿では,補助ゲームフレームワークを用いたサイドエフェクト正規化のための公式な基準を提案する。
これらのゲームでは、エージェントは部分的に観測可能なマルコフ決定プロセスを解決する。
このPOMDPは、エージェントが将来的なタスクをこなす能力と、プロキシ報酬を交換することで解決されることを示す。
論文 参考訳(メタデータ) (2022-06-23T16:36:13Z) - Private and Byzantine-Proof Cooperative Decision-Making [15.609414012418043]
協調バンディット問題は、多腕バンディットと同時に相互作用するエージェントのグループを含むマルチエージェント決定問題である。
本稿では、エージェントがアクションシーケンスに関して通信をプライベートにしたい場合と、エージェントがビザンチンになり得る場合の2つの設定の下で、バンドイット問題を調査する。
我々は,(a)微分プライベートかつ(b)プライベートでありながら,最適な後悔を得る高信頼有界アルゴリズムを提供する。
我々の分散アルゴリズムはエージェント間の接続のネットワークに関する情報を必要とせず、大規模な動的システムにスケーラブルにします。
論文 参考訳(メタデータ) (2022-05-27T18:03:54Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。