論文の概要: Train-Small Deploy-Large: Leveraging Diffusion-Based Multi-Robot Planning
- arxiv url: http://arxiv.org/abs/2604.06598v1
- Date: Wed, 08 Apr 2026 02:32:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.301879
- Title: Train-Small Deploy-Large: Leveraging Diffusion-Based Multi-Robot Planning
- Title(参考訳): Train-Small Deploy-Large: 拡散に基づくマルチロボット計画の活用
- Authors: Siddharth Singh, Soumee Guha, Qing Chang, Scott Acton,
- Abstract要約: 学習ベースのマルチボットパス計画手法は、変更のスケールアップや一般化に苦労する。
本稿では,動的に多様なエージェントを扱える拡散モデルに基づくプランナを提案する。
我々のアプローチは限られた数のエージェントを訓練し、デプロイ中に多数のエージェントに効果的に一般化する。
- 参考スコア(独自算出の注目度): 5.866736642041551
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Learning based multi-robot path planning methods struggle to scale or generalize to changes, particularly variations in the number of robots during deployment. Most existing methods are trained on a fixed number of robots and may tolerate a reduced number during testing, but typically fail when the number increases. Additionally, training such methods for a larger number of agents can be both time consuming and computationally expensive. However, analytical methods can struggle to scale computationally or handle dynamic changes in the environment. In this work, we propose to leverage a diffusion model based planner capable of handling dynamically varying number of agents. Our approach is trained on a limited number of agents and generalizes effectively to larger numbers of agents during deployment. Results show that integrating a single shared diffusion model based planner with dedicated inter-agent attention computation and temporal convolution enables a train small deploy-large paradigm with good accuracy. We validate our method across multiple scenarios and compare the performance with existing multi-agent reinforcement learning techniques and heuristic control based methods.
- Abstract(参考訳): 学習ベースのマルチロボットパス計画手法は、特にデプロイメント中のロボットの数の変化など、変更のスケールアップや一般化に苦慮している。
既存のほとんどのメソッドは、一定数のロボットでトレーニングされており、テスト中に減少する数を許容するが、通常、数が増加すると失敗する。
さらに、多数のエージェントに対してそのような手法を訓練することは、時間と計算コストの両方を消費する。
しかし、解析的手法は、計算的にスケールしたり、環境の動的変化を処理するのに苦労することがある。
本研究では,動的に多様なエージェントを扱える拡散モデルに基づくプランナを提案する。
我々のアプローチは限られた数のエージェントを訓練し、デプロイ中に多数のエージェントに効果的に一般化する。
その結果,1つの共有拡散モデルに基づくプランナと,専用のエージェント間注意計算と時間的畳み込みを組み合わせることで,列車の小型展開・大規模パラダイムを精度良く実現できることが示唆された。
提案手法を複数のシナリオで検証し,既存のマルチエージェント強化学習手法とヒューリスティック制御に基づく手法との比較を行った。
関連論文リスト
- AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.10083973844841]
AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。
各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。
シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文 参考訳(メタデータ) (2026-02-03T19:18:28Z) - Abstracting Robot Manipulation Skills via Mixture-of-Experts Diffusion Policies [13.826293542795938]
拡散ベースのポリシーは最近、ロボット操作の強い結果を示しているが、マルチタスクシナリオへの拡張は、モデルサイズとデモのスケーリングコストの上昇によって妨げられている。
本稿では,SMP(Skill Mixture-of-Experts Policy)について紹介する。SMP(Skill Mixture-of-Experts Policy)は,SMP(Skill Mixture-of-Experts Policy)とSMP(Skill Mixture-of-Experts Policy)の2つについて述べる。
シミュレーションおよびマルチタスク学習および移動学習タスクを備えた実デュアルアームプラットフォーム上でSMPを検証し、SMPは大きな拡散ベースラインよりも高い成功率と推論コストを著しく低減する。
論文 参考訳(メタデータ) (2026-01-29T04:17:56Z) - Scalarization for Multi-Task and Multi-Domain Learning at Scale [15.545810422759295]
複数の入力ドメインと/または出力タスクで単一のモデルをトレーニングすることで、複数のソースからの情報を統一されたバックボーンに圧縮することができる。
しかし、これらのネットワークの最適化は、異なるタスクやドメイン間の相違による課題である。
論文 参考訳(メタデータ) (2023-10-13T07:31:04Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - CLAS: Coordinating Multi-Robot Manipulation with Central Latent Action
Spaces [9.578169216444813]
本稿では,異なるエージェント間で共有される学習された潜在行動空間を通じて,マルチロボット操作を協調する手法を提案する。
シミュレーションされたマルチロボット操作タスクにおいて本手法を検証し,サンプル効率と学習性能の観点から,従来のベースラインよりも改善したことを示す。
論文 参考訳(メタデータ) (2022-11-28T23:20:47Z) - K-nearest Multi-agent Deep Reinforcement Learning for Collaborative
Tasks with a Variable Number of Agents [13.110291070230815]
エージェント数の変化を考慮した多エージェント協調作業のための深層強化学習アルゴリズムを提案する。
実運用現場で現実的なシナリオを生成するために日立が開発した艦隊管理シミュレータを用いて,本アルゴリズムの適用例を示した。
論文 参考訳(メタデータ) (2022-01-18T16:14:24Z) - Scalable Reinforcement Learning Policies for Multi-Agent Control [29.42370205354368]
目標追跡のためのスケーラブルな制御ポリシーを学習するためのマルチエージェント強化学習(MARL)手法を開発した。
最大1000人の追従者による1000の目標追跡タスクの結果を示す。
論文 参考訳(メタデータ) (2020-11-16T16:11:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。