論文の概要: FORMICA: Decision-Focused Learning for Communication-Free Multi-Robot Task Allocation
- arxiv url: http://arxiv.org/abs/2602.18622v1
- Date: Fri, 20 Feb 2026 21:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.607838
- Title: FORMICA: Decision-Focused Learning for Communication-Free Multi-Robot Task Allocation
- Title(参考訳): FORMICA: コミュニケーション自由なマルチロボットタスクアロケーションのための意思決定型学習
- Authors: Antonio Lopez, Jack Muirhead, Carlo Pinciroli,
- Abstract要約: ロボット間通信を使わずに高品質なタスクアロケーションを実現する学習ベースのフレームワークを提案する。
提案手法は,解析的平均場近似における系統的誤差を補正するために入札分布を推定する。
我々は予測器をエンドツーエンドに訓練し、予測エラーよりもタスク割り当てレグレを最小化する。
- 参考スコア(独自算出の注目度): 0.802904964931021
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Most multi-robot task allocation methods rely on communication to resolve conflicts and reach consistent assignments. In environments with limited bandwidth, degraded infrastructure, or adversarial interference, existing approaches degrade sharply. We introduce a learning-based framework that achieves high-quality task allocation without any robot-to-robot communication. The key idea is that robots coordinate implicitly by predicting teammates' bids: if each robot can anticipate competition for a task, it can adjust its choices accordingly. Our method predicts bid distributions to correct systematic errors in analytical mean-field approximations. While analytical predictions assume idealized conditions (uniform distributions, known bid functions), our learned approach adapts to task clustering and spatial heterogeneity. Inspired by Smart Predict-then-Optimize (SPO), we train predictors end-to-end to minimize Task Allocation Regret rather than prediction error. To scale to large swarms, we develop a mean-field approximation where each robot predicts the distribution of competing bids rather than individual bids, reducing complexity from $O(NT)$ to $O(T)$. We call our approach FORMICA: Field-Oriented Regret-Minimizing Implicit Coordination Algorithm. Experiments show FORMICA substantially outperforms a natural analytical baseline. In scenarios with 16 robots and 64 tasks, our approach improves system reward by 17% and approaches the optimal MILP solution. When deployed on larger scenarios (256 robots, 4096 tasks), the same model improves performance by 7%, demonstrating strong generalization. Training requires only 21 seconds on a laptop, enabling rapid adaptation to new environments.
- Abstract(参考訳): 多くのマルチロボットタスク割り当て手法は、競合を解消し、一貫した割り当てに到達するために通信に依存している。
帯域幅が限られている環境では、インフラの劣化、あるいは敵の干渉により、既存のアプローチは急速に低下する。
ロボット間通信を使わずに高品質なタスクアロケーションを実現する学習ベースのフレームワークを提案する。
重要なアイデアは、ロボットがチームメイトの入札を予測することで暗黙的に協調することである。
提案手法は,解析的平均場近似における系統的誤差を補正するために入札分布を推定する。
解析的予測は理想的な条件(一様分布、既知の入札関数)を仮定するが、我々の学習手法はタスククラスタリングや空間的不均一性に適応する。
Smart Predict-then-Optimize (SPO)にインスパイアされ、予測器をエンドツーエンドにトレーニングし、予測エラーよりもタスク割り当てレグレを最小化する。
大規模群にスケールするために、各ロボットが個々の入札よりも競合する入札の分布を予測する平均場近似を開発し、複雑さを$O(NT)$から$O(T)$に減らした。
我々は,フィールド指向回帰最小化インプリシットコーディネートアルゴリズム FORMICA と呼ぶ。
実験により、FORMICAは自然解析の基準線を著しく上回っていることが示された。
16のロボットと64のタスクを持つシナリオでは、システム報酬を17%改善し、最適MILPソリューションにアプローチする。
より大きなシナリオ(256のロボット、4096のタスク)にデプロイすると、同じモデルでパフォーマンスが7%向上し、強力な一般化が示される。
トレーニングはラップトップ上で21秒しか必要とせず、新しい環境への迅速な適応を可能にする。
関連論文リスト
- EmbodiedAgent: A Scalable Hierarchical Approach to Overcome Practical Challenge in Multi-Robot Control [2.9374620169143673]
EmbodiedAgentは異種マルチロボット制御のための階層的なフレームワークである。
提案手法は,次アクション予測パラダイムと構造化メモリシステムを統合し,タスクを実行可能なロボットスキルに分解する。
100のシナリオにまたがる18,000以上のアノテートされたプランニングインスタンスのデータセットであるMultiPlan+を紹介します。
論文 参考訳(メタデータ) (2025-04-14T09:33:42Z) - Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination [1.5970870882365]
マルチロボットチームのための能力認識共有ハイパーネットワークス(CASH)を提案する。
CASHは、ハイパーネットワークを使用してフレキシブルな共有ポリシを効率的に学習する、ソフトウェイト共有アーキテクチャである。
トレーニングとゼロショットの一般化の両方において、CASHは性能とサンプル効率の点で、ベースラインアーキテクチャを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-01-10T15:39:39Z) - Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Scalable Multi-Robot Informative Path Planning for Target Mapping via Deep Reinforcement Learning [11.134855513221359]
マルチロボットインフォーマティブパス計画問題に対する深層強化学習手法を提案する。
ここでは、各ロボットが発見した目標を最大化し、未知の静的障害物を回避し、ロボット同士の衝突を防ぐ。
提案手法は、発見対象数において、最先端のアプローチを少なくとも26.2%上回っている。
論文 参考訳(メタデータ) (2024-09-25T14:27:37Z) - Optimal decision making in robotic assembly and other trial-and-error
tasks [1.0660480034605238]
本研究では,(1)終末成功/失敗の低エントロピー指標と(2)信頼できない(高エントロピー)データを提供する問題のクラスについて検討し,課題の最終結果を予測する。
フェール予測器の混乱行列に基づいてメイスパンを予測する閉形式解を導出する。
これにより、ロボットはプロダクション環境で障害予測を学習し、実際に時間を節約したときのみプリエンプティブポリシーを採用することができる。
論文 参考訳(メタデータ) (2023-01-25T22:07:50Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Intelligent Trajectory Design for RIS-NOMA aided Multi-robot
Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。
ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文 参考訳(メタデータ) (2022-05-03T17:14:47Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Graph Neural Networks for Decentralized Multi-Robot Submodular Action
Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。
分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。
大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文 参考訳(メタデータ) (2021-05-18T15:32:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。