論文の概要: Online Submodular Coordination with Bounded Tracking Regret: Theory,
Algorithm, and Applications to Multi-Robot Coordination
- arxiv url: http://arxiv.org/abs/2209.12429v1
- Date: Mon, 26 Sep 2022 05:31:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 18:30:56.234380
- Title: Online Submodular Coordination with Bounded Tracking Regret: Theory,
Algorithm, and Applications to Multi-Robot Coordination
- Title(参考訳): 有界追跡後悔を伴うオンラインサブモジュラーコーディネーション:理論、アルゴリズム、およびマルチロボットコーディネーションへの応用
- Authors: Zirui Xu and Hongyu Zhou and Vasileios Tzoumas
- Abstract要約: 私たちは、動的で非構造的で敵対的な環境で複数のロボットが協調する未来の自律性に動機付けられています。
本稿では,前兆を知っており,時間変化の時間的変動を考慮に入れた,有界な追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを提案する。
提案アルゴリズムは,Fisherらによるセミナル逐次グリーディアルゴリズムを予測不能な環境に一般化し,準モジュラリティとアルゴリズムを利用して,最良の専門家を追跡する。
- 参考スコア(独自算出の注目度): 15.588080817106563
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We enable efficient and effective coordination in unpredictable environments,
ie., in environments whose future evolution is unknown a priori and even
adversarial. We are motivated by the future of autonomy that involves multiple
robots coordinating in dynamic, unstructured, and adversarial environments to
complete complex tasks such as target tracking, image covering, and area
monitoring. Such tasks are often modeled as submodular maximization
coordination problems. We thus introduce the first submodular coordination
algorithm with bounded tracking regret, ie., with bounded suboptimality with
respect to optimal time-varying actions that know the future a priori. The
bound gracefully degrades with the environments' capacity to change
adversarially. It also quantifies how often the robots must re-select actions
to "learn" to coordinate as if they knew the future a priori. Our algorithm
generalizes the seminal Sequential Greedy algorithm by Fisher et al. to
unpredictable environments, leveraging submodularity and algorithms for the
problem of tracking the best expert. We validate our algorithm in simulated
scenarios of target tracking.
- Abstract(参考訳): 我々は予測不能な環境で効率的かつ効果的な協調を可能にする。
将来の進化が不明な環境では、先行的かつ逆境さえある。
目標追跡、画像被覆、エリア監視といった複雑なタスクを完了するために、動的、非構造化、敵対的な環境を協調する複数のロボットが関与する自律性の未来にモチベーションを与えています。
このようなタスクは、しばしば部分モジュラー最大化調整問題としてモデル化される。
そこで我々は,有界な追跡後悔を伴う最初の部分モジュラコーディネートアルゴリズムを導入する。
有界な準最適性は、未来を先入観として知る最適な時間変化作用に向けられる。
環境が逆向きに変化する能力によって、境界は優雅に劣化する。
また、ロボットが前もって未来を知っていたかのように"学習"するために行動を再選択する頻度も測定する。
本アルゴリズムは,fisherらによるseminal sequential greedyアルゴリズムを予測不能な環境に一般化し,最善のエキスパートを追跡するためのサブモジュラリティとアルゴリズムを活用する。
ターゲット追跡のシミュレーションシナリオでアルゴリズムを検証する。
関連論文リスト
- Performance-Aware Self-Configurable Multi-Agent Networks: A Distributed Submodular Approach for Simultaneous Coordination and Network Design [3.5527561584422465]
本稿では、AlterNAting Coordination and Network-Design Algorithm(Anaconda)を紹介する。
Anacondaはスケーラブルなアルゴリズムで、ほぼ最適性を保証する。
地域モニタリングのシミュレーションシナリオを実演し,それを最先端のアルゴリズムと比較する。
論文 参考訳(メタデータ) (2024-09-02T18:11:33Z) - Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks [2.8936428431504164]
複数のロボット間のスケーラブルでほぼ最適な関節運動計画を可能にする分散協調パラダイムを提供する。
我々のアルゴリズムは、競合する準最適アルゴリズムよりも2桁高速である。
最大45台のロボットによる監視タスクのシミュレーションでは、1Hzのオーダーでリアルタイム計画が可能で、カバー性能も優れている。
論文 参考訳(メタデータ) (2024-07-15T01:25:39Z) - Leveraging Untrustworthy Commands for Multi-Robot Coordination in
Unpredictable Environments: A Bandit Submodular Maximization Approach [5.087424045458335]
本研究では,信頼できない外部コマンドを持つ予測不可能な環境におけるマルチエージェント協調の問題について検討する。
外部コマンドが任意に悪い場合でも性能保証を行うアルゴリズム,Meta Bandit Sequential Greedyを提供する。
論文 参考訳(メタデータ) (2023-09-28T04:26:06Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Bandit Submodular Maximization for Multi-Robot Coordination in
Unpredictable and Partially Observable Environments [3.0294344089697596]
帯域フィードバックと追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを導入する。
盗賊のフィードバックは ロボットが 後ろ向きに計算できる能力だ 彼らの選択した行動の効果だけ
後悔の追跡はアルゴリズムの最適化の亜最適性であり、先駆的な未来を完全に知る最適な時間変化アクションである。
論文 参考訳(メタデータ) (2023-05-22T07:44:54Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z) - Continuous Control for Searching and Planning with a Learned Model [5.196149362684628]
計画機能を備えた意思決定エージェントは、Chess、Shogi、Goといった挑戦的なドメインで大きな成功を収めています。
研究者らは環境との相互作用を通じて動的モデルを学ぶことができるMuZeroアルゴリズムを提案した。
提案アルゴリズムは,最先端のモデルフリー深部強化学習アルゴリズムであるソフトアクター・クリティック(SAC)アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T19:10:41Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。