論文の概要: Leveraging Untrustworthy Commands for Multi-Robot Coordination in
Unpredictable Environments: A Bandit Submodular Maximization Approach
- arxiv url: http://arxiv.org/abs/2309.16161v1
- Date: Thu, 28 Sep 2023 04:26:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-29 16:11:10.798483
- Title: Leveraging Untrustworthy Commands for Multi-Robot Coordination in
Unpredictable Environments: A Bandit Submodular Maximization Approach
- Title(参考訳): 予測不能環境におけるマルチロボット協調のための信頼できないコマンドの活用:バンドサブモジュラー最大化アプローチ
- Authors: Zirui Xu, Xiaofeng Lin, Vasileios Tzoumas
- Abstract要約: 本研究では,信頼できない外部コマンドを持つ予測不可能な環境におけるマルチエージェント協調の問題について検討する。
外部コマンドが任意に悪い場合でも性能保証を行うアルゴリズム,Meta Bandit Sequential Greedyを提供する。
- 参考スコア(独自算出の注目度): 5.087424045458335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of multi-agent coordination in unpredictable and
partially-observable environments with untrustworthy external commands. The
commands are actions suggested to the robots, and are untrustworthy in that
their performance guarantees, if any, are unknown. Such commands may be
generated by human operators or machine learning algorithms and, although
untrustworthy, can often increase the robots' performance in complex
multi-robot tasks. We are motivated by complex multi-robot tasks such as target
tracking, environmental mapping, and area monitoring. Such tasks are often
modeled as submodular maximization problems due to the information overlap
among the robots. We provide an algorithm, Meta Bandit Sequential Greedy
(MetaBSG), which enjoys performance guarantees even when the external commands
are arbitrarily bad. MetaBSG leverages a meta-algorithm to learn whether the
robots should follow the commands or a recently developed submodular
coordination algorithm, Bandit Sequential Greedy (BSG) [1], which has
performance guarantees even in unpredictable and partially-observable
environments. Particularly, MetaBSG asymptotically can achieve the better
performance out of the commands and the BSG algorithm, quantifying its
suboptimality against the optimal time-varying multi-robot actions in
hindsight. Thus, MetaBSG can be interpreted as robustifying the untrustworthy
commands. We validate our algorithm in simulated scenarios of multi-target
tracking.
- Abstract(参考訳): 予測不能かつ部分的に観測不能な環境でのマルチエージェント協調の問題について検討する。
コマンドはロボットに提案されるアクションであり、パフォーマンスが不明確であれば保証されることは信頼できない。
このようなコマンドは、人間のオペレータや機械学習アルゴリズムによって生成され、信頼できないが、複雑なマルチロボットタスクにおいて、ロボットのパフォーマンスを高めることができる。
ターゲット追跡や環境マッピング,エリア監視といった,複雑なマルチロボットタスクがモチベーションになっています。
このようなタスクは、ロボット間での情報重なり合うため、しばしばサブモジュールの最大化問題としてモデル化される。
外部コマンドが任意に悪い場合でも性能保証を享受できるmeta bandit sequential greedy(metabsg)というアルゴリズムを提供する。
MetaBSGはメタアルゴリズムを利用して、ロボットがコマンドに従うべきか、最近開発されたサブモジュール調整アルゴリズムBandit Sequential Greedy (BSG) [1]を学習する。
特にMetaBSGは、コマンドとBSGアルゴリズムのより良い性能を漸近的に達成し、その亜最適性を、後向きの最適な時間変化マルチロボットアクションに対して定量化することができる。
したがって、metabsgは信頼できない命令の堅牢化と解釈できる。
本アルゴリズムをマルチターゲット追跡のシミュレーションシナリオで検証する。
関連論文リスト
- Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - Accelerating Search-Based Planning for Multi-Robot Manipulation by Leveraging Online-Generated Experiences [20.879194337982803]
MAPF(Multi-Agent Path-Finding)アルゴリズムは、離散的な2Dドメインで保証され、厳密な保証を提供する。
本稿では,その反復的かつ漸進的な性質を活用して,競合に基づく探索アルゴリズムを高速化する手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T20:31:07Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Robustness for Free: Quality-Diversity Driven Discovery of Agile Soft
Robotic Gaits [0.7829600874436199]
地形変化に頑健な歩留まりのレパートリーを,品質多様性アルゴリズムがいかに生み出すかを示す。
このロバスト性は、単一の目的最適化アルゴリズムによって生成される歩留まりを大きく上回る。
論文 参考訳(メタデータ) (2023-11-02T14:00:11Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - Bandit Submodular Maximization for Multi-Robot Coordination in
Unpredictable and Partially Observable Environments [3.0294344089697596]
帯域フィードバックと追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを導入する。
盗賊のフィードバックは ロボットが 後ろ向きに計算できる能力だ 彼らの選択した行動の効果だけ
後悔の追跡はアルゴリズムの最適化の亜最適性であり、先駆的な未来を完全に知る最適な時間変化アクションである。
論文 参考訳(メタデータ) (2023-05-22T07:44:54Z) - Online Submodular Coordination with Bounded Tracking Regret: Theory,
Algorithm, and Applications to Multi-Robot Coordination [15.588080817106563]
私たちは、動的で非構造的で敵対的な環境で複数のロボットが協調する未来の自律性に動機付けられています。
本稿では,前兆を知っており,時間変化の時間的変動を考慮に入れた,有界な追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを提案する。
提案アルゴリズムは,Fisherらによるセミナル逐次グリーディアルゴリズムを予測不能な環境に一般化し,準モジュラリティとアルゴリズムを利用して,最良の専門家を追跡する。
論文 参考訳(メタデータ) (2022-09-26T05:31:34Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Robotic Brain Storm Optimization: A Multi-target Collaborative Searching
Paradigm for Swarm Robotics [24.38312890501329]
本稿では,ロボットBSOと呼ばれる群ロボットのためのBSOベースの協調探索フレームワークを提案する。
提案手法はBSOの誘導探索特性をシミュレートし,Swarm Robotics のマルチターゲット探索問題に優れた可能性を持つ。
論文 参考訳(メタデータ) (2021-05-27T13:05:48Z) - MLE-guided parameter search for task loss minimization in neural
sequence modeling [83.83249536279239]
ニューラル自己回帰シーケンスモデルは、さまざまな自然言語処理(NLP)タスクのシーケンスを生成するために使用される。
本稿では,現在のパラメータとその周辺における乱探索の混合である更新方向の分布から,最大至適勾配の分布をサンプリングする,最大至適誘導パラメータ探索(MGS)を提案する。
以上の結果から,MGS は,機械翻訳における最小リスクトレーニングに比べて,繰り返しや非終端の大幅な削減を図り,シーケンスレベルの損失を最適化できることが示唆された。
論文 参考訳(メタデータ) (2020-06-04T22:21:22Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。