論文の概要: Partially Observable Markov Decision Processes in Robotics: A Survey
- arxiv url: http://arxiv.org/abs/2209.10342v1
- Date: Wed, 21 Sep 2022 13:24:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 17:09:28.034111
- Title: Partially Observable Markov Decision Processes in Robotics: A Survey
- Title(参考訳): ロボティクスにおける部分観測可能なマルコフ決定過程:調査
- Authors: Mikko Lauri, David Hsu, Joni Pajarinen
- Abstract要約: この調査は,POMDPモデルとアルゴリズムの一方の端のギャップを埋めることと,他方の多様なロボット決定タスクに適用することを目的としている。
実践者にとって、この調査は、ロボットタスクにPOMDPをいつ、どのように適用するかを決定する上で重要なタスクの特徴をいくつか提供する。
POMDPアルゴリズム設計者にとって、この調査は、POMDPをロボットシステムに適用する際のユニークな課題に関する新たな洞察を提供する。
- 参考スコア(独自算出の注目度): 23.286897050793435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy sensing, imperfect control, and environment changes are defining
characteristics of many real-world robot tasks. The partially observable Markov
decision process (POMDP) provides a principled mathematical framework for
modeling and solving robot decision and control tasks under uncertainty. Over
the last decade, it has seen many successful applications, spanning
localization and navigation, search and tracking, autonomous driving,
multi-robot systems, manipulation, and human-robot interaction. This survey
aims to bridge the gap between the development of POMDP models and algorithms
at one end and application to diverse robot decision tasks at the other. It
analyzes the characteristics of these tasks and connects them with the
mathematical and algorithmic properties of the POMDP framework for effective
modeling and solution. For practitioners, the survey provides some of the key
task characteristics in deciding when and how to apply POMDPs to robot tasks
successfully. For POMDP algorithm designers, the survey provides new insights
into the unique challenges of applying POMDPs to robot systems and points to
promising new directions for further research.
- Abstract(参考訳): ノイズセンシング、不完全な制御、環境変化は多くの現実世界のロボットタスクの特徴を定義している。
部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下でロボットの決定と制御タスクをモデル化し、解決するための基本的な数学的枠組みを提供する。
過去10年間、ローカライゼーションとナビゲーション、検索とトラッキング、自動運転、マルチロボットシステム、操作、人間とロボットのインタラクションなど、多くのアプリケーションが成功してきた。
本調査は,POMDPモデルとアルゴリズムの一方の端におけるギャップを埋めることと,他方の多様なロボット決定タスクに適用することを目的としている。
これらのタスクの特徴を解析し、効果的なモデリングと解法のためにpomdpフレームワークの数学的およびアルゴリズム的特性と結びつける。
実践者にとって、この調査は、ロボットタスクにPOMDPをいつ、どのように適用するかを決定する上で重要なタスクの特徴をいくつか提供する。
POMDPアルゴリズムの設計者にとって、この調査は、ロボットシステムにPOMDPを適用するというユニークな課題に関する新たな洞察を与え、さらなる研究のための新たな方向性を示す。
関連論文リスト
- Automated Process Planning Based on a Semantic Capability Model and SMT [50.76251195257306]
製造システムと自律ロボットの研究において、機械で解釈可能なシステム機能の仕様に「能力」という用語が用いられる。
セマンティック能力モデルから始めて、AI計画問題を自動的に生成するアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-14T10:37:34Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Formal Modelling for Multi-Robot Systems Under Uncertainty [11.21074891465253]
我々は不確実性下でのマルチロボットシステムのフォーマリズムのモデル化についてレビューする。
計画、強化学習、モデルチェック、シミュレーションにどのように使用できるかについて議論する。
論文 参考訳(メタデータ) (2023-05-26T15:23:35Z) - Task Allocation using a Team of Robots [29.024300177453824]
本稿では、よく研究されている複数のバージョンを一般化するタスク割り当て問題の一般的な定式化について述べる。
我々の定式化には、ロボット、タスク、そしてそれらが動作する環境の状態が含まれる。
本稿では,実現可能性制約,目的関数,動的に変化する情報のレベルによって,その問題がどう変化するかを説明する。
論文 参考訳(メタデータ) (2022-07-20T04:49:11Z) - Distributed Reinforcement Learning for Robot Teams: A Review [10.92709534981466]
近年のセンサ,アクティベーション,計算の進歩により,マルチロボットシステムへの扉が開きつつある。
コミュニティはモデルフリーのマルチエージェント強化学習を活用して、マルチロボットシステムのための効率的でスケーラブルなコントローラを開発した。
最近の知見:分散MSSは、非定常性や部分観測可能性などの根本的な課題に直面している。
論文 参考訳(メタデータ) (2022-04-07T15:34:19Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Knowledge-Based Hierarchical POMDPs for Task Planning [0.34998703934432684]
タスクプランニングの主な目標は、エージェントを初期状態から目標状態へと移動させる一連のアクションを構築することです。
ロボット工学では、アクションは通常いくつかの可能な結果があり、センサーがエラーで測定を行う傾向があるため、これは特に困難です。
本稿では,情報のモジュール化と再利用を促進するロボットとその環境に関する知識を符号化する手法を提案する。
論文 参考訳(メタデータ) (2021-03-19T05:45:05Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Towards Coordinated Robot Motions: End-to-End Learning of Motion
Policies on Transform Trees [63.31965375413414]
人間による実証から構造化政策を学習し、マルチタスクの課題解決を提案します。
我々の構造化ポリシーは、異なる空間におけるサブタスクポリシーを組み合わせるためのフレームワークであるRMPflowにインスパイアされている。
マルチタスク問題に適したエンドツーエンドの学習目標関数を導き出します。
論文 参考訳(メタデータ) (2020-12-24T22:46:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。