論文の概要: Attainment Regions in Feature-Parameter Space for High-Level Debugging
in Autonomous Robots
- arxiv url: http://arxiv.org/abs/2108.03150v1
- Date: Fri, 6 Aug 2021 14:45:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-09 16:00:55.276860
- Title: Attainment Regions in Feature-Parameter Space for High-Level Debugging
in Autonomous Robots
- Title(参考訳): 自律ロボットにおける高レベルデバッグのための特徴パラメータ空間の到達領域
- Authors: Sim\'on C. Smith, Subramanian Ramamoorthy
- Abstract要約: パフォーマンス関数は、ロボットの動作に関する洞察を与える。
アクション状態空間が大きければ高次元システムでは、コントローラーを微調整することは自明ではない。
制御器の外部特徴とパラメータによってドメインが定義される性能関数を提案する。
- 参考スコア(独自算出の注目度): 8.147652597876862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding a controller's performance in different scenarios is crucial
for robots that are going to be deployed in safety-critical tasks. If we do not
have a model of the dynamics of the world, which is often the case in complex
domains, we may need to approximate a performance function of the robot based
on its interaction with the environment. Such a performance function gives us
insights into the behaviour of the robot, allowing us to fine-tune the
controller with manual interventions. In high-dimensionality systems, where the
actionstate space is large, fine-tuning a controller is non-trivial. To
overcome this problem, we propose a performance function whose domain is
defined by external features and parameters of the controller. Attainment
regions are defined over such a domain defined by feature-parameter pairs, and
serve the purpose of enabling prediction of successful execution of the task.
The use of the feature-parameter space -in contrast to the action-state space-
allows us to adapt, explain and finetune the controller over a simpler (i.e.,
lower dimensional space). When the robot successfully executes the task, we use
the attainment regions to gain insights into the limits of the controller, and
its robustness. When the robot fails to execute the task, we use the regions to
debug the controller and find adaptive and counterfactual changes to the
solutions. Another advantage of this approach is that we can generalise through
the use of Gaussian processes regression of the performance function in the
high-dimensional space. To test our approach, we demonstrate learning an
approximation to the performance function in simulation, with a mobile robot
traversing different terrain conditions. Then, with a sample-efficient method,
we propagate the attainment regions to a physical robot in a similar
environment.
- Abstract(参考訳): 異なるシナリオでコントローラのパフォーマンスを理解することは、安全クリティカルなタスクにデプロイされるロボットにとって非常に重要です。
もし我々が世界の力学のモデルを持っていなければ、複雑な領域ではよくあることだが、環境との相互作用に基づいてロボットの性能関数を近似する必要があるかもしれない。
このようなパフォーマンス機能は、ロボットの動作に関する洞察を与え、手動でコントローラを微調整することを可能にする。
作用状態空間が大きい高次元系では、制御器の微調整は非自明である。
そこで本研究では,コントローラの外部特徴とパラメータによってドメインが定義される性能関数を提案する。
達成領域は、特徴パラメータペアによって定義されたそのようなドメイン上で定義され、タスクの実行を成功させるために役立ちます。
特徴パラメータ空間の使用 - 作用状態空間とは対照的に、より単純な(低次元空間)上でコントローラを適応、説明、微調整することができる。
ロボットがタスクをうまく実行した場合、達成領域を使用して、コントローラの限界とその堅牢性に関する洞察を得る。
ロボットがタスクを実行に失敗した場合、リージョンを使用してコントローラをデバッグし、ソリューションに対する適応的かつ反則的な変更を見つけます。
このアプローチのもう1つの利点は、高次元空間における性能関数のガウス過程回帰を用いて一般化できることである。
提案手法をテストするために,移動ロボットが異なる地形条件を走行しながら,シミュレーションにおける性能関数の近似を学習した。
そして,サンプル効率のよい手法により,同様の環境下での達成領域を物理ロボットに伝達する。
関連論文リスト
- ManiGaussian: Dynamic Gaussian Splatting for Multi-task Robotic Manipulation [58.615616224739654]
従来のロボット操作法は通常、予測のための観察の意味表現を学ぶ。
マルチ時間ロボット操作のための動的ガウス分割法ManiGaussianを提案する。
我々のフレームワークは、最先端の手法を平均的な成功率で13.1%上回ることができる。
論文 参考訳(メタデータ) (2024-03-13T08:06:41Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Learning to navigate efficiently and precisely in real environments [14.52507964172957]
Embodied AIの文献は、HabitatやAI-Thorといったシミュレータで訓練されたエンドツーエンドエージェントに焦点を当てている。
本研究では,sim2realのギャップを最小限に抑えたシミュレーションにおけるエージェントのエンドツーエンドトレーニングについて検討する。
論文 参考訳(メタデータ) (2024-01-25T17:50:05Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved
Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。
実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。
実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文 参考訳(メタデータ) (2022-10-03T10:21:57Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Towards Multi-Robot Task-Motion Planning for Navigation in Belief Space [1.4824891788575418]
本稿では,知識集約領域におけるナビゲーションのためのマルチロボットタスクモーション計画フレームワークを提案する。
特に,ロボット間の相互観測を取り入れた分散マルチロボットの設定について考察する。
このフレームワークは、運動中の運動計画と感覚の不確実性を目的としており、これは正式には信仰空間計画として知られている。
論文 参考訳(メタデータ) (2020-10-01T06:45:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。