論文の概要: "The World Is Its Own Best Model": Robust Real-World Manipulation
Through Online Behavior Selection
- arxiv url: http://arxiv.org/abs/2205.04172v1
- Date: Mon, 9 May 2022 10:33:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 16:51:38.090939
- Title: "The World Is Its Own Best Model": Robust Real-World Manipulation
Through Online Behavior Selection
- Title(参考訳): the world is its own best model" - オンライン行動選択による実世界の堅牢な操作
- Authors: Manuel Baum and Oliver Brock
- Abstract要約: タスクの離散的な高レベル状態を観察するために環境を常に監視することで、ロバスト性を実現することができる。
これは、タスクの異なるフェーズが異なるセンサーパターンによって特徴づけられるためである。
本稿では,引き手を開き,テニスボールを驚くほど頑健な方法でつかむロボットシステムを提案する。
- 参考スコア(独自算出の注目度): 11.889698650840332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic manipulation behavior should be robust to disturbances that violate
high-level task-structure. Such robustness can be achieved by constantly
monitoring the environment to observe the discrete high-level state of the
task. This is possible because different phases of a task are characterized by
different sensor patterns and by monitoring these patterns a robot can decide
which controllers to execute in the moment. This relaxes assumptions about the
temporal sequence of those controllers and makes behavior robust to unforeseen
disturbances. We implement this idea as probabilistic filter over discrete
states where each state is direcly associated with a controller. Based on this
framework we present a robotic system that is able to open a drawer and grasp
tennis balls from it in a surprisingly robust way.
- Abstract(参考訳): ロボット操作は、高いレベルのタスク構造に違反する障害に対して堅牢であるべきです。
このような堅牢性は、タスクの離散的な高レベル状態を観察するために環境を常に監視することで達成できる。
これは、タスクの異なるフェーズが異なるセンサーパターンによって特徴づけられ、これらのパターンを監視することで、ロボットが瞬間にどのコントローラを実行するかを決定することができるためである。
これにより、これらのコントローラの時間的シーケンスに関する仮定が緩和され、予期せぬ乱れに対して動作が堅牢になる。
我々は、各状態がコントローラに希薄に関連付けられている離散状態に対する確率的フィルタとしてこの考え方を実装した。
この枠組みに基づいて、引き手を開き、驚くほど頑丈な方法でテニスボールをつかむことができるロボットシステムを提案する。
関連論文リスト
- Adaptive Motion Generation Using Uncertainty-Driven Foresight Prediction [2.2120851074630177]
環境の不確実性は、現実のロボットタスクを実行する際には、長年、扱いにくい特徴だった。
本稿では,動的内部シミュレーションを用いたフォレスト予測を用いた既存の予測学習に基づくロボット制御手法を拡張した。
その結果,提案モデルではドアとの相互作用により動作が適応的に分岐し,従来の手法では安定に分岐しなかった。
論文 参考訳(メタデータ) (2024-10-01T15:13:27Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - Homeostatic motion planning with innate physics knowledge [0.0]
単純な動物でさえ、ロボット工学ではまだ再現されていない複雑な計画を開発し、実行することができる。
離散閉ループ制御器と一時閉ループ制御器の集合を定義することで解を提案する。
提案するフレームワークは実際のロボット向けに実装され、概念実証として2つのシナリオでテストされた。
論文 参考訳(メタデータ) (2024-02-23T15:30:57Z) - Hierarchical generative modelling for autonomous robots [8.023920215148486]
人型ロボットが、移動、操作、把握の全体的利用を必要とする複雑なタスクを自律的に完了できることを示します。
具体的には、箱を回収して輸送し、ドアを通り抜けて目的地に到達し、接近し、サッカーを蹴ることのできるヒューマノイドロボットの能力を示すとともに、身体の損傷や地面の不規則性の存在下で頑健な性能を示す。
論文 参考訳(メタデータ) (2023-08-15T13:51:03Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Zero-Shot Uncertainty-Aware Deployment of Simulation Trained Policies on
Real-World Robots [17.710172337571617]
深層強化学習(RL)エージェントは、トレーニング環境と実行環境のミスマッチにより、現実世界にデプロイされた時にエラーを起こす傾向がある。
本稿では,RLポリシーと従来型の手作りコントローラの強みを組み合わせた,新しい不確実性対応デプロイメント戦略を提案する。
実世界の2つの連続制御タスクにおいて、BCFはスタンドアロンのポリシーとコントローラの両方に優れる有望な結果を示す。
論文 参考訳(メタデータ) (2021-12-10T02:13:01Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Populations of Spiking Neurons for Reservoir Computing: Closed Loop
Control of a Compliant Quadruped [64.64924554743982]
本稿では,ニューラルネットワークを用いた中央パターン生成機構を実装し,閉ループロボット制御を実現するためのフレームワークを提案する。
本研究では,従順な四足歩行ロボットのシミュレーションモデル上で,予め定義された歩行パターン,速度制御,歩行遷移の学習を実演する。
論文 参考訳(メタデータ) (2020-04-09T14:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。