論文の概要: Closed-loop Multi-step Planning
- arxiv url: http://arxiv.org/abs/2402.15384v3
- Date: Wed, 29 Jan 2025 12:47:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:51:08.644440
- Title: Closed-loop Multi-step Planning
- Title(参考訳): 閉ループ多段計画
- Authors: Giulia Lafratta, Bernd Porr, Christopher Chandler, Alice Miller,
- Abstract要約: 単純な動物でさえ、純粋なクローズドループ入力制御を使用してロボット工学ではまだ複製されていない複雑な計画を開発し、実行することができる。
本稿では,個別かつ一時的な閉ループ制御系であるTasks'を,それぞれが閉ループ動作を表すものとして定義することで,その解を提案する。
提案手法を実ロボットに実装し,概念実証として2つのシナリオで検証した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Living organisms interact with their surroundings in a closed-loop fashion, where sensory inputs dictate the initiation and termination of behaviours. Even simple animals are able to develop and execute complex plans, which has not yet been replicated in robotics using pure closed-loop input control. We propose a solution to this problem by defining a set of discrete and temporary closed-loop controllers, called ``Tasks'', each representing a closed-loop behaviour. We further introduce a supervisory module which has an innate understanding of physics and causality, through which it can simulate the execution of Task sequences over time and store the results in a model of the environment. On the basis of this model, plans can be made by chaining temporary closed-loop controllers. Our proposed framework was implemented for a real robot and tested in two scenarios as proof of concept.
- Abstract(参考訳): 生物は閉じたループで周囲と相互作用し、感覚入力は行動の開始と終了を指示する。
単純な動物でさえ、純粋なクローズドループ入力制御を使用してロボット工学ではまだ複製されていない複雑な計画を開発し、実行することができる。
本稿では,個別かつ一時的な閉ループ制御系である `Tasks' を,それぞれが閉ループ動作を表すものとして定義することにより,この問題に対する解決策を提案する。
さらに、物理と因果関係を自然に理解した監視モジュールを導入し、時間とともにタスクシーケンスの実行をシミュレートし、その結果を環境のモデルに格納する。
このモデルに基づいて、仮閉ループコントローラをチェーンすることで計画を立てることができる。
提案手法を実ロボットに実装し,概念実証として2つのシナリオで検証した。
関連論文リスト
- Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - Closed-loop multi-step planning with innate physics knowledge [0.0]
入力制御問題としてロボット計画の階層的枠組みを提案する。
このフレームワークを実際のロボットに実装し、概念実証として超越したシナリオでテストする。
論文 参考訳(メタデータ) (2024-11-18T12:15:16Z) - Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [23.62433580021779]
我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文 参考訳(メタデータ) (2024-10-02T11:42:49Z) - Task and Motion Planning for Execution in the Real [24.01204729304763]
この作業は、作業を含むタスクと動作の計画を生成するが、計画時には完全には理解できない。
実行は、タスク目標に到達するまでオフラインで計画された動きとオンライン行動を組み合わせる。
提案したフレームワークを評価するために,40の実ロボット試験とモチベーション実証を行った。
その結果、実行時間が短縮され、アクションの数が少なくなり、さまざまなギャップが生じる問題の成功率が向上した。
論文 参考訳(メタデータ) (2024-06-05T22:30:40Z) - Towards Bridging the Gap between High-Level Reasoning and Execution on
Robots [2.6107298043931206]
例えば、タスク計画やGologを使ったエージェントプログラミングによってアクションを推論する場合、ロボットのアクションは一般的に抽象的なレベルでモデル化される。
しかし、そのような動作をロボットで実行すると、もはや原始的とは見なされない。
本稿では,このギャップを埋めるためのいくつかのアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-30T12:26:12Z) - Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning [85.84504287685884]
Skip-Plan(スキップ・プラン)は、訓練ビデオにおけるプロシージャ計画のための凝縮された行動空間学習法である。
アクションチェーン内の不確実なノードやエッジをスキップすることで、長いシーケンス関数と複雑なシーケンス関数を短いが信頼できるものに転送する。
我々のモデルは、凝縮された作用空間内のアクションシーケンス内で、あらゆる種類の信頼できる部分関係を探索する。
論文 参考訳(メタデータ) (2023-10-01T08:02:33Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - "The World Is Its Own Best Model": Robust Real-World Manipulation
Through Online Behavior Selection [11.889698650840332]
タスクの離散的な高レベル状態を観察するために環境を常に監視することで、ロバスト性を実現することができる。
これは、タスクの異なるフェーズが異なるセンサーパターンによって特徴づけられるためである。
本稿では,引き手を開き,テニスボールを驚くほど頑健な方法でつかむロボットシステムを提案する。
論文 参考訳(メタデータ) (2022-05-09T10:33:18Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。