論文の概要: SparTa: Sparse Graphical Task Models from a Handful of Demonstrations
- arxiv url: http://arxiv.org/abs/2602.16911v1
- Date: Wed, 18 Feb 2026 21:54:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.559011
- Title: SparTa: Sparse Graphical Task Models from a Handful of Demonstrations
- Title(参考訳): SparTa: デモを手軽に行うグラフィカルタスクモデル
- Authors: Adrian Röfer, Nick Heppert, Abhinav Valada,
- Abstract要約: 我々は、ロボットがタスクで達成すべきことを、どのように行うべきかではなく、推測することに集中する。
本稿では、一連の操作グラフを抽出し、オブジェクト状態上の分布を推定するデモセグメンテーションとプーリング手法を提案する。
シミュレーションと実ロボットの両方に適合したモデルをデプロイし、結果のタスク表現が環境全体にわたって信頼性の高い実行をサポートすることを示す。
- 参考スコア(独自算出の注目度): 18.00619071013106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning long-horizon manipulation tasks efficiently is a central challenge in robot learning from demonstration. Unlike recent endeavors that focus on directly learning the task in the action domain, we focus on inferring what the robot should achieve in the task, rather than how to do so. To this end, we represent evolving scene states using a series of graphical object relationships. We propose a demonstration segmentation and pooling approach that extracts a series of manipulation graphs and estimates distributions over object states across task phases. In contrast to prior graph-based methods that capture only partial interactions or short temporal windows, our approach captures complete object interactions spanning from the onset of control to the end of the manipulation. To improve robustness when learning from multiple demonstrations, we additionally perform object matching using pre-trained visual features. In extensive experiments, we evaluate our method's demonstration segmentation accuracy and the utility of learning from multiple demonstrations for finding a desired minimal task model. Finally, we deploy the fitted models both in simulation and on a real robot, demonstrating that the resulting task representations support reliable execution across environments.
- Abstract(参考訳): ロングホライズン操作のタスクを効率的に学習することは、デモからのロボット学習における中心的な課題である。
アクション領域でタスクを直接学習することに集中している最近の取り組みとは異なり、ロボットがタスクで何をすべきかを推論することに重点を置いている。
この目的のために、一連のグラフィカルオブジェクト関係を用いて、進化するシーン状態を表現する。
本稿では,一連の操作グラフを抽出し,タスクフェーズ間のオブジェクト状態の分布を推定するデモセグメンテーションとプーリング手法を提案する。
部分的インタラクションや短い時間的ウィンドウのみをキャプチャする従来のグラフベースの手法とは対照的に、我々の手法は制御の開始から操作の終了までの完全なオブジェクトインタラクションをキャプチャする。
複数の実演から学習する際の頑健性を改善するために,事前学習した視覚的特徴を用いてオブジェクトマッチングを行う。
大規模な実験では,提案手法のデモセグメンテーション精度と,所望の最小限のタスクモデルを見つけるための複数のデモからの学習の有用性を評価した。
最後に、シミュレーションと実ロボットの両方に適合したモデルをデプロイし、結果のタスク表現が環境間の信頼性の高い実行をサポートすることを示す。
関連論文リスト
- Learning Semantic-Geometric Task Graph-Representations from Human Demonstrations [16.68801520494275]
対象の同一性や対象間の関係を符号化する意味幾何学的タスクグラフ表現と,その時間的幾何学的進化を人間の実演から導入する。
意味幾何学的タスクグラフ表現は、高い動作とオブジェクトの可変性を持つタスクに特に有益であることを示す。
論文 参考訳(メタデータ) (2026-01-16T17:35:00Z) - DITTO: Demonstration Imitation by Trajectory Transformation [31.930923345163087]
そこで本研究では,RGB-Dビデオ録画による実演映像のワンショット模倣の問題に対処する。
本稿では,2段階のプロセスを提案する。第1段階では実演軌道をオフラインに抽出し,操作対象のセグメンテーションと,容器などの二次物体に対する相対運動を決定する。
オンライン軌道生成段階では、まず全ての物体を再検出し、次にデモ軌道を現在のシーンにワープし、ロボット上で実行します。
論文 参考訳(メタデータ) (2024-03-22T13:46:51Z) - Compositional Servoing by Recombining Demonstrations [32.23118166912325]
本稿では,視覚サーボタスクをグラフトラバーサルとして定式化するフレームワークを提案する。
既存のデモを分割して再結合することで、デモグラフを構築します。
また, 実演の組換えにより, タスク・振り返りが向上することを示した。
論文 参考訳(メタデータ) (2023-10-06T14:16:49Z) - Learning Sensorimotor Primitives of Sequential Manipulation Tasks from
Visual Demonstrations [13.864448233719598]
本稿では,低レベルポリシーと高レベルポリシーを同時に学習するニューラルネットワークベースの新しいフレームワークについて述べる。
提案手法の重要な特徴は、これらのポリシーがタスクデモの生のビデオから直接学習されることである。
ロボットアームを用いた物体操作タスクの実証実験の結果,提案するネットワークは実際の視覚的な実演から効率よく学習し,タスクを実行することができることがわかった。
論文 参考訳(メタデータ) (2022-03-08T01:36:48Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - Playful Interactions for Representation Learning [82.59215739257104]
本稿では,下流タスクの視覚的表現を学習するために,遊び心のあるインタラクションを自己指導的に利用することを提案する。
19の多様な環境で2時間の遊び心のあるデータを収集し、自己予測学習を用いて視覚的表現を抽出する。
我々の表現は、標準的な行動クローニングよりも一般化され、必要なデモの半数しか必要とせず、同様の性能を達成できる。
論文 参考訳(メタデータ) (2021-07-19T17:54:48Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Model-Based Visual Planning with Self-Supervised Functional Distances [104.83979811803466]
モデルに基づく視覚的目標達成のための自己監視手法を提案する。
私たちのアプローチは、オフラインでラベルなしのデータを使って完全に学習します。
このアプローチは,モデルフリーとモデルベース先行手法の両方で大幅に性能が向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T23:59:09Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。