論文の概要: Instant-Fold: In-Context Imitation Learning for Deformable Object Manipulation
- arxiv url: http://arxiv.org/abs/2606.04269v1
- Date: Tue, 02 Jun 2026 22:46:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.412226
- Title: Instant-Fold: In-Context Imitation Learning for Deformable Object Manipulation
- Title(参考訳): Instant-Fold: 変形可能なオブジェクト操作のためのインコンテキスト模倣学習
- Authors: Yilong Wang, Cheng Qian, Edward Johns,
- Abstract要約: Instant-Foldは、DOMのためのコンテキスト内模倣学習フレームワークである。
一人の人間がデモを行うと、このポリシーはデモから直接様々な操作モードを推測し実行します。
- 参考スコア(独自算出の注目度): 15.16901531512543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deformable object manipulation (DOM) is challenging due to high-dimensional, partially observable states that evolve through long-horizon, topology-changing interactions with multiple valid manipulation modes. We introduce Instant-Fold, an in-context imitation learning framework for DOM. Given a single human demonstration, our policy infers and executes diverse manipulation modes directly from the demonstration, including variations in spatial execution and ordering, without requiring gradient updates. Our approach first learns deformation-aware visual representations via temporal contrastive pretraining, after which a flow-matching transformer policy conditioned on the demonstration predicts actions to execute the intended manipulation mode. Trained entirely in simulation, Instant-Fold generalizes across diverse folding modes and transfers zero-shot to real-world settings without additional data collection or finetuning. Videos are available at https://instant-fold.github.io.
- Abstract(参考訳): 変形可能なオブジェクト操作(DOM)は、複数の有効な操作モードによる長期的トポロジ変化相互作用を通じて進化する高次元、部分的に観測可能な状態のために困難である。
Instant-Foldは、DOMのためのコンテキスト内模倣学習フレームワークである。
一つの人間の実演が与えられた場合、我々のポリシーは、勾配の更新を必要とせず、空間的な実行や順序のバリエーションを含む、デモから直接多様な操作モードを推論し、実行します。
提案手法は,まず時間的コントラスト事前学習により変形認識型視覚表現を学習し,その後,実演に条件付フローマッチング変換器ポリシーが動作予測を行い,意図した操作モードを実行する。
完全にシミュレーションでトレーニングされたInstant-Foldは、さまざまな折り畳みモードを一般化し、ゼロショットを追加のデータ収集や微調整なしで現実世界の設定に転送する。
ビデオはhttps://instant-fold.github.io.comで公開されている。
関連論文リスト
- AdaManip: Adaptive Articulated Object Manipulation Environments and Policy Learning [25.331956706253614]
人工物体操作は、ロボットが現実世界のシナリオで様々なタスクを遂行する上で重要な機能である。
音声オブジェクトの以前のデータセットとシミュレーション環境は、主に単純な操作機構に焦点を合わせてきた。
そこで我々は,新しいオブジェクト操作環境を構築し,それを9つのカテゴリのオブジェクトに装備する。
環境とオブジェクトに基づいて,適応的な実演コレクションと3次元視覚拡散に基づく模倣学習パイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:45:10Z) - DynaMo: In-Domain Dynamics Pretraining for Visuo-Motor Control [18.737628473949048]
模倣学習は、複雑なビジュモータポリシーを訓練するための強力なツールであることが証明されている。
現在の手法では、高次元の視覚的観察を扱うために数百から数千の専門家によるデモンストレーションが必要となることが多い。
視覚表現を学習するための新しいドメイン内自己教師型DynaMoを提案する。
論文 参考訳(メタデータ) (2024-09-18T17:59:43Z) - Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - GenDOM: Generalizable One-shot Deformable Object Manipulation with Parameter-Aware Policy [22.965840244436777]
我々は,1つの実世界の実演だけで異なる変形可能なオブジェクトを操作できるフレームワークであるGenDOMを紹介した。
新しいオブジェクトが推測されると、GenDOMは1つの実世界のデモだけで変形可能なオブジェクトパラメータを推定できる。
シミュレーションおよび実世界のオブジェクト操作設定の実証検証により,本手法が一つの実演で異なるオブジェクトを操作できることが明らかとなった。
論文 参考訳(メタデータ) (2023-09-16T17:18:23Z) - Inverse Dynamics Pretraining Learns Good Representations for Multitask
Imitation [66.86987509942607]
このようなパラダイムを模倣学習でどのように行うべきかを評価する。
本稿では,事前学習コーパスがマルチタスクのデモンストレーションから成り立つ環境について考察する。
逆動力学モデリングはこの設定に適していると主張する。
論文 参考訳(メタデータ) (2023-05-26T14:40:46Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z) - State-Only Imitation Learning for Dexterous Manipulation [63.03621861920732]
本稿では,国家のみの模倣学習について考察する。
我々は、逆ダイナミクスモデルをトレーニングし、状態のみのデモンストレーションのアクションを予測するためにそれを使用します。
我々の手法は状態-作用アプローチと同等に動作し、RL単独よりもかなり優れています。
論文 参考訳(メタデータ) (2020-04-07T17:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。