論文の概要: EaDex: A Cross-Embodiment Dexterous Manipulation Framework from Low-Cost Demonstrations
- arxiv url: http://arxiv.org/abs/2606.03268v1
- Date: Tue, 02 Jun 2026 07:35:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.839052
- Title: EaDex: A Cross-Embodiment Dexterous Manipulation Framework from Low-Cost Demonstrations
- Title(参考訳): EaDex: 低コストデモによるクロス・エボディメント・デキステラス・マニピュレーション・フレームワーク
- Authors: Qian Zhao, Xin Tong, Chengdong Wu, Yang Yang, Yingtian Li,
- Abstract要約: 本稿では,低コストな実演環境下でのマルチエンボディメント・デクスタラスな操作学習フレームワークであるEaDexを提案する。
データレベルでは、EaDexは1台のRGB-Dカメラだけで人間の手の動きをキャプチャする。
- 参考スコア(独自算出の注目度): 17.33397567200614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dexterous manipulation learning has long been hindered by the high costs of data and training, as pure reinforcement learning typically requires large-scale interactive exploration and imitation learning depends on high-quality demonstrations that are expensive to collect. To address this problem, we propose EaDex, a multi-embodiment dexterous manipulation learning framework under low-cost demonstration conditions, which enables rapid generation of demonstration data and consequently reduces training time for efficient dexterous manipulation. At the data level, EaDex captures human hand motions using only a single RGB-D camera and constructs structured demonstration data through MANO-based hand modeling, data normalization, and motion retargeting. At the learning level, we introduce a contact-reward-based dynamic demonstration annealing mechanism, which guides early-stage exploration under demonstration and gradually transitions to autonomous optimization with accumulating contact rewards. Using our custom dataset, we evaluate EaDex on three dexterous hands and three articulated object-opening tasks, covering nine cross-embodiment manipulation settings, achieving a 55.3% relative improvement over the baseline without demonstration annealing. These results validate the effectiveness of the proposed low-cost demonstration pipeline and the dynamic demonstration annealing strategy for dexterous manipulation learning.
- Abstract(参考訳): 純粋な強化学習は一般的に大規模なインタラクティブな探索を必要とし、模倣学習は収集に高価な高品質なデモンストレーションに依存する。
この問題を解決するために,低コストな実演環境下でのマルチエンボディメント・デキスタラスな操作学習フレームワークであるEaDexを提案する。
データレベルでは、EaDexは1台のRGB-Dカメラだけで人間の手の動きをキャプチャし、MANOベースのハンドモデリング、データ正規化、モーションリターゲティングを通じて構造化されたデモデータを構築する。
学習レベルでは,早期段階の探索を指導し,徐々に接触報酬を蓄積して自律的な最適化へと移行する,コンタクトリワードに基づく動的デモアニール機構を導入する。
当社のカスタムデータセットを用いて、EaDexを3つのディクスタラスハンドと3つのオープニングタスクで評価し、9つのクロスボデーメント操作設定をカバーし、デモアニールなしでベースラインに対して55.3%の相対的な改善を実現した。
これらの結果は,提案した低コストな実演パイプラインの有効性と,デクスタラスな操作学習のための動的実演アニール戦略の有効性を検証した。
関連論文リスト
- Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - Synatra: Turning Indirect Knowledge into Direct Demonstrations for Digital Agents at Scale [97.21851531607811]
LLMは、デジタル環境と対話し、特定の目的を完遂する自律エージェントとして機能する。
デジタルタスクに対する大規模な直接的なデモが欠如していることもあって、正確性はまだ十分ではない。
我々は、この間接的な知識を大規模に直接監督するアプローチであるSynatraを提案する。
論文 参考訳(メタデータ) (2024-09-24T00:51:45Z) - "Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations [3.637365301757111]
専門家デモ(RLED)からの強化学習(Reinforcement Learning from Expert Demonstrations)のような手法は、学習プロセス中のエージェント探索を促進するために外部の専門家によるデモンストレーションを導入します。
学習にとって最も有益な人間のデモのベストセットをどうやって選ぶかが、大きな関心事になります。
本稿では,学習エージェントが軌跡に基づく特徴空間において,専門家による実演を最適化したクエリを生成できるアルゴリズムEARLYを提案する。
論文 参考訳(メタデータ) (2024-06-05T08:52:21Z) - AdaDemo: Data-Efficient Demonstration Expansion for Generalist Robotic Agent [75.91274222142079]
本研究では,汎用ロボットエージェントの学習を容易にするために,データ効率のよい方法で実演をスケールアップすることを目的とする。
AdaDemoは、デモデータセットを積極的に継続的に拡張することで、マルチタスクポリシー学習を改善するように設計されたフレームワークである。
論文 参考訳(メタデータ) (2024-04-11T01:59:29Z) - Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Evaluating the Effectiveness of Corrective Demonstrations and a Low-Cost
Sensor for Dexterous Manipulation [0.5669790037378094]
模倣学習は、ロボットが巧妙な操作能力を獲得するのを助ける、有望なアプローチである。
このような追加デモンストレーションの特性と性能への影響について検討する。
本稿では、LeapMotionのような安価な視覚ベースのセンサーを用いて、デモの提供コストを大幅に削減できることを示す。
論文 参考訳(メタデータ) (2022-04-15T19:55:46Z) - Improving Learning from Demonstrations by Learning from Experience [4.605233477425785]
我々は、専門家から経験から学びへスムーズに移行できるTD3fGという新しいアルゴリズムを提案する。
本アルゴリズムは,MUJOCO環境において,限定的かつ準最適な実演を行い,優れた性能を実現する。
論文 参考訳(メタデータ) (2021-11-16T00:40:31Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。