論文の概要: Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning
- arxiv url: http://arxiv.org/abs/2603.09882v1
- Date: Tue, 10 Mar 2026 16:40:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.459381
- Title: Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning
- Title(参考訳): ダイナミック・アウェア・ポリシー・ラーニングによるクラッタシーンにおける外在的デキスタリティの創出
- Authors: Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang,
- Abstract要約: 乱雑な環境下で,接触によって引き起こされる物体のダイナミクスを学習的に表現することで,政策学習を容易にするフレームワークを提案する。
提案手法は、包括的操作、人的遠隔操作、および事前表現に基づくポリシーを25%以上の成功率で上回る。
- 参考スコア(独自算出の注目度): 27.1809716948267
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Extrinsic dexterity leverages environmental contact to overcome the limitations of prehensile manipulation. However, achieving such dexterity in cluttered scenes remains challenging and underexplored, as it requires selectively exploiting contact among multiple interacting objects with inherently coupled dynamics. Existing approaches lack explicit modeling of such complex dynamics and therefore fall short in non-prehensile manipulation in cluttered environments, which in turn limits their practical applicability in real-world environments. In this paper, we introduce a Dynamics-Aware Policy Learning (DAPL) framework that can facilitate policy learning with a learned representation of contact-induced object dynamics in cluttered environments. This representation is learned through explicit world modeling and used to condition reinforcement learning, enabling extrinsic dexterity to emerge without hand-crafted contact heuristics or complex reward shaping. We evaluate our approach in both simulation and the real world. Our method outperforms prehensile manipulation, human teleoperation, and prior representation-based policies by over 25% in success rate on unseen simulated cluttered scenes with varying densities. The real-world success rate reaches around 50% across 10 cluttered scenes, while a practical grocery deployment further demonstrates robust sim-to-real transfer and applicability.
- Abstract(参考訳): 外部デキスタリティ(exrinsic dexterity)は、環境接触を利用して、包括的操作の限界を克服する。
しかし、自然に結合した複数の相互作用オブジェクト間の接触を選択的に活用する必要があるため、散在するシーンにおいてそのようなデキスタリティを達成することは、依然として困難かつ過小評価されている。
既存のアプローチはそのような複雑な力学の明示的なモデリングを欠いているため、乱雑な環境での非包括的操作には不足しており、現実の環境での実践的適用性を制限している。
本稿では,乱雑な環境下での接触により引き起こされる物体のダイナミクスを学習した上で,政策学習を容易にするための動的政策学習(DAPL)フレームワークを提案する。
この表現は、明示的な世界モデリングを通じて学習され、強化学習の条件付けに使用される。
我々はシミュレーションと実世界の両方において我々のアプローチを評価する。
提案手法は, 密接な操作, 人体遠隔操作, および事前表現に基づく政策を, 様々な密度の未確認な散在シーンにおいて25%以上の成功率で上回っている。
実際の成功率は、10の散らかったシーンで約50%に達し、実用的な食料品の展開は、より堅牢なシミュレートと適用性を示している。
関連論文リスト
- PhysHSI: Towards a Real-World Generalizable and Natural Humanoid-Scene Interaction System [67.2851799763138]
PhysHSIはシミュレーショントレーニングパイプラインと現実世界のデプロイメントシステムで構成される。
シミュレーションでは,自然のヒューマノイドとシーンの相互作用データを模倣するために,逆運動に基づくポリシー学習を採用する。
実世界の展開には、LiDARとカメラ入力を組み合わせた粗粒度オブジェクトローカライズモジュールを導入する。
論文 参考訳(メタデータ) (2025-10-13T07:11:37Z) - Deformable Cluster Manipulation via Whole-Arm Policy Learning [27.54191389134963]
本稿では,3次元点雲とプロプリセプティブタッチインジケータという2つのモードを統合したモデルフリーポリシーの学習フレームワークを提案する。
我々の強化学習フレームワークは,カーネル平均埋め込みによる分散状態表現を利用して,学習効率の向上とリアルタイム推論を実現する。
我々は、このフレームワークを電力線クリアランスシナリオに展開し、エージェントが複数のアームリンクを利用して非閉塞性を実現する創造的戦略を生成することを観察する。
論文 参考訳(メタデータ) (2025-07-22T23:58:30Z) - Robust Visual Localization via Semantic-Guided Multi-Scale Transformer [3.3106947066548167]
マルチスケール特徴学習とセマンティックシーン理解を組み合わせたフレームワークを提案する。
本手法では, 空間的変化に適応しつつ, 空間的精度を保ちながら, 幾何学的詳細と文脈的手がかりを融合する階層変換器を用いる。
論文 参考訳(メタデータ) (2025-06-10T07:44:53Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - Zero-Shot Visual Generalization in Robot Manipulation [0.13280779791485384]
現在のアプローチは、しばしば点雲や深さのような不変表現に頼ることで問題を横取りする。
ディアングル型表現学習は、視覚的分布シフトに対して、視覚に基づく強化学習ポリシーを堅牢化できることを最近示した。
シミュレーションおよび実ハードウェア上での視覚摂動に対するゼロショット適応性を示す。
論文 参考訳(メタデータ) (2025-05-16T22:01:46Z) - Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [56.892520712892804]
本稿では,ヒューマノイドロボットを訓練して3つの巧妙な操作を行う,実用的なシミュレート・トゥ・リアルなRLレシピを提案する。
未確認のオブジェクトやロバストで適応的な政策行動に対して高い成功率を示す。
論文 参考訳(メタデータ) (2025-02-27T18:59:52Z) - Twisting Lids Off with Two Hands [82.21668778600414]
シミュレーションで訓練された政策を実世界へ効果的かつ効率的に移行する方法を示す。
具体的には,ボトル状物体の蓋を両手でねじる問題について考察する。
これは、バイマガル・マルチフィンガーハンドでそのような機能を実現する最初のsim-to-real RLシステムである。
論文 参考訳(メタデータ) (2024-03-04T18:59:30Z) - Evaluating Continual Learning Algorithms by Generating 3D Virtual
Environments [66.83839051693695]
連続学習とは、人間や動物が特定の環境で徐々に学習する能力である。
本稿では3次元仮想環境の最近の進歩を活用して,フォトリアリスティックな外観を持つ潜在的に長寿命な動的シーンの自動生成にアプローチすることを提案する。
本論文の新たな要素は、シーンがパラメトリックな方法で記述され、エージェントが知覚する入力ストリームの視覚的複雑さを完全に制御できることである。
論文 参考訳(メタデータ) (2021-09-16T10:37:21Z) - Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models [7.653542219337937]
専門家による実証から複合ダイナミクス行動を学習するためのフレームワークを提示する。
システムダイナミクスの近接近似としてスイッチング条件にエンコードされた接点を持つスイッチング線形ダイナミクスモデルを学ぶ。
次に、データ効率のよい制御学習のための微分可能なポリシークラスとして離散時間LQRを使用し、制御戦略を開発する。
論文 参考訳(メタデータ) (2021-03-26T04:40:24Z) - ContactNets: Learning Discontinuous Contact Dynamics with Smooth,
Implicit Representations [4.8986598953553555]
本手法は,物体間符号距離と接触フレームジャコビアンのパラメータ化を学習する。
提案手法は,60秒間の実世界のデータを用いて,現実的な影響,非ペネティフィケーション,スティクションを予測できる。
論文 参考訳(メタデータ) (2020-09-23T14:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。