論文の概要: Learning to unfold cloth: Scaling up world models to deformable object manipulation
- arxiv url: http://arxiv.org/abs/2602.16675v1
- Date: Wed, 18 Feb 2026 18:14:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.547303
- Title: Learning to unfold cloth: Scaling up world models to deformable object manipulation
- Title(参考訳): 布の展開を学習する:世界モデルを変形可能なオブジェクト操作にスケールアップする
- Authors: Jack Rome, Stephen James, Subramanian Ramamoorthy,
- Abstract要約: 本稿では,最近提案された強化学習アーキテクチャであるDreamerV2を用いて,空気中の布地操作を行う手法を提案する。
我々の実装では、リプレイバッファやデータ拡張手順の修正に加えて、サーフェス正規化の活用のためにこのアーキテクチャを変更している。
各種の異なる布を空気中で展開する物理ロボット構成において,シミュレーションとゼロショット配置の両方で評価を行った。
- 参考スコア(独自算出の注目度): 18.789090011689034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning to manipulate cloth is both a paradigmatic problem for robotic research and a problem of immediate relevance to a variety of applications ranging from assistive care to the service industry. The complex physics of the deformable object makes this problem of cloth manipulation nontrivial. In order to create a general manipulation strategy that addresses a variety of shapes, sizes, fold and wrinkle patterns, in addition to the usual problems of appearance variations, it becomes important to carefully consider model structure and their implications for generalisation performance. In this paper, we present an approach to in-air cloth manipulation that uses a variation of a recently proposed reinforcement learning architecture, DreamerV2. Our implementation modifies this architecture to utilise surface normals input, in addition to modiying the replay buffer and data augmentation procedures. Taken together these modifications represent an enhancement to the world model used by the robot, addressing the physical complexity of the object being manipulated by the robot. We present evaluations both in simulation and in a zero-shot deployment of the trained policies in a physical robot setup, performing in-air unfolding of a variety of different cloth types, demonstrating the generalisation benefits of our proposed architecture.
- Abstract(参考訳): 布を操ることの学習は、ロボット研究のパラダイム的な問題であり、補助ケアからサービス産業まで、さまざまな応用に即時に関連する問題である。
変形可能な物体の複雑な物理は、この布の操作の問題を非自明にしている。
形状,大きさ,折り畳み,ひび割れパターンに対処する汎用的な操作戦略を構築するためには,従来の外観変化の問題に加えて,モデル構造とその一般化性能への影響を慎重に検討することが重要である。
本稿では,最近提案された強化学習アーキテクチャであるDreamerV2を用いて,空気中の布地操作を行う手法を提案する。
我々の実装では、リプレイバッファやデータ拡張手順の修正に加えて、サーフェス正規化の活用のためにこのアーキテクチャを変更している。
これらの修正は、ロボットが使用する世界モデルの強化を意味し、ロボットが操作する物体の物理的複雑さに対処する。
提案するアーキテクチャの一般化の利点を実証し,各種の布を空気中で展開する物理ロボット構成において,トレーニングされたポリシーのゼロショット展開とシミュレーションの両方で評価を行った。
関連論文リスト
- Adaptive Articulated Object Manipulation On The Fly with Foundation Model Reasoning and Part Grounding [18.52792284421002]
アーティキュレートされたオブジェクトは、さまざまな操作課題をロボットにもたらす。
内部構造は直接観測できないため、ロボットは操作軌道を生成するために適応的に動作を探索し、洗練する必要がある。
AdaRPGは、基礎モデルを利用してオブジェクトを抽出する新しいフレームワークで、オブジェクト全体よりも局所的な幾何学的類似性を示す。
論文 参考訳(メタデータ) (2025-07-24T10:25:58Z) - SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.61572106180705]
本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。
我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。
実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-09-26T17:26:16Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。