論文の概要: Robust Sim-to-Real Cloth Untangling through Reduced-Resolution Observations via Adaptive Force-Difference Quantization
- arxiv url: http://arxiv.org/abs/2603.13785v1
- Date: Sat, 14 Mar 2026 06:27:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.787915
- Title: Robust Sim-to-Real Cloth Untangling through Reduced-Resolution Observations via Adaptive Force-Difference Quantization
- Title(参考訳): 適応力差量子化による還元分解観察によるロバスト・シム・レアル・クロスアンタングリング
- Authors: Yoshihisa Tsurumine, Yuki Kadokawa, Kohei Hayashi, Christian Diehm, Takamitsu Matsubara,
- Abstract要約: ロボット布の取り外しは、引抜き動作を接触条件や張力条件に適応させることにより、徐々に引き離される布地を必要とする。
本稿では,適応力差量子化(adaptive Force-Difference Quantization,ADQ)を提案する。
シミュレーションと実世界の布のアンハングリングの両方の実験により、ADQは生力入力を用いたポリシーよりも高い成功率を達成し、sim-to-real転送の堅牢性を示すことが示された。
- 参考スコア(独自算出の注目度): 3.995921217338678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic cloth untangling requires progressively disentangling fabric by adapting pulling actions to changing contact and tension conditions. Because large-scale real-world training is impractical due to cloth damage and hardware wear, sim-to-real policy transfer is a promising solution. However, cloth manipulation is highly sensitive to interaction dynamics, and policies that depend on precise force magnitudes often fail after transfer because similar force responses cannot be reproduced due to the reality gap. We observe that untangling is largely characterized by qualitative tension transitions rather than exact force values. This indicates that directly minimizing the sim-to-real gap in raw force measurements does not necessarily align with the task structure. We therefore hypothesize that emphasizing coarse force-change patterns while suppressing fine environment-dependent variations can improve robustness of sim-to-real transfer. Based on this insight, we propose Adaptive Force-Difference Quantization (ADQ), which reduces observation resolution by representing force inputs as discretized temporal differences and learning state-dependent quantization thresholds adaptively. This representation mitigates overfitting to environment-specific force characteristics and facilitates direct sim-to-real transfer. Experiments in both simulation and real-world cloth untangling demonstrate that ADQ achieves higher success rates and exhibits greater robustness in sim-to-real transfer than policies using raw force inputs. Supplementary video is available at https://youtu.be/ZeoBs-t0AWc
- Abstract(参考訳): ロボット布の取り外しは、引抜き動作を接触条件や張力条件に適応させることにより、徐々に引き離される布地を必要とする。
大規模な現実世界でのトレーニングは、布の損傷やハードウェアの着用などにより現実的ではないため、シム・トゥ・リアル・ポリシー・トランスファーは有望な解決策である。
しかし、布の操作は相互作用のダイナミクスに非常に敏感であり、現実のギャップによって同様の力の応答を再現できないため、伝達後に正確な力の大きさに依存する政策は失敗することが多い。
アンタングリングは, 正確な力の値ではなく, 定性的な張力遷移によって特徴づけられる。
このことは、原力測定におけるsim-to-realギャップを直接最小化することは、必ずしもタスク構造と一致しないことを示している。
そこで我々は, 環境依存性の微妙な変動を抑えつつ, 粗い力変化パターンを強調することで, シミュレート・トゥ・リアル・トランスファーのロバスト性を向上させることができるという仮説を立てた。
そこで本研究では,適応力差量子化(adaptive Force-Difference Quantization,ADQ)を提案する。
この表現は環境特異的な力特性への過度な適合を緩和し、直接sim-to-real転送を容易にする。
シミュレーションと実世界の布のアンハングリングの両方の実験により、ADQは生力入力を用いたポリシーよりも高い成功率を達成し、sim-to-real転送の堅牢性を示すことが示された。
補足ビデオはhttps://youtu.be/ZeoBs-t0AWcで公開されている。
関連論文リスト
- Zero-Shot Policy Transfer in Reinforcement Learning using Buckingham's Pi Theorem [42.37643072381109]
強化学習ポリシーは、しばしば、新しいロボット、タスク、または異なる物理的パラメータを持つ環境への一般化に失敗する。
本稿では,バッキンガムのPi理論に基づくシンプルなゼロショット転送手法を提案する。
論文 参考訳(メタデータ) (2025-10-09T19:36:18Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文 参考訳(メタデータ) (2025-09-27T19:43:04Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.10995326465245926]
本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。
我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。
以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文 参考訳(メタデータ) (2025-03-11T05:39:07Z) - Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文 参考訳(メタデータ) (2023-11-13T11:29:06Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Intervention Design for Effective Sim2Real Transfer [48.9711031777803]
この研究は、sim2real設定に対する領域ランダム化とデータ拡張の最近の成功に対処する。
この成功は、因果推論のレンズ、領域ランダム化の位置決め、および環境への介入としてのデータ拡張によって説明される。
論文 参考訳(メタデータ) (2020-12-03T16:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。