論文の概要: TWISTED-RL: Hierarchical Skilled Agents for Knot-Tying without Human Demonstrations
- arxiv url: http://arxiv.org/abs/2602.14526v1
- Date: Mon, 16 Feb 2026 07:21:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.250474
- Title: TWISTED-RL: Hierarchical Skilled Agents for Knot-Tying without Human Demonstrations
- Title(参考訳): TWISTED-RL:人間の指示を伴わないノットタイピングのための階層的スキルエージェント
- Authors: Guy Freund, Tom Jurgenson, Matan Sudry, Erez Karpas,
- Abstract要約: デモフリーノットタイリングにおける従来の最先端技術を改善するフレームワークであるTWISTED-RLを提案する。
提案手法は,教師あり学習を通して学習したTWISTEDの1ステップ逆モデルを置き換える。
その結果、TWISTED-RLは、これまで達成できなかった複雑さのノットを解くことができた。
- 参考スコア(独自算出の注目度): 4.567330863443464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic knot-tying represents a fundamental challenge in robotics due to the complex interactions between deformable objects and strict topological constraints. We present TWISTED-RL, a framework that improves upon the previous state-of-the-art in demonstration-free knot-tying (TWISTED), which smartly decomposed a single knot-tying problem into manageable subproblems, each addressed by a specialized agent. Our approach replaces TWISTED's single-step inverse model that was learned via supervised learning with a multi-step Reinforcement Learning policy conditioned on abstract topological actions rather than goal states. This change allows more delicate topological state transitions while avoiding costly and ineffective data collection protocols, thus enabling better generalization across diverse knot configurations. Experimental results demonstrate that TWISTED-RL manages to solve previously unattainable knots of higher complexity, including commonly used knots such as the Figure-8 and the Overhand. Furthermore, the increase in success rates and drop in planning time establishes TWISTED-RL as the new state-of-the-art in robotic knot-tying without human demonstrations.
- Abstract(参考訳): ロボットの結び目は、変形可能な物体と厳密なトポロジカル制約の間の複雑な相互作用のため、ロボット工学の基本的な課題である。
本稿では,従来のデモフリーノットタイリング(TWISTED)を改良したフレームワークであるTWISTED-RLについて述べる。
提案手法は,TWISTEDの単一ステップ逆モデルに代えて,目標状態ではなく抽象的トポロジ的行動に基づく多段階強化学習政策を用いて教師あり学習を行った。
この変更により、コストと非効率なデータ収集プロトコルを回避しつつ、より繊細なトポロジ的状態遷移が可能になる。
実験結果から、TWISTED-RLは、図8やオーバーハンドのような一般的に使われるノットを含む、従来は達成不可能だった複雑さのノットを解くことができた。
さらに、成功率の増加と計画時間の減少により、TWISTED-RLは人間のデモのないロボット結び目における新しい最先端技術として確立される。
関連論文リスト
- EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - Fully Learnable Neural Reward Machines [0.0]
本稿では,Symbol Grounding関数とエンドツーエンドの両方を学習可能な,完全に学習可能なNeural Reward Machines(NRM)を提案する。
我々のアプローチは古典的な深いRL(DRL)アプローチと同じくらい簡単に適用できるが、より説明しやすい。
論文 参考訳(メタデータ) (2025-09-23T13:57:13Z) - Learning stochastic dynamics from snapshots through regularized unbalanced optimal transport [1.6678419461030687]
少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。
本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。
本手法は,RUOT形式に基づいて,成長・死過程の事前知識や追加情報を必要とせず,これらのダイナミクスをモデル化する。
論文 参考訳(メタデータ) (2024-10-01T16:25:03Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - Enabling Continual Learning with Differentiable Hebbian Plasticity [18.12749708143404]
連続学習は、獲得した知識を保護しながら、新しいタスクや知識を順次学習する問題である。
破滅的な忘れ物は、そのような学習プロセスを実行するニューラルネットワークにとって、大きな課題となる。
微分可能なヘビアン塑性からなるヘビアンコンソリデーションモデルを提案する。
論文 参考訳(メタデータ) (2020-06-30T06:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。