論文の概要: Learning Dexterous Grasping from Sparse Taxonomy Guidance
- arxiv url: http://arxiv.org/abs/2604.04138v1
- Date: Sun, 05 Apr 2026 14:53:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.941111
- Title: Learning Dexterous Grasping from Sparse Taxonomy Guidance
- Title(参考訳): 希少な分類学指導によるデクサス・グラスピングの学習
- Authors: Juhan Park, Taerim Yoon, Seungmin Kim, Joonggil Kim, Wontae Ye, Jeongeun Park, Yoonbyung Chai, Geonwoo Cho, Geunwoo Cho, Dohyeong Kim, Kyungjae Lee, Yongjae Kim, Sungjoon Choi,
- Abstract要約: デクサラスな操作では、オブジェクトとタスクに適したグリップ構成を計画する必要があります。
本稿では,希少な分類指導から奇抜な制御を学習するフレームワークGRITを紹介する。
- 参考スコア(独自算出の注目度): 10.838496039394718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dexterous manipulation requires planning a grasp configuration suited to the object and task, which is then executed through coordinated multi-finger control. However, specifying grasp plans with dense pose or contact targets for every object and task is impractical. Meanwhile, end-to-end reinforcement learning from task rewards alone lacks controllability, making it difficult for users to intervene when failures occur. To this end, we present GRIT, a two-stage framework that learns dexterous control from sparse taxonomy guidance. GRIT first predicts a taxonomy-based grasp specification from the scene and task context. Conditioned on this sparse command, a policy generates continuous finger motions that accomplish the task while preserving the intended grasp structure. Our result shows that certain grasp taxonomies are more effective for specific object geometries. By leveraging this relationship, GRIT improves generalization to novel objects over baselines and achieves an overall success rate of 87.9%. Moreover, real-world experiments demonstrate controllability, enabling grasp strategies to be adjusted through high-level taxonomy selection based on object geometry and task intent.
- Abstract(参考訳): デクサラスな操作では、オブジェクトとタスクに適したグリップ構成を計画する必要がある。
しかし、すべてのオブジェクトやタスクに対して、密集したポーズや接触目標を持った把握計画を指定することは現実的ではない。
一方、タスク報酬だけでのエンドツーエンドの強化学習は制御性に欠けており、障害が発生した時にユーザが介入することが難しくなる。
この目的のために,二段階のフレームワークであるGRITを提案する。
GRITはまず、シーンとタスクコンテキストから分類に基づくグリップ仕様を予測する。
このスパースコマンドに基づいてポリシーは、意図した把握構造を保持しながらタスクを達成する連続的な指の動きを生成する。
以上の結果から, 特定対象測地において, 把握型分類がより効果的であることが示唆された。
この関係を活用することで、GRITはベースラインを超えた新しいオブジェクトへの一般化を改善し、全体的な成功率は87.9%に達する。
さらに、実世界の実験は制御可能性を示し、オブジェクトの幾何学とタスク意図に基づいた高レベルの分類選択によって把握戦略を調整できる。
関連論文リスト
- LDHP: Library-Driven Hierarchical Planning for Non-prehensile Dexterous Manipulation [3.829270241398111]
非包括的操作は、非構造化設定で、細く、大きく、または、その他の非移植不可能なオブジェクトを扱うのに不可欠である。
事前の計画と探索に基づく手法は、しばしばアドホックな手動設計に依存するか、物理的に実現不可能な動作を生成する。
本稿では,ライブラリ駆動型階層型プランナ(LDHP)を提案する。
論文 参考訳(メタデータ) (2026-03-14T08:54:49Z) - V-CAGE: Context-Aware Generation and Verification for Scalable Long-Horizon Embodied Tasks [6.820118518027692]
V-CAGEは、大規模なセマンティックアライメントデータセットを生成するクローズドループフレームワークである。
本研究では,シーン合成における幾何学的整合性を実現する文脈認識型インスタンス化機構を提案する。
また、階層的な命令分解モジュールを用いて、抽象意図と低レベル制御のギャップを埋める。
論文 参考訳(メタデータ) (2026-01-21T16:41:51Z) - Learning Rational Subgoals from Demonstrations and Instructions [71.86713748450363]
本稿では,新しい目標を達成するための効率的な長期計画を支援する有用なサブゴール学習フレームワークを提案する。
我々のフレームワークの中核は合理的なサブゴール(RSG)の集合であり、基本的には環境状態上の二項分類器である。
目標記述が与えられた場合、学習したサブゴールと派生した依存関係は、A*やRTといった既成の計画アルゴリズムを促進する。
論文 参考訳(メタデータ) (2023-03-09T18:39:22Z) - Unsupervised Task Graph Generation from Instructional Video Transcripts [53.54435048879365]
本研究では,実世界の活動を行う指導ビデオのテキスト書き起こしを提供する環境について考察する。
目標は、これらの重要なステップ間の依存関係関係と同様に、タスクに関連する重要なステップを特定することです。
本稿では,命令調整言語モデルの推論能力とクラスタリングとランキングコンポーネントを組み合わせたタスクグラフ生成手法を提案する。
論文 参考訳(メタデータ) (2023-02-17T22:50:08Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - FAITH: Few-Shot Graph Classification with Hierarchical Task Graphs [39.576675425158754]
少数ショットグラフ分類はグラフのクラスを予測することを目的としており、各クラスに限定されたラベル付きグラフが与えられる。
本稿では,階層的なタスクグラフを構築することにより,タスク相関をキャプチャする新しい数ショット学習フレームワークFAITHを提案する。
4つの一般的な数ショットグラフ分類データセットの実験は、他の最先端のベースラインよりもFAITHの方が優れていることを示した。
論文 参考訳(メタデータ) (2022-05-05T04:28:32Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。