論文の概要: Task-oriented grasping for dexterous robots using postural synergies and reinforcement learning
- arxiv url: http://arxiv.org/abs/2602.20915v1
- Date: Tue, 24 Feb 2026 13:51:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.66893
- Title: Task-oriented grasping for dexterous robots using postural synergies and reinforcement learning
- Title(参考訳): 姿勢相乗効果と強化学習を用いた高級ロボットのタスク指向グルーピング
- Authors: Dimitrios Dimou, José Santos-Victor, Plinio Moreno,
- Abstract要約: 既存の手法では、様々なオープンループとクローズドループアプローチを採用しているが、複数のオブジェクトを把握できるエンドツーエンドのソリューションが欠如している。
提案手法は強化学習を用いてタスク指向の把握を強化し,エージェントの作業後意図を優先する。
- 参考スコア(独自算出の注目度): 4.265773997354608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we address the problem of task-oriented grasping for humanoid robots, emphasizing the need to align with human social norms and task-specific objectives. Existing methods, employ a variety of open-loop and closed-loop approaches but lack an end-to-end solution that can grasp several objects while taking into account the downstream task's constraints. Our proposed approach employs reinforcement learning to enhance task-oriented grasping, prioritizing the post-grasp intention of the agent. We extract human grasp preferences from the ContactPose dataset, and train a hand synergy model based on the Variational Autoencoder (VAE) to imitate the participant's grasping actions. Based on this data, we train an agent able to grasp multiple objects while taking into account distinct post-grasp intentions that are task-specific. By combining data-driven insights from human grasping behavior with learning by exploration provided by reinforcement learning, we can develop humanoid robots capable of context-aware manipulation actions, facilitating collaboration in human-centered environments.
- Abstract(参考訳): 本稿では,人間型ロボットにおけるタスク指向の把握の問題に対処し,人間の社会的規範やタスク固有の目的と整合する必要性を強調した。
既存の手法では、様々なオープンループとクローズドループアプローチを採用しているが、下流タスクの制約を考慮して複数のオブジェクトを把握できるエンドツーエンドのソリューションが欠如している。
提案手法は強化学習を用いてタスク指向の把握を強化し,エージェントの作業後意図を優先する。
本研究では、ContactPoseデータセットから人間のグリップ嗜好を抽出し、変動オートエンコーダ(VAE)に基づいて手指のシナジーモデルを訓練し、参加者のグリップ動作を模倣する。
このデータに基づいて、タスク固有の個別の事後意図を考慮に入れながら、複数のオブジェクトを把握できるエージェントを訓練する。
人間の把握行動からのデータ駆動的な洞察と、強化学習による探索による学習を組み合わせることで、人間中心の環境での協調を支援するコンテキスト認識操作が可能なヒューマノイドロボットを開発することができる。
関連論文リスト
- HHI-Assist: A Dataset and Benchmark of Human-Human Interaction in Physical Assistance Scenario [63.77482302352545]
HHI-Assist(ヒヒ・アシスト)は、人間の介助作業における人間のインタラクションのモーションキャプチャークリップからなるデータセットである。
私たちの研究は、ロボット支援ポリシーを大幅に強化する可能性がある。
論文 参考訳(メタデータ) (2025-09-12T09:38:17Z) - Humanoid Agent via Embodied Chain-of-Action Reasoning with Multimodal Foundation Models for Zero-Shot Loco-Manipulation [23.43820490179566]
Humanoid-COAはゼロショットロコ操作のためのエボディード・チェーン・オブ・アクション機構と基礎モデル推論を統合している。
我々のフレームワークは、操作、移動、およびロコ操作タスクにおいて、以前のベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2025-04-13T11:37:32Z) - OminiAdapt: Learning Cross-Task Invariance for Robust and Environment-Aware Robotic Manipulation [1.4719692998274154]
本稿では,ヒューマノイドロボットに適した模倣学習アルゴリズムを提案する。
主な課題に焦点をあてて,提案アルゴリズムは環境障害を抑制する。
実験の結果,提案手法は様々なタスクシナリオに対して頑健さとスケーラビリティを示すことがわかった。
論文 参考訳(メタデータ) (2025-03-27T08:28:22Z) - CooHOI: Learning Cooperative Human-Object Interaction with Manipulated Object Dynamics [44.30880626337739]
CooHOIはマルチヒューマノイド物体輸送問題の解決を目的としたフレームワークである。
単一のヒューマノイドキャラクタは、人間の動きの先行から模倣学習を通じてオブジェクトと対話することを学ぶ。
そして、ヒューマノイドは、操作対象の共有ダイナミクスを考慮し、他人と協調することを学ぶ。
論文 参考訳(メタデータ) (2024-06-20T17:59:22Z) - Self-Explainable Affordance Learning with Embodied Caption [63.88435741872204]
具体的キャプションを具現化したSelf-Explainable Affordance Learning (SEA)を紹介する。
SEAは、ロボットが意図を明確に表現し、説明可能な視覚言語キャプションと視覚能力学習のギャップを埋めることを可能にする。
本稿では, 簡便かつ効率的な方法で, 空き地と自己説明を効果的に組み合わせた新しいモデルを提案する。
論文 参考訳(メタデータ) (2024-04-08T15:22:38Z) - ThinkBot: Embodied Instruction Following with Thought Chain Reasoning [66.09880459084901]
EIF(Embodied Instruction following)は、複雑な環境下でオブジェクトを相互作用させることで、エージェントが人間の指示を完了させる。
我々は,人間の指導における思考連鎖を原因とした思考ボットを提案し,その不足した行動記述を復元する。
私たちのThinkBotは、成功率と実行効率の両面で、最先端のEIFメソッドよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-12-12T08:30:09Z) - Proactive Human-Robot Interaction using Visuo-Lingual Transformers [0.0]
人間は人間の相互作用を通して文脈を推測するために、潜伏したビスオ・言語的手がかりを抽出する能力を持っている。
本研究では,シーンからの視覚的手がかり,ユーザからの言語コマンド,事前オブジェクト間相互作用の知識を用いて,ユーザが達成しようとしている目標を積極的に予測する学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-04T00:50:21Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Learning Relative Interactions through Imitation [0.0]
比較的少ないトレーニングデータを持つ単純なネットワークは、固定目的タスクにおいて非常に優れたパフォーマンスが得られることを示す。
また,センサ読み取りにおけるあいまいさ,特に対象物体の対称性が学習コントローラの動作に与える影響についても検討する。
論文 参考訳(メタデータ) (2021-09-24T15:18:34Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。