論文の概要: Learning Dexterous Object Handover
- arxiv url: http://arxiv.org/abs/2506.16822v1
- Date: Fri, 20 Jun 2025 08:22:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.382169
- Title: Learning Dexterous Object Handover
- Title(参考訳): Dexterous Objectハンドオーバの学習
- Authors: Daniel Frau-Alfaro, Julio Castaño-Amoros, Santiago Puente, Pablo Gil, Roberto Calandra,
- Abstract要約: 本研究では,多指ハンドオーバにおける強化学習(Reinforcement Learning, RL)の応用を実証する。
このタスクの鍵となるのは、回転距離を最小化するために二重四元数に基づく新しい報酬関数を使うことである。
その結果,100実験後のベストケースシナリオの総成功率は94%であった。
- 参考スコア(独自算出の注目度): 4.351636062759616
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object handover is an important skill that we use daily when interacting with other humans. To deploy robots in collaborative setting, like houses, being able to receive and handing over objects safely and efficiently becomes a crucial skill. In this work, we demonstrate the use of Reinforcement Learning (RL) for dexterous object handover between two multi-finger hands. Key to this task is the use of a novel reward function based on dual quaternions to minimize the rotation distance, which outperforms other rotation representations such as Euler and rotation matrices. The robustness of the trained policy is experimentally evaluated by testing w.r.t. objects that are not included in the training distribution, and perturbations during the handover process. The results demonstrate that the trained policy successfully perform this task, achieving a total success rate of 94% in the best-case scenario after 100 experiments, thereby showing the robustness of our policy with novel objects. In addition, the best-case performance of the policy decreases by only 13.8% when the other robot moves during the handover, proving that our policy is also robust to this type of perturbation, which is common in real-world object handovers.
- Abstract(参考訳): オブジェクトのハンドオーバは、他の人間と対話する際に毎日使う重要なスキルです。
家のように協調的にロボットを配置し、安全に、効率よく物体の受け渡しを可能にすることが重要な技術となる。
本研究では,多指ハンドオーバにおける強化学習(Reinforcement Learning, RL)の応用を実演する。
このタスクの鍵となるのは、二元四元数に基づく新しい報酬関数を使用して回転距離を最小化し、オイラーや回転行列のような他の回転表現より優れていることである。
トレーニングされたポリシーの堅牢性は、トレーニング分布に含まれないw.r.t.オブジェクトのテストと、ハンドオーバプロセス中の摂動によって実験的に評価される。
その結果,100実験後のベストケースシナリオでは,94%の成功率を達成し,新規な対象による政策の堅牢性を示すことができた。
さらに、このポリシーのベストケース性能は、他のロボットがハンドオーバ中に動くとわずか13.8%低下し、我々のポリシーは現実世界のオブジェクトハンドオーバに共通するこの種の摂動にも堅牢であることを示した。
関連論文リスト
- Tool-as-Interface: Learning Robot Policies from Human Tool Usage through Imitation Learning [16.394434999046293]
ツール使用時の知識を人間からロボットに伝達する枠組みを提案する。
我々は,ミートボールスクーピング,パンフリップ,ワインボトルのバランス,その他の複雑なタスクなど,現実世界のさまざまなタスクに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-04-06T20:40:19Z) - FLEX: A Framework for Learning Robot-Agnostic Force-based Skills Involving Sustained Contact Object Manipulation [9.292150395779332]
本稿では,力空間におけるオブジェクト中心の操作ポリシーを学習するための新しいフレームワークを提案する。
提案手法は, 動作空間を単純化し, 不要な探索を低減し, シミュレーションオーバーヘッドを低減させる。
評価の結果,本手法はベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-03-17T17:49:47Z) - Lessons from Learning to Spin "Pens" [51.9182692233916]
本研究では,ペンのような物体を回転させる能力を示すことによって,学習に基づく手動操作システムの境界を推し進める。
まず、強化学習を用いて、特権情報でオラクルポリシーを訓練し、シミュレーションにおいて高忠実度軌道データセットを生成する。
次に、これらの実世界の軌道を用いて感覚運動のポリシーを微調整し、実世界の力学に適応させる。
論文 参考訳(メタデータ) (2024-07-26T17:56:01Z) - Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge [93.4434417387526]
ロボット工学における鍵となるベンチマークタスクとして,Open Vocabulary Mobile Manipulationを提案する。
我々は,この課題に対する解決策を評価するために,シミュレーションと実世界のコンポーネントを兼ね備えたNeurIPS 2023コンペティションを組織した。
シミュレーションと実環境設定の両方で使用される結果と方法論を詳述する。
論文 参考訳(メタデータ) (2024-07-09T15:15:01Z) - DexCatch: Learning to Catch Arbitrary Objects with Dexterous Hands [14.712280514097912]
そこで我々は,器用な手を用いたスローング・キャッチタスクのための学習ベースのフレームワークを提案する。
提案手法は45シナリオで73%の成功率を達成する(さまざまなポーズやオブジェクト)。
物体が横向きに向き合うタスクでは、手のひらからの支持が欠如しているため非常に不安定なシナリオであり、我々の手法は依然として60%以上の成功率を達成している。
論文 参考訳(メタデータ) (2023-10-13T01:36:46Z) - Trajectory-based Reinforcement Learning of Non-prehensile Manipulation
Skills for Semi-Autonomous Teleoperation [18.782289957834475]
本稿では,RGB-Dセンサを用いたピックアップ・アンド・プレイスタスクのための半自律遠隔操作フレームワークを提案する。
トラジェクトリに基づく強化学習を用いて、非包括的操作を学習し、物体を再構成する。
提案手法は,握り時間の観点から手動キーボード制御よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-09-27T14:27:28Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - Reactive Human-to-Robot Handovers of Arbitrary Objects [57.845894608577495]
本稿では、未知の物体の人間とロボットのハンドオーバを可能にするビジョンベースシステムを提案する。
提案手法は,クローズドループ運動計画とリアルタイムかつ時間的に一貫性のあるグリップ生成を組み合わせたものである。
提案手法の汎用性,ユーザビリティ,ロバスト性を,26種類の家庭用オブジェクトからなる新しいベンチマークで実証した。
論文 参考訳(メタデータ) (2020-11-17T21:52:22Z) - Reinforcement Learning Experiments and Benchmark for Solving Robotic
Reaching Tasks [0.0]
強化学習はロボットアームによる到達タスクの解決に成功している。
ハイドサイト体験再生探索技術により報奨信号の増大が, オフ・ポリティクス・エージェントの平均リターンを増加させることが示されている。
論文 参考訳(メタデータ) (2020-11-11T14:00:49Z) - Learning Dexterous Grasping with Object-Centric Visual Affordances [86.49357517864937]
控えめなロボットハンドは、機敏さと人間のような形態をアピールしています。
本稿では,厳密な把握を学習するためのアプローチを提案する。
私たちのキーとなるアイデアは、オブジェクト中心の視覚的余裕モデルを深い強化学習ループに埋め込むことです。
論文 参考訳(メタデータ) (2020-09-03T04:00:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。