Fugu-MT 論文翻訳(概要): Training Robots without Robots: Deep Imitation Learning for Master-to-Robot Policy Transfer

論文の概要: Training Robots without Robots: Deep Imitation Learning for Master-to-Robot Policy Transfer

arxiv url: http://arxiv.org/abs/2202.09574v2
Date: Mon, 26 Feb 2024 10:27:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-29 01:23:43.343603
Title: Training Robots without Robots: Deep Imitation Learning for Master-to-Robot Policy Transfer
Title（参考訳）: ロボットのいない訓練ロボット:マスター・ツー・ロボット政策伝達のための深層模倣学習
Authors: Heecheol Kim, Yoshiyuki Ohmura, Akihiko Nagakubo, and Yasuo Kuniyoshi
Abstract要約: 深層模倣学習は、デモサンプルのみを必要とするため、ロボット操作に有望である。既存の実証手法には欠点があり、双方向遠隔操作には複雑な制御方式が必要であり、高価である。本研究は、力覚フィードバックに基づく操作タスクをロボットに教える必要がない新しいM2Rポリシー伝達システムを提案する。
参考スコア（独自算出の注目度）: 4.318590074766604
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Deep imitation learning is promising for robot manipulation because it only requires demonstration samples. In this study, deep imitation learning is applied to tasks that require force feedback. However, existing demonstration methods have deficiencies; bilateral teleoperation requires a complex control scheme and is expensive, and kinesthetic teaching suffers from visual distractions from human intervention. This research proposes a new master-to-robot (M2R) policy transfer system that does not require robots for teaching force feedback-based manipulation tasks. The human directly demonstrates a task using a controller. This controller resembles the kinematic parameters of the robot arm and uses the same end-effector with force/torque (F/T) sensors to measure the force feedback. Using this controller, the operator can feel force feedback without a bilateral system. The proposed method can overcome domain gaps between the master and robot using gaze-based imitation learning and a simple calibration method. Furthermore, a Transformer is applied to infer policy from F/T sensory input. The proposed system was evaluated on a bottle-cap-opening task that requires force feedback.
Abstract（参考訳）: 深層模倣学習は、デモサンプルのみを必要とするため、ロボット操作に有望である。本研究では,強いフィードバックを必要とするタスクに対して,深い模倣学習を適用する。両者の遠隔操作は複雑な制御方式を必要とし、高価であり、審美的指導は人間の介入による視覚障害に苦しむ。本研究は、力覚フィードバックに基づく操作タスクをロボットに教える必要がない新しいM2Rポリシー伝達システムを提案する。人間は、コントローラを使用してタスクを直接示します。このコントローラはロボットアームの運動パラメータに似ており、力/トルク(F/T)センサーを備えた同じエンドエフェクターを用いて力フィードバックを測定する。このコントローラを使用すると、オペレータは双方向のシステムなしで力フィードバックを感じることができる。提案手法は,視線に基づく模倣学習と単純な校正手法を用いて,マスタとロボット間の領域ギャップを克服する。さらに、F/Tセンサ入力からポリシーを推測するためにトランスフォーマーを適用する。提案システムは, 強制フィードバックを必要とするボトルキャップ開放作業に基づいて評価した。

関連論文リスト

Imitating What Works: Simulation-Filtered Modular Policy Learning from Human Videos [56.510263910611684]
本研究では,様々な動作を行う前に物体をつかむタスクを包括的操作に対処する。人間のビデオは、移植後の動作を学ぶための強力な信号を提供するが、必要な把握行動を学ぶのにはあまり役に立たない。本稿では、人間の動画モーションデータを用いたモジュラー操作ポリシーをトレーニングするためのフレームワークであるPerceive-Simulate-Imitate(PSI)を提案する。
論文参考訳（メタデータ） (2026-02-13T18:59:10Z)
When a Robot is More Capable than a Human: Learning from Constrained Demonstrators [4.015444385806047]
デモンストレーションから学んだ専門家は、審美的な教育、ジョイスティックコントロール、シム・トゥ・リアル・トランスファーといったインターフェースを使って、ロボットに複雑なタスクを教えることができる。これらのインターフェースは、間接的な制御、セットアップの制限、ハードウェアの安全性による最適な動作を示す専門家の能力をしばしば制限する。ロボットは、制約のある専門家が示したものよりも優れたポリシーを学べるだろうか? 我々は、エージェントが専門家の行動の直接の模倣を越えて、より短くより効率的な軌道を探索できるようにすることで、この問題に対処する。
論文参考訳（メタデータ） (2025-10-10T07:48:12Z)
Feel the Force: Contact-Driven Learning from Humans [52.36160086934298]
操作中のきめ細かい力の制御は、ロボット工学における中核的な課題である。 We present FeelTheForce, a robot learning system that model human tactile behavior to learn force-sensitive control。提案手法は,5つの力覚的操作タスクで77%の成功率を達成した,スケーラブルな人間の監督において,堅牢な低レベル力制御を実現する。
論文参考訳（メタデータ） (2025-06-02T17:57:52Z)
Robot-R1: Reinforcement Learning for Enhanced Embodied Reasoning in Robotics [55.05920313034645]
本稿では,ロボット制御に特化して具体的推論を強化するため,強化学習を活用した新しいフレームワークであるRobot-R1を紹介する。 DeepSeek-R1学習アプローチにインスパイアされたRobot-R1は、推論に基づく応答をサンプリングし、より正確な予測につながるものを強化する。実験の結果,ロボットR1で訓練したモデルは,具体的推論タスクにおいて,SFT法よりも優れていた。
論文参考訳（メタデータ） (2025-05-29T16:41:12Z)
Force-Based Robotic Imitation Learning: A Two-Phase Approach for Construction Assembly Tasks [2.6092377907704254]
本稿では,ロボット学習を改善するための2段階システムを提案する。第1フェーズは、ROS-Sharpを介して仮想シミュレータにリンクされたロボットアームを使用して、オペレータからリアルタイムデータをキャプチャする。第2段階では、このフィードバックは、学習プロセスに力フィードバックを組み込むための生成的アプローチを用いて、ロボットの動き指示に変換される。
論文参考訳（メタデータ） (2025-01-24T22:01:23Z)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文参考訳（メタデータ） (2024-06-29T03:37:29Z)
Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System [5.497832119577795]
厳格なロボットを使った、きめ細やかな、接触に富んだ操作は、ロボット工学において重要な課題である。外部センサを介して力を制御することでこれらの問題を緩和するために、コンプライアンス制御スキームが導入されている。 Demonstrationsからの学習は直感的な代替手段であり、ロボットは観察された動作を通じて操作を学習できる。
論文参考訳（メタデータ） (2024-06-21T09:03:37Z)
A Framework for Learning from Demonstration with Minimal Human Effort [11.183124892686239]
ロボット学習は、システムの制御が人間の遠隔操作と自律的な制御とを切り替えることのできる、共有自律という文脈で考える。この設定では、強化学習と、人的時間に関連するコストがある実演からの学習に対処する。提案手法は,2つのシミュレートされたタスクと1つの実世界のタスクを実行するための人件費を削減できることを示す。
論文参考訳（メタデータ） (2023-06-15T15:49:37Z)
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文参考訳（メタデータ） (2023-03-02T18:51:38Z)
NeRF in the Palm of Your Hand: Corrective Augmentation for Robotics via Novel-View Synthesis [50.93065653283523]
SPARTN(Synthetic Perturbations for Augmenting Robot Trajectories via NeRF)は、ロボットポリシーを改善するための完全なオフラインデータ拡張スキームである。提案手法はニューラルレイディアンス場(NeRF)を利用して,視覚的デモンストレーションに補正ノイズを合成注入する。シミュレーションされた6-DoF視覚的把握ベンチマークでは、SPARTNは精度を2.8$times$で改善する。
論文参考訳（メタデータ） (2023-01-18T23:25:27Z)
Dexterous Manipulation from Images: Autonomous Real-World RL via Substep Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文参考訳（メタデータ） (2022-12-19T22:50:40Z)
Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文参考訳（メタデータ） (2022-11-16T16:26:48Z)
REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文参考訳（メタデータ） (2022-02-10T18:50:25Z)
Transformer-based deep imitation learning for dual-arm robot manipulation [5.3022775496405865]
デュアルアームの操作設定では、追加のロボットマニピュレータによって引き起こされる状態次元の増加が注意をそらす。本稿では、逐次入力における要素間の依存関係を計算し、重要な要素に焦点をあてる自己認識機構を用いてこの問題に対処する。自己注意型アーキテクチャの変種であるTransformerは、実世界のデュアルアーム操作タスクを解決するために、深層模倣学習に適用される。
論文参考訳（メタデータ） (2021-08-01T07:42:39Z)
Learning of Long-Horizon Sparse-Reward Robotic Manipulator Tasks with Base Controllers [26.807673929816026]
本稿では,1つ以上の従来型ベースコントローラを用いた長軸スパース・リワードタスクの学習手法を提案する。提案アルゴリズムは,既存のベースコントローラを探索,価値学習,ポリシー更新の段階に組み込む。我々の方法は、既存の産業用ロボット操作システムを利用して、より柔軟でインテリジェントなコントローラを構築する可能性を秘めている。
論文参考訳（メタデータ） (2020-11-24T14:23:57Z)
Learning Force Control for Contact-rich Manipulation Tasks with Rigid Position-controlled Robots [9.815369993136512]
従来の力制御とRL手法を組み合わせた学習に基づく力制御フレームワークを提案する。このような制御方式の中で,位置制御ロボットによる力制御を実現するために,従来の2つの手法を実装した。最後に,実剛性ロボットマニピュレータを用いた操作作業において,RLエージェントを安全に訓練するためのフェールセーフ機構を開発した。
論文参考訳（メタデータ） (2020-03-02T01:58:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。