論文の概要: Phase-Amplitude Reduction-Based Imitation Learning
- arxiv url: http://arxiv.org/abs/2406.03735v1
- Date: Thu, 6 Jun 2024 04:19:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-07 18:25:49.925562
- Title: Phase-Amplitude Reduction-Based Imitation Learning
- Title(参考訳): 位相振幅還元に基づく模倣学習
- Authors: Satoshi Yamamori, Jun Morimoto,
- Abstract要約: 本稿では、位相振幅低減法を用いて模倣学習フレームワークを構築することを提案する。
従来の動的システムに基づく模倣学習手法とは異なり,提案手法では,ロボットが極限サイクル軌道を模倣することができる。
その結果,本手法はより正確に過渡的な動きを生成できることが明らかとなった。
- 参考スコア(独自算出の注目度): 0.9668407688201356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this study, we propose the use of the phase-amplitude reduction method to construct an imitation learning framework. Imitating human movement trajectories is recognized as a promising strategy for generating a range of human-like robot movements. Unlike previous dynamical system-based imitation learning approaches, our proposed method allows the robot not only to imitate a limit cycle trajectory but also to replicate the transient movement from the initial or disturbed state to the limit cycle. Consequently, our method offers a safer imitation learning approach that avoids generating unpredictable motions immediately after disturbances or from a specified initial state. We first validated our proposed method by reconstructing a simple limit-cycle attractor. We then compared the proposed approach with a conventional method on a lemniscate trajectory tracking task with a simulated robot arm. Our findings confirm that our proposed method can more accurately generate transient movements to converge on a target periodic attractor compared to the previous standard approach. Subsequently, we applied our method to a real robot arm to imitate periodic human movements.
- Abstract(参考訳): 本研究では,位相振幅低減法を用いて模倣学習フレームワークを構築することを提案する。
人間の運動軌跡を模倣することは、人間のようなロボットの動きを生み出すための有望な戦略として認識されている。
従来の動的システムに基づく模倣学習手法とは異なり,提案手法では,リミットサイクルの軌道を模倣するだけでなく,初期あるいは乱れた状態からリミットサイクルへの過渡的な動きを再現する。
そこで本手法では,障害発生直後や特定初期状態から予測不能な動作を発生させないよう,より安全な模倣学習手法を提案する。
我々はまず,簡単なリミットサイクル・アトラクタを再構築し,提案手法の有効性を検証した。
次に,提案手法と従来の手法との比較を行った。
提案手法は,従来の標準手法と比較して,目標の周期的アトラクタに収束する過渡的な動きをより正確に生成できることを確認した。
その後,本手法を実ロボットアームに適用し,周期的な人間の動きを模倣した。
関連論文リスト
- Self-Supervised Class-Agnostic Motion Prediction with Spatial and Temporal Consistency Regularizations [53.797896854533384]
クラスに依存しない動き予測法は点雲全体の動きを直接予測する。
既存のほとんどのメソッドは、完全に教師付き学習に依存しているが、ポイントクラウドデータの手作業によるラベル付けは、手間と時間を要する。
3つの簡単な空間的・時間的正則化損失を導入し,自己指導型学習プロセスの効率化を図る。
論文 参考訳(メタデータ) (2024-03-20T02:58:45Z) - DiAReL: Reinforcement Learning with Disturbance Awareness for Robust
Sim2Real Policy Transfer in Robot Control [0.0]
遅延マルコフ決定プロセスは、最近コミットされたアクションの有限時間ウィンドウでエージェントの状態空間を拡大することでマルコフ特性を満たす。
本稿では,遅延した環境下での乱れ増進型マルコフ決定プロセスを導入し,政治強化学習アルゴリズムのトレーニングにおける乱れ推定を取り入れた新しい表現法を提案する。
論文 参考訳(メタデータ) (2023-06-15T10:11:38Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Imitating, Fast and Slow: Robust learning from demonstrations via
decision-time planning [96.72185761508668]
テストタイムでの計画(IMPLANT)は、模倣学習のための新しいメタアルゴリズムである。
IMPLANTは,標準制御環境において,ベンチマーク模倣学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-07T17:16:52Z) - Reactive Motion Generation on Learned Riemannian Manifolds [14.325005233326497]
人間の操作者が示す複雑な動作パターンに基づいて動作スキルを生成する方法を示す。
そこで本研究では,学習多様体を変形させることにより,オンザフライのエンドエフェクタ/マルチランブ障害物回避を容易にする手法を提案する。
7-DoFロボットマニピュレータを用いて,タスク空間と関節空間のシナリオにおいて,我々のアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2022-03-15T10:28:16Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - Contact-Aware Retargeting of Skinned Motion [49.71236739408685]
本稿では,自己接触を保存し,相互接続を防止する動作推定手法を提案する。
入力運動における自己接触と接地を同定し、出力骨格に適用するための動作を最適化する。
実験では,従来の手法を定量的に上回り,近年の成果よりも高い品質で再ターゲットされた動きを評価できるユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-09-15T17:05:02Z) - Motion Generation Using Bilateral Control-Based Imitation Learning with
Autoregressive Learning [3.4410212782758047]
本稿では,二元的制御に基づく模倣学習のための自己回帰学習法を提案する。
自己回帰学習を実装するニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-11-12T04:35:48Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。