Fugu-MT 論文翻訳(概要): Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot Dynamics and Environments

論文の概要: Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot Dynamics and Environments

arxiv url: http://arxiv.org/abs/2101.07599v1
Date: Tue, 19 Jan 2021 12:57:12 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-22 11:15:23.917685
Title: Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot Dynamics and Environments
Title（参考訳）: ロボットのダイナミクスと環境変化における適応モータ制御のためのメタ強化学習
Authors: Timoth\'ee Anne, Jack Wilkinson, Zhibin Li
Abstract要約: この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
参考スコア（独自算出の注目度）: 3.5309638744466167
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This work developed a meta-learning approach that adapts the control policy on the fly to different changing conditions for robust locomotion. The proposed method constantly updates the interaction model, samples feasible sequences of actions of estimated the state-action trajectories, and then applies the optimal actions to maximize the reward. To achieve online model adaptation, our proposed method learns different latent vectors of each training condition, which are selected online given the newly collected data. Our work designs appropriate state space and reward functions, and optimizes feasible actions in an MPC fashion which are then sampled directly in the joint space considering constraints, hence requiring no prior design of specific walking gaits. We further demonstrate the robot's capability of detecting unexpected changes during interaction and adapting control policies quickly. The extensive validation on the SpotMicro robot in a physics simulation shows adaptive and robust locomotion skills under varying ground friction, external pushes, and different robot models including hardware faults and changes.
Abstract（参考訳）: この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。提案手法は, 相互作用モデルを常に更新し, 状態-作用軌道の推定可能な行動列をサンプリングし, 報酬を最大化するために最適な行動を適用する。オンラインモデル適応を実現するために,提案手法では,新たに収集したデータからオンラインに選択したトレーニング条件の潜在ベクトルを学習する。本研究は,適切な状態空間と報酬関数を設計し,mpc方式で実現可能な動作を最適化し,制約を考慮したジョイント空間内で直接サンプリングすることにより,特定の歩行歩行の事前設計を必要としない。さらに,インタラクション中に予期せぬ変化を検知し,制御方針を迅速に適応するロボットの能力を示す。物理シミュレーションにおけるspotmicroロボットの広範な検証は、様々な摩擦、外部の押圧、およびハードウェアの故障や変化を含む異なるロボットモデルの下で適応的でロコモーションスキルを示す。

関連論文リスト

Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文参考訳（メタデータ） (2025-04-25T16:26:15Z)
Trajectory Adaptation using Large Language Models [0.8704964543257245]
新しい状況に応じた人間の指示に基づくロボット軌道の適応は、より直感的でスケーラブルな人間とロボットの相互作用を実現するために不可欠である。本研究は,市販の移動プランナが生成する汎用ロボット軌道に適応する柔軟な言語ベースのフレームワークを提案する。我々は、事前学習されたLLMを用いて、高密度ロボット操作のポリシーとしてコードを生成することにより、軌道方向の経路を適応させる。
論文参考訳（メタデータ） (2025-04-17T08:48:23Z)
Guided Decoding for Robot On-line Motion Generation and Adaption [44.959409835754634]
本稿では,ロボットアームに高い自由度を持つ新たな動作生成手法を提案する。本研究では,実演として使用する擬似軌道の大規模データセットに基づいて,条件付き変分オートエンコーダに基づくトランスフォーマーアーキテクチャを訓練する。本モデルでは, 異なる初期点と目標点からの運動をうまく生成し, 異なるロボットプラットフォームを横断する複雑なタスクをナビゲートする軌道を生成可能であることを示す。
論文参考訳（メタデータ） (2024-03-22T14:32:27Z)
Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。 ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。 ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文参考訳（メタデータ） (2023-11-02T08:22:28Z)
Context-Conditional Navigation with a Learning-Based Terrain- and Robot-Aware Dynamics Model [11.800678688260081]
我々は,TRADYNと呼ばれる新しい確率的,地形的,ロボット対応のフォワードダイナミクスモデルを開発した。本研究では,一輪式ロボットと空間的に異なる摩擦係数を持つ異なる地形配置を備えた2次元ナビゲーション環境において,本手法の評価を行った。
論文参考訳（メタデータ） (2023-07-18T12:42:59Z)
Meta Reinforcement Learning for Optimal Design of Legged Robots [9.054187238463212]
モデルなしメタ強化学習を用いた設計最適化フレームワークを提案する。提案手法は,事前定義された動作や歩行パターンに制約されずに,より高い性能を実現することができることを示す。
論文参考訳（メタデータ） (2022-10-06T08:37:52Z)
Learning Policies for Continuous Control via Transition Models [2.831332389089239]
ロボット制御では、腕のエンドエフェクターを目標位置または目標軌道に沿って移動させるには、正確な前方および逆モデルが必要である。相互作用から遷移(前方)モデルを学習することで、償却されたポリシーの学習を促進することができることを示す。
論文参考訳（メタデータ） (2022-09-16T16:23:48Z)
Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文参考訳（メタデータ） (2021-11-15T18:50:04Z)
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文参考訳（メタデータ） (2021-10-28T10:14:47Z)
OSCAR: Data-Driven Operational Space Control for Adaptive and Robust Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2021-10-02T01:21:38Z)
Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文参考訳（メタデータ） (2021-03-26T07:14:01Z)
Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文参考訳（メタデータ） (2021-03-05T14:16:20Z)
Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。提案手法は高雑音環境における動的変化への適応性を著しく改善する。我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文参考訳（メタデータ） (2020-03-02T22:56:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。