Fugu-MT 論文翻訳(概要): Model-Based Reinforcement Learning Exploits Passive Body Dynamics for High-Performance Biped Robot Locomotion

論文の概要: Model-Based Reinforcement Learning Exploits Passive Body Dynamics for High-Performance Biped Robot Locomotion

arxiv url: http://arxiv.org/abs/2604.14565v1
Date: Thu, 16 Apr 2026 02:54:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-17 21:29:31.695505
Title: Model-Based Reinforcement Learning Exploits Passive Body Dynamics for High-Performance Biped Robot Locomotion
Title（参考訳）: モデルに基づく強化学習による高性能二足歩行ロボットのパッシブボディダイナミクス
Authors: Tomoya Kamimura, Haruka Washiyama, Akihito Sano,
Abstract要約: 本研究では,二足歩行ロボットの身体の受動的特性に着目し,歩行運動とランニング運動を生成する。我々は2つのモデルを構築した。1つは受動的要素(例えばスプリング)を持ち、もう1つは一般ヒューマノイドに似ているが受動的要素は持たない。
参考スコア（独自算出の注目度）: 2.848400947017194
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Embodiment is a significant keyword in recent machine learning fields. This study focused on the passive nature of the body of a biped robot to generate walking and running locomotion using model-based deep reinforcement learning. We constructed two models in a simulator, one with passive elements (e.g., springs) and the other, which is similar to general humanoids, without passive elements. The training of the model with passive elements was highly affected by the attractor of the system. This lead that although the trajectories quickly converged to limit cycles, it took a long time to obtain large rewards. However, thanks to the attractor-driven learning, the acquired locomotion was robust and energy-efficient. The results revealed that robots with passive elements could efficiently acquire high-performance locomotion by utilizing stable limit cycles generated through dynamic interaction between the body and ground. This study demonstrates the importance of implementing passive properties in the body for future embodied AI.
Abstract（参考訳）: エンボディメントは最近の機械学習分野において重要なキーワードである。本研究は,2足歩行ロボットの身体の受動的特性に着目し,モデルに基づく深部強化学習を用いて歩行・走行運動を生成することを目的とした。我々は2つのモデルを構築した。1つは受動的要素(例えばスプリング)を持ち、もう1つは一般ヒューマノイドに似ているが受動的要素は持たない。受動的要素を持つモデルのトレーニングは、システムの魅力に大きく影響された。この結果、軌道はすぐに極限サイクルに収束したが、大きな報酬を得るには長い時間がかかった。しかし、誘引者主導の学習のおかげで、獲得した移動は頑丈でエネルギー効率が良くなった。その結果, 受動的要素を持つロボットは, 物体と地盤の動的相互作用によって生じる安定な限界サイクルを利用して, 効率よく移動を達成できることが判明した。本研究は,今後実施されるAIにおいて,身体に受動的特性を実装することの重要性を実証する。

関連論文リスト

Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks [19.55626538861657]
本稿では、疎結合で協調的なロコ操作アーキテクチャに基づく産業用ヒューマノイドの負荷対応ロコモーションフレームワークを提案する。下半身移動は、運動学的に派生した名目構成に残留的な関節動作を生じる強化学習ポリシーを介して制御される。このフレームワークは完全にシミュレーションで訓練され、微調整なしでフルサイズのヒューマノイドロボットにデプロイされる。
論文参考訳（メタデータ） (2026-03-15T09:57:32Z)
StyleLoco: Generative Adversarial Distillation for Natural Humanoid Robot Locomotion [31.30409161905949]
StyleLocoは、ヒューマノイドの移動を学ぶための新しいフレームワークである。強化学習の機敏さと人間のような運動の自然な流動性を組み合わせる。 StyleLocoは、ヒューマノイドロボットが多様な移動作業を行うことを可能にすることを実証する。
論文参考訳（メタデータ） (2025-03-19T10:27:44Z)
Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文参考訳（メタデータ） (2025-02-24T14:53:45Z)
Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文参考訳（メタデータ） (2024-01-30T10:48:43Z)
Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning [26.13655448415553]
Deep Reinforcement Learning (Deep RL)は、低コストでミニチュアなヒューマノイドロボットのための洗練された安全な運動スキルを合成することができる。我々はDeep RLを使って、20個の関節を持つヒューマノイドロボットを訓練し、1対1(1v1)のサッカーゲームを単純化した。結果として得られるエージェントは、急激な転倒回復、歩行、回転、蹴りなど、堅牢でダイナミックな動きのスキルを示す。
論文参考訳（メタデータ） (2023-04-26T16:25:54Z)
Synthesis and Execution of Communicative Robotic Movements with Generative Adversarial Networks [59.098560311521034]
我々は、繊細な物体を操作する際に人間が採用するのと同じキネマティクス変調を2つの異なるロボットプラットフォームに転送する方法に焦点を当てる。我々は、ロボットのエンドエフェクターが採用する速度プロファイルを、異なる特徴を持つ物体を輸送する際に人間が何をするかに触発されて調整する。我々は、人体キネマティクスの例を用いて訓練され、それらを一般化し、新しい有意義な速度プロファイルを生成する、新しいジェネレーティブ・アドバイサル・ネットワークアーキテクチャを利用する。
論文参考訳（メタデータ） (2022-03-29T15:03:05Z)
Hierarchical Reinforcement Learning of Locomotion Policies in Response to Approaching Objects: A Preliminary Study [11.919315372249802]
深層強化学習により、ヒューマノイドロボットのような複雑な運動系がA点からB点に移動できるようになった。自然界における動物の自然反応の観察にインスパイアされた私たちは、ロボットの移動におけるこの進歩を拡大したいと考えています。ロボットがボールにぶつかることを避けるため,MuJoCo内にシミュレーション環境を構築した。
論文参考訳（メタデータ） (2022-03-20T18:24:18Z)
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文参考訳（メタデータ） (2021-10-28T10:14:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。