Fugu-MT 論文翻訳(概要): TOLEBI: Learning Fault-Tolerant Bipedal Locomotion via Online Status Estimation and Fallibility Rewards

論文の概要: TOLEBI: Learning Fault-Tolerant Bipedal Locomotion via Online Status Estimation and Fallibility Rewards

arxiv url: http://arxiv.org/abs/2602.05596v2
Date: Wed, 04 Mar 2026 09:13:02 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.198757
Title: TOLEBI: Learning Fault-Tolerant Bipedal Locomotion via Online Status Estimation and Fallibility Rewards
Title（参考訳）: TOLEBI:オンライン状態推定とフォールティビリティ・リワードによるフォールトトレラント二足歩行学習
Authors: Hokyun Lee, Woo-Jeong Baek, Junhyeok Cha, Jaeheung Park,
Abstract要約: 本稿では,二足歩行のための学習型フォールトトレラントフレームワークを提案する。連係、停電、外乱をシミュレーションで注入し、耐故障性ロコモーション戦略を学習する。 SIM-to-real転送による実ロボットへの学習ポリシの転送に加えて、オンラインジョイントステータスモジュールが組み込まれている。
参考スコア（独自算出の注目度）: 6.836413501859183
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: With the growing employment of learning algorithms in robotic applications, research on reinforcement learning for bipedal locomotion has become a central topic for humanoid robotics. While recently published contributions achieve high success rates in locomotion tasks, scarce attention has been devoted to the development of methods that enable to handle hardware faults that may occur during the locomotion process. However, in real-world settings, environmental disturbances or sudden occurrences of hardware faults might yield severe consequences. To address these issues, this paper presents TOLEBI (A faulT-tOlerant Learning framEwork for Bipedal locomotIon) that handles faults on the robot during operation. Specifically, joint locking, power loss and external disturbances are injected in simulation to learn fault-tolerant locomotion strategies. In addition to transferring the learned policy to the real robot via sim-to-real transfer, an online joint status module incorporated. This module enables to classify joint conditions by referring to the actual observations at runtime under real-world conditions. The validation experiments conducted both in real-world and simulation with the humanoid robot TOCABI highlight the applicability of the proposed approach. To our knowledge, this manuscript provides the first learning-based fault-tolerant framework for bipedal locomotion, thereby fostering the development of efficient learning methods in this field.
Abstract（参考訳）: ロボット応用における学習アルゴリズムの利用の増加に伴い、二足歩行における強化学習の研究がヒューマノイドロボティクスの中心的な話題となっている。最近発表された貢献は、移動タスクにおいて高い成功率を達成する一方で、移動プロセス中に起こりうるハードウェア障害を処理できる手法の開発にはほとんど注意が払われていない。しかし、現実の環境では、環境障害や突然のハードウェア故障が深刻な結果をもたらす可能性がある。これらの課題に対処するために,ロボットの動作障害を処理するTOLEBI (A faulT-tOlerant Learning framEwork for Bipedal locomotIon)を提案する。具体的には、耐故障性ロコモーション戦略を学習するために、ジョイントロック、パワーロス、外乱をシミュレーションで注入する。学習したポリシーを、sim-to-real転送を介してリアルロボットに転送するだけでなく、オンラインのジョイントステータスモジュールが組み込まれている。このモジュールは、実世界の条件下での実際の観測を参照することにより、関節状態の分類を可能にする。ヒューマノイドロボットTOCABIを用いた実世界とシミュレーションの両方で実施した検証実験では,提案手法の適用性を強調した。我々の知る限り、この写本は二足歩行のための学習ベースの耐障害性フレームワークとして初めて提供され、それによってこの分野における効率的な学習方法の開発が促進される。

関連論文リスト

Learning Whole-Body Control for a Salamander Robot [1.321203201549798]
サラマンダーに触発された両生類脚ロボットは、複雑な水陸両生環境における応用を約束している。多くのサンショウウオロボットは、中心パターンジェネレータ(CPG)をベースとし、ロコモーション制御のためのモデルベースコーディネート戦略に頼っていた。強化学習(Reinforcement Learning)を用いて、主観的観察をマッピングし、共同レベルの行動に速度を指示することで、協調した運動行動が出現する。
論文参考訳（メタデータ） (2026-03-17T15:43:15Z)
Imitating What Works: Simulation-Filtered Modular Policy Learning from Human Videos [56.510263910611684]
本研究では,様々な動作を行う前に物体をつかむタスクを包括的操作に対処する。人間のビデオは、移植後の動作を学ぶための強力な信号を提供するが、必要な把握行動を学ぶのにはあまり役に立たない。本稿では、人間の動画モーションデータを用いたモジュラー操作ポリシーをトレーニングするためのフレームワークであるPerceive-Simulate-Imitate(PSI)を提案する。
論文参考訳（メタデータ） (2026-02-13T18:59:10Z)
PALo: Learning Posture-Aware Locomotion for Quadruped Robots [29.582249837902427]
本稿では,姿勢認識型移動ロボットPALoのエンド・ツー・エンド深部強化学習フレームワークを提案する。 PALoは、直線速度と角速度の同時追跡と、体高、ピッチ、ロール角度のリアルタイム調整を行う。 PALoは、シミュレートされた環境でアジャイルな姿勢認識ロコモーションコントロールを実現し、微調整なしで実世界の設定に転送することに成功した。
論文参考訳（メタデータ） (2025-03-06T14:13:59Z)
Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文参考訳（メタデータ） (2024-07-02T21:00:30Z)
BeTAIL: Behavior Transformer Adversarial Imitation Learning from Human Racing Gameplay [48.75878234995544]
模倣学習は、手作りの報酬関数を必要とせずに、デモンストレーションからポリシーを学ぶ。本稿では,BeTAIL: Behavior Transformer Adversarial Imitation Learningを提案する。我々は,Gran Turismo Sportにおけるリアルヒューマンゲームプレイのエキスパートレベルのデモンストレーションで,BeTAILを3つの課題でテストした。
論文参考訳（メタデータ） (2024-02-22T00:38:43Z)
Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments [25.366480092589022]
四足歩行ロボットは、環境の乱雑さや移動する障害物に応答して、頑丈で機敏な歩行行動を示す必要がある。本稿では,知覚的移動の問題をハイレベルな意思決定に分解する,PreLUDEという階層型学習フレームワークを提案する。シミュレーションおよびハードウェア実験において,本手法の有効性を実証する。
論文参考訳（メタデータ） (2022-09-19T17:55:07Z)
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文参考訳（メタデータ） (2021-10-28T10:14:47Z)
Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文参考訳（メタデータ） (2021-03-26T07:14:01Z)
Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文参考訳（メタデータ） (2020-10-21T19:11:20Z)
Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文参考訳（メタデータ） (2020-04-02T02:56:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。