Fugu-MT 論文翻訳(概要): I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning

論文の概要: I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning

arxiv url: http://arxiv.org/abs/2405.08726v2
Date: Mon, 17 Feb 2025 14:32:21 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-18 20:34:44.205852
Title: I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning
Title（参考訳）: I-CTRL:制約強化学習によるヒューマノイドロボットの制御
Authors: Yashuai Yan, Esteve Valls Mascaro, Tobias Egle, Dongheui Lee,
Abstract要約: 有界残留強化学習(I-CTRL)によるヒューマノイドロボットの制御フレームワークの開発 I-CTRLは5つのロボットにまたがるシンプルでユニークな報酬で、動きの模倣に優れています。本フレームワークでは,大規模動作データセットを管理するための自動優先度スケジューラを導入している。
参考スコア（独自算出の注目度）: 8.97654258232601
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humanoid robots have the potential to mimic human motions with high visual fidelity, yet translating these motions into practical, physical execution remains a significant challenge. Existing techniques in the graphics community often prioritize visual fidelity over physics-based feasibility, posing a significant challenge for deploying bipedal systems in practical applications. This paper addresses these issues through bounded residual reinforcement learning to produce physics-based high-quality motion imitation onto legged humanoid robots that enhance motion resemblance while successfully following the reference human trajectory. Our framework, Imitation to Control Humanoid Robots Through Bounded Residual Reinforcement Learning (I-CTRL), reformulates motion imitation as a constrained refinement over non-physics-based retargeted motions. I-CTRL excels in motion imitation with simple and unique rewards that generalize across five robots. Moreover, our framework introduces an automatic priority scheduler to manage large-scale motion datasets when efficiently training a unified RL policy across diverse motions. The proposed approach signifies a crucial step forward in advancing the control of bipedal robots, emphasizing the importance of aligning visual and physical realism for successful motion imitation.
Abstract（参考訳）: ヒューマノイドロボットは、高い視覚的忠実度で人間の動きを模倣する可能性があるが、これらの動きを実用的な物理的実行に変換することは大きな課題である。グラフィックコミュニティの既存の技術は、物理ベースの実現可能性よりも視覚的忠実さを優先することが多く、実践的なアプリケーションに二足歩行システムを展開する上で大きな課題となっている。本論文は, 人体軌道に追従しながら運動類似性を高めた脚型ヒューマノイドロボットに, 物理に基づく高品質な動作模倣を実現するために, 有界強化学習を通じてこれらの課題に対処する。我々の枠組みであるImitation to Control Humanoid Robots through bounded Residual Reinforcement Learning (I-CTRL)は、運動模倣を非物理学に基づく再ターゲット運動に対する制約付き洗練として再構成する。 I-CTRLは5つのロボットにまたがるシンプルでユニークな報酬で、動きの模倣に優れています。さらに,多種多様な動きにまたがる統一的なRLポリシーを効率的にトレーニングする場合に,大規模な動きデータセットを管理するための自動優先度スケジューラを導入する。提案手法は,2足歩行ロボットの制御を前進させる上で重要なステップであり,視覚的および身体的リアリズムを協調させることの重要性を強調している。

関連論文リスト

Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [51.95817740348585]
Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文参考訳（メタデータ） (2025-08-04T06:35:48Z)
KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [50.34487144149439]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文参考訳（メタデータ） (2025-06-15T13:58:53Z)
RL from Physical Feedback: Aligning Large Motion Models with Humanoid Control [32.37239524019001]
本稿では,テキスト駆動型人間動作をヒューマノイドロボットの実行可能な動作に変換することに焦点を当てた。既存のテキスト・トゥ・モーション生成手法は、実世界の展開には適さない運動を運動的にも身体的にも生成する。本稿では,物理認識型動作評価とテキスト条件付き動作生成を統合した新しいフレームワークである物理フィードバックからの強化学習を提案する。
論文参考訳（メタデータ） (2025-06-15T08:39:49Z)
Reinforcement learning-based motion imitation for physiologically plausible musculoskeletal motor control [47.423243831156285]
筋運動制御の理解を深めるために,モデルフリー運動模倣フレームワーク(KINESIS)を提案する。我々は,KINESISが1.9時間のモーションキャプチャデータに対して強い模倣性能を達成できることを実証した。キネシスはヒトの筋活動とよく相関する筋活動パターンを生成する。
論文参考訳（メタデータ） (2025-03-18T18:37:49Z)
Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文参考訳（メタデータ） (2025-03-13T17:48:35Z)
Biomechanics-Guided Residual Approach to Generalizable Human Motion Generation and Estimation [21.750804738752105]
3つの中心となるイノベーションを持つバイオメカニック・アウェア・フレームワークであるBioVAEを提案する。複数のベンチマークにおいて,BioVAEが最先端の性能を達成することを示す。
論文参考訳（メタデータ） (2025-03-08T10:22:36Z)
Aligning Human Motion Generation with Human Perceptions [51.831338643012444]
本研究では,大規模人間の知覚評価データセットであるMotionPerceptと,人間の動作批判モデルであるMotionCriticを導入することにより,ギャップを埋めるデータ駆動型アプローチを提案する。我々の批評家モデルは、運動品質を評価するためのより正確な指標を提供しており、容易に運動生成パイプラインに統合することができる。
論文参考訳（メタデータ） (2024-07-02T14:01:59Z)
DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文参考訳（メタデータ） (2024-06-04T04:53:05Z)
Real-Time Dynamic Robot-Assisted Hand-Object Interaction via Motion Primitives [45.256762954338704]
本稿では,動的ロボット支援ハンドオブジェクトインタラクションに着目した物理HRIの強化手法を提案する。我々はトランスフォーマーに基づくアルゴリズムを用いて、1枚のRGB画像から人間の手の動きをリアルタイムに3Dモデリングする。ロボットのアクション実装は、継続的に更新された3Dハンドモデルを使用して動的に微調整される。
論文参考訳（メタデータ） (2024-05-29T21:20:16Z)
Kinematically Constrained Human-like Bimanual Robot-to-Human Handovers [19.052211315080044]
双方向のハンドオーバは、大きな、変形可能な、または繊細なオブジェクトの転送に不可欠である。本稿では,人体に拘束されたロボット動作を生成するための枠組みを提案する。
論文参考訳（メタデータ） (2024-02-22T13:19:02Z)
Universal Humanoid Motion Representations for Physics-Based Control [71.46142106079292]
物理学に基づくヒューマノイド制御のための総合的な運動スキルを含む普遍的な運動表現を提案する。まず、大きな非構造運動データセットから人間の動きをすべて模倣できる動き模倣機を学習する。次に、模倣者から直接スキルを蒸留することで、動作表現を作成します。
論文参考訳（メタデータ） (2023-10-06T20:48:43Z)
DROP: Dynamics Responses from Human Motion Prior and Projective Dynamics [21.00283279991885]
DROPは、生成的mOtionと射影力学を用いた人間のダイナミクス応答をモデリングするための新しいフレームワークである。様々な動作タスクや様々な物理的摂動にまたがってモデルを広範囲に評価し、応答のスケーラビリティと多様性を実証する。
論文参考訳（メタデータ） (2023-09-24T20:25:59Z)
Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement Primitives [1.7901837062462316]
本研究では,動的運動プリミティブ(Dynamic Movement Primitives)フレームワークにおいて,人間の実演から動的特徴を抽出し,パラメータを自動チューニングする体系的手法を提案する。本手法は,LfDとRLの両方に追従するロボット軌道を再現するために,人間の動的特徴を抽出するための実際のロボット装置に実装した。
論文参考訳（メタデータ） (2023-04-12T08:48:28Z)
Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文参考訳（メタデータ） (2023-03-30T17:58:36Z)
Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文参考訳（メタデータ） (2023-03-07T08:16:46Z)
Skeleton2Humanoid: Animating Simulated Characters for Physically-plausible Motion In-betweening [59.88594294676711]
現代の深層学習に基づく運動合成アプローチは、合成された運動の物理的妥当性をほとんど考慮していない。テスト時に物理指向の動作補正を行うシステムSkeleton2Humanoid'を提案する。挑戦的なLaFAN1データセットの実験は、物理的妥当性と精度の両方の観点から、我々のシステムが先行手法を著しく上回っていることを示している。
論文参考訳（メタデータ） (2022-10-09T16:15:34Z)
Physics-based Human Motion Estimation and Synthesis from Videos [0.0]
単眼のRGBビデオから直接、身体的に可視な人間の動きの生成モデルを訓練するための枠組みを提案する。提案手法のコアとなるのは,不完全な画像に基づくポーズ推定を補正する新しい最適化式である。その結果,我々の身体的補正動作は,ポーズ推定における先行作業よりも有意に優れていた。
論文参考訳（メタデータ） (2021-09-21T01:57:54Z)
UniCon: Universal Neural Controller For Physics-based Character Motion [70.45421551688332]
大規模動作データセットから学習することで,異なるスタイルで数千の動作を習得する物理ベースのユニバーサルニューラルコントローラ(UniCon)を提案する。 UniConは、キーボード駆動制御をサポートし、ロコモーションとアクロバティックスキルの大きなプールから引き出されたモーションシーケンスを作成し、ビデオで撮影した人を物理ベースの仮想アバターにテレポートする。
論文参考訳（メタデータ） (2020-11-30T18:51:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。