論文の概要: Arnold: a generalist muscle transformer policy
- arxiv url: http://arxiv.org/abs/2508.18066v1
- Date: Mon, 25 Aug 2025 14:22:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.814065
- Title: Arnold: a generalist muscle transformer policy
- Title(参考訳): アーノルド:一般的な筋肉トランスフォーマー政策
- Authors: Alberto Silvio Chiappa, Boshi An, Merkourios Simos, Chengkun Li, Alexander Mathis,
- Abstract要約: 我々は、複数のタスクと実施をマスターするポリシーであるArnoldを開発します。
Arnold氏は、14の困難な制御タスクにおいて、振る舞いのクローン化とPPOとの微調整を組み合わせて、専門家または超専門的なパフォーマンスを達成する。
重要な革新はアーノルドの感覚運動の語彙であり、これは異質な感覚のモダリティ、目的、アクチュエータのセマンティクスの合成表現である。
- 参考スコア(独自算出の注目度): 46.25391322849984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Controlling high-dimensional and nonlinear musculoskeletal models of the human body is a foundational scientific challenge. Recent machine learning breakthroughs have heralded policies that master individual skills like reaching, object manipulation and locomotion in musculoskeletal systems with many degrees of freedom. However, these agents are merely "specialists", achieving high performance for a single skill. In this work, we develop Arnold, a generalist policy that masters multiple tasks and embodiments. Arnold combines behavior cloning and fine-tuning with PPO to achieve expert or super-expert performance in 14 challenging control tasks from dexterous object manipulation to locomotion. A key innovation is Arnold's sensorimotor vocabulary, a compositional representation of the semantics of heterogeneous sensory modalities, objectives, and actuators. Arnold leverages this vocabulary via a transformer architecture to deal with the variable observation and action spaces of each task. This framework supports efficient multi-task, multi-embodiment learning and facilitates rapid adaptation to novel tasks. Finally, we analyze Arnold to provide insights into biological motor control, corroborating recent findings on the limited transferability of muscle synergies across tasks.
- Abstract(参考訳): 人体の高次元および非線形筋骨格モデルを制御することは基礎的な科学的課題である。
最近の機械学習のブレークスルーは、多くの自由度を持つ筋骨格系において、到達、オブジェクト操作、移動といった個々のスキルをマスターする方針を定めている。
しかし、これらのエージェントは単に「特殊主義者」であり、1つのスキルで高いパフォーマンスを達成する。
本研究では、複数のタスクと実施をマスターする一般政策であるArnoldを開発する。
Arnold氏は、振る舞いのクローニングと微調整をPPOと組み合わせて、巧妙なオブジェクト操作からロコモーションに至るまで、14の困難な制御タスクにおいて、専門家または超専門的なパフォーマンスを達成する。
重要な革新はアーノルドの感覚運動の語彙であり、これは異質な感覚のモダリティ、目的、アクチュエータのセマンティクスの合成表現である。
Arnold氏はこの語彙をトランスフォーマーアーキテクチャを通じて利用し、各タスクの変動観測とアクション空間を扱う。
このフレームワークは、効率的なマルチタスク、マルチエンボディメント学習をサポートし、新しいタスクへの迅速な適応を容易にする。
最後に、アーノルドを解析して生物学的運動制御の洞察を与え、タスク間の筋肉シナジーの伝達性に制限があるという最近の知見を裏付ける。
関連論文リスト
- Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems [0.7373617024876725]
四足歩行ロボットは、足の機敏性を活用して、追加のアクチュエーターを使わずに物体を収集できるフレームワークを提案する。
スクープのようなアドオンを片足に装着することで、ロボットは物体をスクープして背中に取り付けられた収集トレイに投げ込むことができる。
論文 参考訳(メタデータ) (2025-06-11T05:28:27Z) - SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending [79.83865372778273]
SkillBlenderは、多目的なヒューマノイドロコ操作のための新しい階層的強化学習フレームワークである。
SkillBlenderは、まずゴール条件付きタスク非依存のプリミティブスキルを事前訓練し、その後、これらのスキルを動的にブレンドして複雑なロコ操作タスクを達成する。
また,3つのエボディメント,4つのプリミティブスキル,8つの難解なロコ操作タスクを含む並列的,クロスエボディメント,多種多様なシミュレーションベンチマークであるSkillBenchを紹介した。
論文 参考訳(メタデータ) (2025-06-11T03:24:26Z) - Reinforcement learning-based motion imitation for physiologically plausible musculoskeletal motor control [47.423243831156285]
筋運動制御の理解を深めるために,モデルフリー運動模倣フレームワーク(KINESIS)を提案する。
我々は,KINESISが1.9時間のモーションキャプチャデータに対して強い模倣性能を達成できることを実証した。
キネシスはヒトの筋活動とよく相関する筋活動パターンを生成する。
論文 参考訳(メタデータ) (2025-03-18T18:37:49Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Hierarchical generative modelling for autonomous robots [8.023920215148486]
人型ロボットが、移動、操作、把握の全体的利用を必要とする複雑なタスクを自律的に完了できることを示します。
具体的には、箱を回収して輸送し、ドアを通り抜けて目的地に到達し、接近し、サッカーを蹴ることのできるヒューマノイドロボットの能力を示すとともに、身体の損傷や地面の不規則性の存在下で頑健な性能を示す。
論文 参考訳(メタデータ) (2023-08-15T13:51:03Z) - Legs as Manipulator: Pushing Quadrupedal Agility Beyond Locomotion [34.33972863987201]
我々は四足歩行ロボットを訓練し、前脚を使って壁を登り、ボタンを押し、現実世界でオブジェクトインタラクションを行う。
これらのスキルはカリキュラムを用いてシミュレーションで訓練され,提案したsim2real 変種を用いて実世界へ移行する。
我々は,本手法をシミュレーションと実世界の双方で評価し,短距離および長距離のタスクの実行を成功させたことを示す。
論文 参考訳(メタデータ) (2023-03-20T17:59:58Z) - MyoSuite -- A contact-rich simulation suite for musculoskeletal motor
control [7.856809409051587]
myoSuiteは、生理学的に正確な肘、手首、手首の生体力学的モデルで、物理的な接触機能を備えている。
簡単な姿勢制御から熟練した手-物体間相互作用まで、さまざまな運動制御課題を提供する。
論文 参考訳(メタデータ) (2022-05-26T20:11:23Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。