Fugu-MT 論文翻訳(概要): Tree Learning: A Multi-Skill Continual Learning Framework for Humanoid Robots

論文の概要: Tree Learning: A Multi-Skill Continual Learning Framework for Humanoid Robots

arxiv url: http://arxiv.org/abs/2604.12909v1
Date: Tue, 14 Apr 2026 15:57:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-15 19:11:32.547464
Title: Tree Learning: A Multi-Skill Continual Learning Framework for Humanoid Robots
Title（参考訳）: 木学習:ヒューマノイドロボットのためのマルチスキル連続学習フレームワーク
Authors: Yifei Yan, Linqi Ye,
Abstract要約: 本稿では,ヒューマノイドロボットのためのマルチスキル連続学習フレームワークであるTree Learningを提案する。このフレームワークはルートブランチの階層的パラメータ継承機構を採用し、分岐スキルの動作先を提供する。スキルコンバージェンスを促進するために,タスクレベルの報酬形成戦略も提案されている。
参考スコア（独自算出の注目度）: 1.282675419968047
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As reinforcement learning for humanoid robots evolves from single-task to multi-skill paradigms, efficiently expanding new skills while avoiding catastrophic forgetting has become a key challenge in embodied intelligence. Existing approaches either rely on complex topology adjustments in Mixture-of-Experts (MoE) models or require training extremely large-scale models, making lightweight deployment difficult. To address this, we propose Tree Learning, a multi-skill continual learning framework for humanoid robots. The framework adopts a root-branch hierarchical parameter inheritance mechanism, providing motion priors for branch skills through parameter reuse to fundamentally prevent catastrophic forgetting. A multi-modal feedforward adaptation mechanism combining phase modulation and interpolation is designed to support both periodic and aperiodic motions. A task-level reward shaping strategy is also proposed to accelerate skill convergence. Unity-based simulation experiments show that, in contrast to simultaneous multi-task training, Tree Learning achieves higher rewards across various representative locomotion skills while maintaining a 100% skill retention rate, enabling seamless multi-skill switching and real-time interactive control. We further validate the performance and generalization capability of Tree Learning on two distinct Unity-simulated tasks: a Super Mario-inspired interactive scenario and autonomous navigation in a classical Chinese garden environment.
Abstract（参考訳）: ヒューマノイドロボットの強化学習がシングルタスクからマルチスキルパラダイムへと進化するにつれて、破滅的な忘れを回避しつつ、新たなスキルを効率的に拡張することが、インテリジェンスを具現化する上で重要な課題となっている。既存のアプローチは、Mixture-of-Experts (MoE)モデルの複雑なトポロジ調整に依存するか、非常に大規模なモデルのトレーニングを必要とするため、軽量なデプロイメントが困難である。そこで本研究では,ヒューマノイドロボットのためのマルチスキル連続学習フレームワークであるTree Learningを提案する。このフレームワークは、ルートブランチの階層的パラメータ継承機構を採用し、パラメータ再利用を通じて分岐スキルの動作先を提供し、破滅的な忘れを根本的に防止する。位相変調と補間を組み合わせた多モードフィードフォワード適応機構は、周期運動と非周期運動の両方をサポートするように設計されている。スキルコンバージェンスを促進するために,タスクレベルの報酬形成戦略も提案されている。ユニティに基づくシミュレーション実験は、同時マルチタスクトレーニングとは対照的に、Tree Learningは、100%のスキル保持率を維持しながら、さまざまな代表的ロコモーションスキルのより高い報酬を達成し、シームレスなマルチタスクスイッチングとリアルタイムインタラクティブコントロールを可能にすることを示した。スーパーマリオにインスパイアされた対話型シナリオと,古典中国の庭園環境における自律ナビゲーションという,2つの異なるUnityシミュレーションタスクにおいて,ツリー学習の性能と一般化能力をさらに検証する。

関連論文リスト

CORAL: Scalable Multi-Task Robot Learning via LoRA Experts [49.759823970016974]
実世界のロボット工学におけるビジョン・ランゲージ・アクション(VLA)モデルは、コアマルチタスク学習の課題を露呈する。タスク毎に個別の完全なチェックポイントを維持することは、しばしばストレージとデプロイメントの禁止である。主にマルチタスク干渉を軽減するために設計されたバックボーンおよび非依存のフレームワークであるCORALを提案する。
論文参考訳（メタデータ） (2026-03-10T07:28:41Z)
Beyond Static Instruction: A Multi-agent AI Framework for Adaptive Augmented Reality Robot Training [17.41874642505417]
Augmented Reality(AR)は、産業用ロボットのトレーニングに強力な視覚化機能を提供する。現在のインターフェイスは、主に静的であり、学習者の多様な認知プロファイルを説明できない。本稿では,静的な可視化と教育的インテリジェンスとのギャップを埋める,将来的な統合のためのマルチエージェントAIフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-31T12:33:52Z)
Learning Semantic Atomic Skills for Multi-Task Robotic Manipulation [34.73582639920571]
AtomSkillは、新しいマルチタスク模倣学習フレームワークである。構成可能なロボット操作のために構造化された原子スキルスペースを学習し活用する。さまざまな操作タスクにまたがって、最先端のメソッドを一貫して上回る。
論文参考訳（メタデータ） (2025-12-20T13:46:08Z)
STAR: STacked AutoRegressive Scheme for Unified Multimodal Learning [37.68078190711403]
STAR:STacked AutoRegressive scheme for task-progressive unified multimodal learning。このアプローチはマルチモーダル学習を理解、生成、編集という複数の段階に分解する。実験により、STARがGenEval(0.91)、DPG-Bench(87.44)、ImgEdit(4.34)の最先端性能を達成することが示された。
論文参考訳（メタデータ） (2025-12-15T07:02:59Z)
SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending [79.83865372778273]
SkillBlenderは、多目的なヒューマノイドロコ操作のための新しい階層的強化学習フレームワークである。 SkillBlenderは、まずゴール条件付きタスク非依存のプリミティブスキルを事前訓練し、その後、これらのスキルを動的にブレンドして複雑なロコ操作タスクを達成する。また,3つのエボディメント,4つのプリミティブスキル,8つの難解なロコ操作タスクを含む並列的,クロスエボディメント,多種多様なシミュレーションベンチマークであるSkillBenchを紹介した。
論文参考訳（メタデータ） (2025-06-11T03:24:26Z)
Transforming Vision Transformer: Towards Efficient Multi-Task Asynchronous Learning [59.001091197106085]
Vision TransformerのためのMulti-Task Learning (MTL)は、複数のタスクを同時に処理することでモデル能力を向上させることを目的としている。最近の研究は、Mixture-of-Experts(MoE)構造の設計とローランド適応(LoRA)によるマルチタスク学習の効率化に重点を置いている。本稿では,事前学習した視覚変換器を効率的なマルチタスク学習器に変換することで,EMTAL(Efficient Multi-Task Learning)と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2025-01-12T17:41:23Z)
RObotic MAnipulation Network (ROMAN) -- Hybrid Hierarchical Learning for Solving Complex Sequential Tasks [45.3746654854308]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。 ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文参考訳（メタデータ） (2023-06-30T20:35:22Z)
Creating Multi-Level Skill Hierarchies in Reinforcement Learning [0.0]
エージェントと環境との相互作用がどのように展開されるかのグラフィカルな表現に基づく回答を提案する。提案手法では,多段階の抽象化で相互作用グラフの構造を明らかにするための中心的な組織原理として,モジュラリティ最大化を用いる。
論文参考訳（メタデータ） (2023-06-16T17:23:49Z)
Example-Driven Model-Based Reinforcement Learning for Solving Long-Horizon Visuomotor Tasks [85.56153200251713]
長軸ビズモータタスクの完了に適したプリミティブスキルを学習するためのモデルベースRL手法EMBRを紹介する。フランカ・エミカのロボットアームでは、EMBRによってロボットは85%の成功率で3つの長い水平視運動タスクを完了できることがわかった。
論文参考訳（メタデータ） (2021-09-21T16:48:07Z)
MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文参考訳（メタデータ） (2021-04-16T16:38:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。