論文の概要: CTS-MoE: Implicit Terrain Adaptation via Mixture-of-Experts for Perceptive Locomotion
- arxiv url: http://arxiv.org/abs/2606.19633v1
- Date: Wed, 17 Jun 2026 22:25:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.564282
- Title: CTS-MoE: Implicit Terrain Adaptation via Mixture-of-Experts for Perceptive Locomotion
- Title(参考訳): CTS-MoE:知覚ロコモーションのためのMixture-of-Expertによる地層適応
- Authors: Francisco Affonso, Matheus P. Angarola, Ana Luiza Mineiro, Aditya Potnis, Marcelo Becker, Girish Chowdhary,
- Abstract要約: CTS-MoEは、高密度な熟練アクターと知覚に基づくゲーティングを組み合わせることで、共有行動を構成する。
Unitree Go1のシミュレーションと、見知らぬ地形におけるハードウェアの実験は、トラッキングエラーが低く、モノリシックなベースラインよりも成功率が高い、タスク対応の特殊化を示している。
- 参考スコア(独自算出の注目度): 7.001823893068607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perceptive legged locomotion over discontinuous terrain (e.g., stairs, gaps, and obstacles) requires adaptive behavior, as a single conservative gait cannot produce the anticipatory maneuvers needed for abrupt topology changes. Cast as multi-task reinforcement learning, this problem introduces a tension between sharing and separation. Tasks use a common locomotion base but have conflicting rewards, so a policy must share behavior while avoiding value interference. Prior work addresses only one side, with monolithic policies sacrificing specialization and hierarchical sub-policies sacrificing generalization across transitions and unseen terrain. We propose CTS-MoE, which combines a dense mixture-of-experts actor with perception-based gating to compose shared behaviors and a multi-critic with task-specific value heads to prevent interference. The model is trained end-to-end in a single-stage concurrent teacher-student setup that handles partial observability and avoids sequential distillation, with task labels used only during training. At deployment, routing depends solely on perception, allowing terrain adaptation without a high-level selector or terrain classifier. Experiments on a Unitree Go1 in simulation and on hardware across seen and unseen terrains show task-aware specialization, with lower tracking error and higher success rates than monolithic baselines. Project Website: https://cts-moe.github.io/ .
- Abstract(参考訳): 不連続な地形(例えば階段、隙間、障害物など)に対する知覚的な足の移動には適応的な行動が必要である。
マルチタスク強化学習として活用すると,共有と分離の緊張が生じる。
タスクは共通の移動ベースを使用するが、報酬の相反があるため、ポリシーは価値の干渉を避けながら行動を共有する必要がある。
以前は、モノリシックな政策は特殊化を犠牲にし、階層的なサブ政治は移行や見えない地形の一般化を犠牲にしていた。
CTS-MoEは、高密度な熟練アクターと知覚に基づくゲーティングを組み合わせることで、共有行動を構成する。
モデルは、部分的な可観測性を処理し、連続的な蒸留を避ける、単一ステージの同時教師/学生構成でエンドツーエンドにトレーニングされ、トレーニング時にのみ使用されるタスクラベルが使用される。
配置において、ルーティングは知覚にのみ依存し、高レベルなセレクタや地形分類器を使わずに地形適応を可能にする。
Unitree Go1のシミュレーションと、見知らぬ地形におけるハードウェアの実験は、トラッキングエラーが低く、モノリシックなベースラインよりも成功率が高い、タスク対応の特殊化を示している。
プロジェクトWebサイト: https://cts-moe.github.io/
関連論文リスト
- CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation [18.803751724563448]
地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoE分岐を導入し、このゲーティングネットワークは、構造された地形表現を学習するための対照的な目的で訓練される。
論文 参考訳(メタデータ) (2026-06-03T10:51:46Z) - CORAL: Scalable Multi-Task Robot Learning via LoRA Experts [49.759823970016974]
実世界のロボット工学におけるビジョン・ランゲージ・アクション(VLA)モデルは、コアマルチタスク学習の課題を露呈する。
タスク毎に個別の完全なチェックポイントを維持することは、しばしばストレージとデプロイメントの禁止である。
主にマルチタスク干渉を軽減するために設計されたバックボーンおよび非依存のフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2026-03-10T07:28:41Z) - MoTE: Mixture of Task-specific Experts for Pre-Trained ModelBased Class-incremental Learning [39.892628170627496]
クラスインクリメンタルラーニング(CIL)では、ストリーミングデータから新たな知識を継続的に取得するために、ディープラーニングモデルが必要である。
プロンプトベースのアプローチはプロンプトオーバーライトに悩まされ、アダプタベースの手法はタスク間の次元的ミスアライメントのような課題に直面している。
本稿では,不整合出力次元による誤判定を効果的に軽減するタスク特化専門家(MoTE)フレームワークの混合を提案する。
論文 参考訳(メタデータ) (2025-05-21T03:06:10Z) - Exploring Training on Heterogeneous Data with Mixture of Low-rank Adapters [36.09178055533487]
我々はMixture of Low-rank Adapters (MoLA)を活用し、異種データトレーニングにおける競合を軽減する。
MoLA-Grad と MoLA-SJ の2つの変種を導入し,目標認識シナリオと目標認識シナリオをそれぞれ扱う。
後者は、新しいTask-wise Decorrelation (TwD)を使用して、同種タスクへのアダプタの指向的な重み付けを学習するためにルータを介入する。
論文 参考訳(メタデータ) (2024-06-14T03:04:05Z) - HiVG: Hierarchical Multimodal Fine-grained Modulation for Visual Grounding [80.85164509232261]
HiVGは多層適応型クロスモーダルブリッジと階層型マルチモーダル低ランク適応(HiLoRA)パラダイムで構成されている。
HiLoRAは、階層的な方法で、クロスモーダルな特徴を浅い層から深い層に適応させることによって、知覚エラーの蓄積を防止する。
論文 参考訳(メタデータ) (2024-04-20T14:57:31Z) - Effective Adaptation in Multi-Task Co-Training for Unified Autonomous
Driving [103.745551954983]
本稿では,3つの下流タスクにおけるMoCoやSimCLRなど,多種多様な自己監督手法の転送性能について検討する。
彼らのパフォーマンスは、サブ最適か、あるいはシングルタスクベースラインよりもはるかに遅れていることに気付きました。
汎用マルチタスクトレーニングのための,単純かつ効果的な事前訓練-適応-ファインチューンパラダイムを提案する。
論文 参考訳(メタデータ) (2022-09-19T12:15:31Z) - Unpaired Referring Expression Grounding via Bidirectional Cross-Modal
Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。
本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。
私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文 参考訳(メタデータ) (2022-01-18T01:13:19Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。