論文の概要: CMP: Robust Whole-Body Tracking for Loco-Manipulation via Competence Manifold Projection
- arxiv url: http://arxiv.org/abs/2604.07457v1
- Date: Wed, 08 Apr 2026 18:00:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.489099
- Title: CMP: Robust Whole-Body Tracking for Loco-Manipulation via Competence Manifold Projection
- Title(参考訳): CMP:コンピテンスマニフォールド投影によるロコマニピュレーションのためのロバスト全体追跡
- Authors: Ziyang Cheng, Haoyu Wei, Hang Yin, Xiuwei Xu, Bingyao Yu, Jie Zhou, Jiwen Lu,
- Abstract要約: Manifold Competence Projectionは、アウト・オブ・ディストリビューションの摂動に対する堅牢性を改善する。
我々は、無限水平安全制約を計算効率の良い単段多様体包含に変換するフレーム-ワイズ安全スキームを用いる。
実験により、CMPは典型的なOODシナリオで最大10倍の生存率向上を達成することが示された。
- 参考スコア(独自算出の注目度): 64.65196237023754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While decoupled control schemes for legged mobile manipulators have shown robustness, learning holistic whole-body control policies for tracking global end-effector poses remains fragile against Out-of-Distribution (OOD) inputs induced by sensor noise or infeasible user commands. To improve robustness against these perturbations without sacrificing task performance and continuity, we propose Competence Manifold Projection (CMP). Specifically, we utilize a Frame-Wise Safety Scheme that transforms the infinite-horizon safety constraint into a computationally efficient single-step manifold inclusion. To instantiate this competence manifold, we employ a Lower-Bounded Safety Estimator that distinguishes unmastered intentions from the training distribution. We then introduce an Isomorphic Latent Space (ILS) that aligns manifold geometry with safety probability, enabling efficient O(1) seamless defense against arbitrary OOD intents. Experiments demonstrate that CMP achieves up to a 10-fold survival rate improvement in typical OOD scenarios where baselines suffer catastrophic failure, incurring under 10% tracking degradation. Notably, the system exhibits emergent ``best-effort'' generalization behaviors to progressively accomplish OOD goals by adhering to the competence boundaries. Result videos are available at: https://shepherd1226.github.io/CMP.
- Abstract(参考訳): 脚付き移動マニピュレータの分離制御スキームは堅牢性を示しているが、グローバルエンドエフェクタのポーズを追跡するための全体的全身制御ポリシーは、センサノイズやユーザコマンドによって誘導されるアウト・オブ・ディストリビューション(OOD)インプットに対して脆弱である。
タスク性能と連続性を犠牲にすることなく、これらの摂動に対する堅牢性を向上させるために、コンピテンス・マニフォールド・プロジェクション(CMP)を提案する。
具体的には、無限水平安全制約を計算効率の良い単段多様体包含に変換するフレーム-ワイズ安全スキームを利用する。
この能力多様体のインスタンス化には、未熟な意図とトレーニング分布を区別する低境界安全推定器を用いる。
次に、多様体幾何を安全確率と整列させ、任意の OOD 意図に対して効率的な O(1) をシームレスに防御する等方ラテント空間(ILS)を導入する。
実験により、ベースラインが破滅的な故障を被る典型的なOODシナリオにおいて、CMPは最大10倍の生存率向上を実現し、10%の追跡劣化が生じることが示された。
特に、このシステムは、能力境界に固執することによって、OOD目標を段階的に達成する「最善」な一般化行動を示す。
結果のビデオは、https://shepherd1226.github.io/CMP.comで公開されている。
関連論文リスト
- ADV-0: Closed-Loop Min-Max Adversarial Training for Long-Tail Robustness in Autonomous Driving [63.980630608984605]
本稿では、ゼロサムマルコフゲームとして、駆動ポリシー(ディフェンダー)と敵エージェント(アタックラー)の相互作用を扱うクローズドループのmin-max最適化フレームワークであるADV-0を提案する。
これを実現するため,我々は動的敵の進化を反復的な選好学習とし,この最適性を効率的に近似し,アルゴリズムに依存しない解をゲームに提供する。
実験により、多様な安全クリティカルな障害を効果的に露呈し、学習方針と運動プランナーの両方の一般化可能性を大幅に向上させることが示されている。
論文 参考訳(メタデータ) (2026-03-16T12:58:31Z) - Safety-critical Control Under Partial Observability: Reach-Avoid POMDP meets Belief Space Control [10.404992912881601]
POMDPは不確実性の下でのロボット意思決定の原則的枠組みを提供する。
既存のオンラインPOMDPソルバは、単一の信仰木探索内の3つすべてに対処しようとする。
本稿では,信念空間内で直接動作する階層型証明書ベースの制御アーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:25:41Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Self-Supervised Path Planning in Unstructured Environments via Global-Guided Differentiable Hard Constraint Projection [5.665217514922631]
本研究では,非構造化環境における自律ナビゲーションのためのディープラーニングエージェントをデプロイするための自己教師型フレームワークを提案する。
データ不足を軽減するため,手動ラベリングを使わずに高密度の監視信号を提供するG-APF(Global-Guided Artificial Potential Field)を構築した。
20,000のシナリオからなるテストセットのベンチマークでは、88.75%の成功率を示し、強化された運用安全性を実証している。
論文 参考訳(メタデータ) (2026-01-27T08:37:21Z) - UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models [67.91151588917396]
大規模言語モデル(LLM)は、幅広いタスクで顕著な進歩を遂げているが、有害なコンテンツ生成やジェイルブレイク攻撃といった安全リスクに弱いままである。
安全に配慮したリサイクルによるLCMの安全性向上のための統合フレームワークであるUpSafe$circ$Cを提案する。
この結果から, 静的アライメントから動的, モジュール, 推論対応制御への移行という, LLMの安全性の新たな方向性が明らかになった。
論文 参考訳(メタデータ) (2025-10-02T16:43:33Z) - Efficient Switchable Safety Control in LLMs via Magic-Token-Guided Co-Training [1.5349686675266894]
LLM(Large Language Models)におけるコンテンツ安全性の現在の手法は、マルチステージトレーニングパイプラインに依存している。
複数の安全性挙動を効率的に統合する統合協調学習フレームワークを提案する。
我々は,SFT+DPOの安全アライメント品質に一致し,安全性能においてDeepSeek-R1 (671B) を上回る8Bモデルを示した。
論文 参考訳(メタデータ) (2025-08-12T02:39:33Z) - Learning for Layered Safety-Critical Control with Predictive Control Barrier Functions [26.692688699287213]
制御障壁関数(CBF)を利用する安全フィルタは、複雑なシステム上での安全な動作を強制するのに非常に効果的である。
RoMとFoMのギャップは、安全違反を引き起こす可能性がある。
本稿では,FoMのロールアウトを活用して予測ロバスト性項を定義することで,このギャップに対処する固有CBFを提案する。
論文 参考訳(メタデータ) (2024-12-05T23:05:25Z) - BEEAR: Embedding-based Adversarial Removal of Safety Backdoors in Instruction-tuned Language Models [57.5404308854535]
大型言語モデル(LLM)における安全バックドア攻撃は、正常な相互作用中の検出を回避しながら、安全でない振る舞いをステルス的に引き起こすことができる。
モデル埋め込み空間において,バックドアトリガーが比較的均一なドリフトを引き起こすという知見を活かした緩和手法であるBEEARを提案する。
両レベル最適化手法は、不要な振る舞いを誘発する普遍的な埋め込み摂動を特定し、モデルパラメータを調整し、これらの摂動に対する安全な振舞いを強化する。
論文 参考訳(メタデータ) (2024-06-24T19:29:47Z) - Multi-Step Model Predictive Safety Filters: Reducing Chattering by
Increasing the Prediction Horizon [7.55113002732746]
安全フィルタを用いて学習制御ポリシを増強することにより、状態と入力制約の満足度を保証できる。
モデル予測安全フィルタ(MPSF)は、モデル予測制御(MPC)に基づく一般的な安全フィルタリング手法である。
論文 参考訳(メタデータ) (2023-09-20T16:35:29Z) - When Does Contrastive Learning Preserve Adversarial Robustness from
Pretraining to Finetuning? [99.4914671654374]
本稿では,新しい逆比較事前学習フレームワークAdvCLを提案する。
本稿では,AdvCLがモデル精度と微調整効率を損なうことなく,タスク間の堅牢性伝達性を向上できることを示す。
論文 参考訳(メタデータ) (2021-11-01T17:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。