論文の概要: MoMo: Conditioned Contrastive Representation Learning for Preference-Modulated Planning
- arxiv url: http://arxiv.org/abs/2605.08512v1
- Date: Fri, 08 May 2026 21:44:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.698738
- Title: MoMo: Conditioned Contrastive Representation Learning for Preference-Modulated Planning
- Title(参考訳): MoMo: 優先度変調計画のための条件付きコントラスト表現学習
- Authors: Yusuf Syed, Viraj Parimi, Brian Williams,
- Abstract要約: 優先条件付きコントラストプランナであるMoMoを紹介する。
MoMoは、表現幾何学と潜在予測演算子のジョイント条件付けを学習する。
6つの環境にわたって、MoMoはユーザの好みに応じて計画の安全性を円滑に調整し、状態拡張ベースラインに対する時間的および優先的な一貫性を向上させる。
- 参考スコア(独自算出の注目度): 1.7281573530896264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporally contrastive representation learning induces a latent structure capable of reducing long-horizon planning to inference in a low-dimensional linear system. However, existing contrastive planning work learns a single latent geometry which cannot distinguish multiple valid behaviors trading task efficiency against risk exposure for the same start-goal query. We introduce MoMo, a preference-conditioned contrastive planner allowing a scalar user preference to continuously modulate plan conservativeness at inference time, without retraining. MoMo learns a joint conditioning of the representation geometry and latent prediction operator via Feature-Wise Linear Modulation and low-rank neural modulation, respectively. We show that our formulation preserves the probability density ratio encoded in the representation space that is required for inference-driven contrastive planning, further retaining its inference-time efficiency. Across six environments, MoMo smoothly adapts plan safety according to user preferences, yielding improved temporal and preferential consistency over state augmentation baselines.
- Abstract(参考訳): 時間的に対照的な表現学習は、低次元線形系における推論に対する長期計画の削減が可能な潜在構造を誘導する。
しかし、既存のコントラストプランニング作業では、同一の開始ゴールクエリに対するリスク露光に対して、複数の有効なタスク効率を区別できない単一の潜時幾何学を学習する。
提案するMoMoは,スカラーユーザの好みを再現し,予測時に計画の保守性を継続的に調整するコントラストプランナである。
MoMoは, 特徴量線形変調と低ランクニューラル変調を用いて, 表現幾何学と潜時予測演算のジョイント条件付けを学習する。
この定式化は、推論駆動のコントラスト計画に必要な表現空間に符号化された確率密度比を保ち、さらに推論時間効率を保っていることを示す。
6つの環境にわたって、MoMoはユーザの好みに応じて計画の安全性を円滑に調整し、状態拡張ベースラインに対する時間的および優先的な一貫性を向上させる。
関連論文リスト
- Differentiable Object Pose Connectivity Metrics for Regrasp Sequence Optimization [13.078429762098631]
1つのピック・アンド・プレースで最初のポーズからゴールポーズへのオブジェクトの転送ができない場合、リグラス・プランニングがしばしば必要となる。
本稿では,異なるポーズシーケンス接続メトリクスに基づく暗黙的なマルチステップ・リグラス・プランニング・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-16T07:47:57Z) - Temporal Straightening for Latent Planning [58.131390107122456]
潜時計画のための表現学習を改善するために時間的ストレート化を導入する。
曲率の減少は、ラテント空間におけるユークリッド距離が測地線距離のより良いプロキシとなることを示す。
論文 参考訳(メタデータ) (2026-03-12T17:49:47Z) - Flexible Locomotion Learning with Diffusion Model Predictive Control [46.432397190673505]
本稿では,学習した生成拡散モデルを計画に先立って近似力学として活用する拡散MPCを提案する。
我々の設計では、テスト時適応性が強く、プランナーは、再訓練することなく、新しい報酬仕様に調整できる。
我々はDiffusion-MPCを実世界で検証し、強い移動と柔軟な適応を示す。
論文 参考訳(メタデータ) (2025-10-05T14:51:13Z) - Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.18608192761512]
自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文 参考訳(メタデータ) (2025-06-05T06:39:43Z) - Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。
行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。
シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文 参考訳(メタデータ) (2025-04-23T17:53:34Z) - Adaptive Planning with Generative Models under Uncertainty [20.922248169620783]
生成モデルによる計画は、幅広い領域にわたる効果的な意思決定パラダイムとして現れてきた。
最新の環境観測に基づいて決定を下すことができるため、各段階での継続的再計画は直感的に思えるかもしれないが、かなりの計算上の課題をもたらす。
本研究は,長軸状態軌跡を予測できる生成モデルの能力を活用する,シンプルな適応計画手法を導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2024-08-02T18:07:53Z) - SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation [11.011219709863875]
我々はSparseDriveという新しいエンドツーエンドの自動運転パラダイムを提案する。
SparseDriveは対称なスパース認識モジュールとパラレルモーションプランナーで構成されている。
動作予測と計画について,これら2つの課題の相似性を概観し,運動プランナの並列設計に繋がる。
論文 参考訳(メタデータ) (2024-05-30T02:13:56Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Visual Learning-based Planning for Continuous High-Dimensional POMDPs [81.16442127503517]
Visual Tree Search (VTS)は、オフラインで学習した生成モデルとオンラインモデルベースのPOMDP計画を組み合わせた学習と計画の手順である。
VTSは、モンテカルロの木探索プランナーにおける画像観測の可能性を予測し評価するために、一連の深部生成観測モデルを利用することで、オフラインモデルトレーニングとオンラインプランニングを橋渡しする。
VTSは、異なる観測ノイズに対して堅牢であり、オンラインのモデルベースプランニングを利用するため、再トレーニングを必要とせずに、異なる報酬構造に適応できることを示す。
論文 参考訳(メタデータ) (2021-12-17T11:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。