論文の概要: Sampling-Based Control via Entropy-Regularized Optimal Transport
- arxiv url: http://arxiv.org/abs/2605.02147v1
- Date: Mon, 04 May 2026 02:07:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.105091
- Title: Sampling-Based Control via Entropy-Regularized Optimal Transport
- Title(参考訳): エントロピー規則化最適輸送によるサンプリングベース制御
- Authors: Vincent Pacelli, Akash Ratheesh, Evangelos A. Theodorou,
- Abstract要約: OT-MPCは、エントロピー規則化された最適輸送定式化によって制限を克服するサンプリングベースのアルゴリズムである。
我々は、Sinkhornアルゴリズムを用いて、クローズドな勾配のない更新を導出し、リアルタイムな性能を実現する。
- 参考スコア(独自算出の注目度): 18.278741443124655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sampling-based model predictive control methods like MPPI and CEM are essential for real-time control of nonlinear robotic systems, particularly where discontinuous dynamics preclude gradient-based optimization. However, these methods derive from information-theoretic objectives that are agnostic to the geometry of the control problem, leading to pathological behaviors such as mode-averaging when the cost landscape is complex. We present OT-MPC, a sampling-based algorithm that overcomes these limitations through an entropy-regularized optimal transport formulation. By computing an optimal coupling between candidate control sequences and low-cost proposals, OT-MPC refines candidates toward nearby promising samples while coordinating updates across the ensemble to maintain coverage of the solution space. We derive closed-form, gradient-free updates via the Sinkhorn algorithm, enabling real-time performance. Experiments on navigation, manipulation, and locomotion tasks demonstrate improved success rates over existing methods.
- Abstract(参考訳): 非線形ロボットシステムのリアルタイム制御には,MPPIやCEMのようなサンプリングベースモデル予測制御法が不可欠である。
しかし、これらの手法は制御問題の幾何学に非依存な情報理論的目的から派生し、コストランドスケープが複雑である場合のモデラーイングのような病理的挙動をもたらす。
本稿では、この制限をエントロピー規則化された最適輸送定式化によって克服するサンプリングベースアルゴリズムOT-MPCを提案する。
OT-MPCは、候補制御シーケンスと低コストの提案との最適結合を計算することにより、候補を近くの有望なサンプルに向けて洗練し、アンサンブル全体の更新を調整し、ソリューション空間のカバレッジを維持する。
我々は、Sinkhornアルゴリズムを用いて、クローズドな勾配のない更新を導出し、リアルタイムな性能を実現する。
ナビゲーション、操作、移動タスクの実験は、既存の方法よりも成功率が改善されたことを示している。
関連論文リスト
- Adaptive Tensor Network Sampling for Quantum Optimal Control [0.0]
量子最適制御(QOC)は、単一量子システムにおける高忠実度演算を実現するためのフレームワークを提供する。
2つのカテゴリ: 勾配のない製品サンプリングアルゴリズム、a自由勾配状態/テンスペア(MPS/TT)を導入する。
提案手法では, 離散制御パラメータの空間上のスコア関数を定義し, サンプリング分布候補制御列を誘導する。
論文 参考訳(メタデータ) (2026-04-27T13:36:00Z) - Deep Learning-Accelerated Surrogate Optimization for High-Dimensional Well Control in Stress-Sensitive Reservoirs [0.0]
応力に敏感な非伝統的な貯水池における生産最適化は, 圧力駆動流と破壊導電率低下とマトリックス透水率の非線形トレードオフによって制御される。
本研究では,高次元ウェルコントロールのためのディープラーニングに基づくサロゲート最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-01T01:04:08Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - An Efficient On-Policy Deep Learning Framework for Stochastic Optimal Control [14.832859803172846]
本稿では、最適制御(SOC)問題を解決するための新しいオン政治アルゴリズムを提案する。
ギルサノフの定理を利用することで、微分方程式や随伴問題解による高価なバックプロパゲーションを伴わずに、SOC対象の政治的勾配を直接計算する。
実験により,従来の手法に比べて計算速度とメモリ効率が大幅に向上した。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Introduction to Online Control [31.67032731719622]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文 参考訳(メタデータ) (2022-11-17T16:12:45Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Stochastic Finite State Control of POMDPs with LTL Specifications [14.163899014007647]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下での自律的な意思決定のためのモデリングフレームワークを提供する。
本稿では,POMDPに対する準最適有限状態制御器(sFSC)の合成に関する定量的問題について考察する。
本稿では,sFSC サイズが制御される有界ポリシアルゴリズムと,連続的な繰り返しにより制御器の性能が向上する任意の時間アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T18:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。