論文の概要: Trust Region Constrained Measure Transport in Path Space for Stochastic Optimal Control and Inference
- arxiv url: http://arxiv.org/abs/2508.12511v1
- Date: Sun, 17 Aug 2025 22:10:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.809422
- Title: Trust Region Constrained Measure Transport in Path Space for Stochastic Optimal Control and Inference
- Title(参考訳): 確率的最適制御と推論のための経路空間における信頼領域制約された交通量
- Authors: Denis Blessing, Julius Berner, Lorenz Richter, Carles Domingo-Enrich, Yuanqi Du, Arash Vahdat, Gerhard Neumann,
- Abstract要約: 信頼領域に基づく戦略は,対象尺度の先行から幾何的アニーリングと解釈できることを示す。
我々は,新しい手法が性能を大幅に向上させることができることを,複数の最適制御応用で実証した。
- 参考スコア(独自算出の注目度): 49.11857020431547
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solving stochastic optimal control problems with quadratic control costs can be viewed as approximating a target path space measure, e.g. via gradient-based optimization. In practice, however, this optimization is challenging in particular if the target measure differs substantially from the prior. In this work, we therefore approach the problem by iteratively solving constrained problems incorporating trust regions that aim for approaching the target measure gradually in a systematic way. It turns out that this trust region based strategy can be understood as a geometric annealing from the prior to the target measure, where, however, the incorporated trust regions lead to a principled and educated way of choosing the time steps in the annealing path. We demonstrate in multiple optimal control applications that our novel method can improve performance significantly, including tasks in diffusion-based sampling, transition path sampling, and fine-tuning of diffusion models.
- Abstract(参考訳): 確率論的最適制御問題を2次制御コストで解くことは、例えば勾配に基づく最適化を通じて、対象経路空間測度を近似すると見なすことができる。
しかし、実際にこの最適化は、特に目標測度が前と大きく異なる場合、難しい。
そこで本研究では,対象尺度に徐々にアプローチすることを目的とした信頼領域を取り入れた制約付き問題を,体系的な方法で反復的に解決することで,この問題にアプローチする。
この信頼領域に基づく戦略は,対象とする指標の先行から幾何学的アニーリングと解釈でき,そこでは,統合された信頼領域がアニーリングパスの時間ステップを選択する原則的かつ教育的な方法へと導かれる。
本稿では,拡散に基づくサンプリング,遷移経路サンプリング,拡散モデルの微調整などのタスクを含む,新しい手法が性能を大幅に向上できることを示す。
関連論文リスト
- Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。
特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文 参考訳(メタデータ) (2025-06-05T16:59:53Z) - Optimistic Algorithms for Adaptive Estimation of the Average Treatment Effect [36.25361703897723]
マルティンゲール理論の最近の進歩は、下流推論の力を高めるための適応的手法の道を開いた。
最適な因果推論手法を利用する適応的サンプリング手順について検討する。
本研究は,理論・実践における適応因果推論手法の進歩の歩みを示すものである。
論文 参考訳(メタデータ) (2025-02-07T05:39:32Z) - An Efficient On-Policy Deep Learning Framework for Stochastic Optimal Control [14.832859803172846]
本稿では、最適制御(SOC)問題を解決するための新しいオン政治アルゴリズムを提案する。
ギルサノフの定理を利用することで、微分方程式や随伴問題解による高価なバックプロパゲーションを伴わずに、SOC対象の政治的勾配を直接計算する。
実験により,従来の手法に比べて計算速度とメモリ効率が大幅に向上した。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.52124921268249]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。
本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。
2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文 参考訳(メタデータ) (2024-09-24T04:39:47Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Outlier-Robust Sparse Estimation via Non-Convex Optimization [73.18654719887205]
空間的制約が存在する場合の高次元統計量と非破壊的最適化の関連について検討する。
これらの問題に対する新規で簡単な最適化法を開発した。
結論として、効率よくステーションに収束する一階法は、これらのタスクに対して効率的なアルゴリズムを導出する。
論文 参考訳(メタデータ) (2021-09-23T17:38:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。