論文の概要: Schrödinger bridge for generative AI: Soft-constrained formulation and convergence analysis
- arxiv url: http://arxiv.org/abs/2510.11829v1
- Date: Mon, 13 Oct 2025 18:29:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.060467
- Title: Schrödinger bridge for generative AI: Soft-constrained formulation and convergence analysis
- Title(参考訳): 生成AIのためのシュレーディンガーブリッジ:ソフト制約による定式化と収束解析
- Authors: Jin Ma, Ying Tan, Renyuan Xu,
- Abstract要約: いわゆるソフト拘束型シュリンガー橋問題(SCSBP)について検討する。
ペナルティが大きくなるにつれて、制御関数と値関数の両方が線形速度で古典的SBPのものと収束することが証明される。
これらの結果から,ソフト拘束ブリッジの定量的収束保証が得られた。
- 参考スコア(独自算出の注目度): 6.584866740785309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI can be framed as the problem of learning a model that maps simple reference measures into complex data distributions, and it has recently found a strong connection to the classical theory of the Schr\"odinger bridge problems (SBPs) due partly to their common nature of interpolating between prescribed marginals via entropy-regularized stochastic dynamics. However, the classical SBP enforces hard terminal constraints, which often leads to instability in practical implementations, especially in high-dimensional or data-scarce regimes. To address this challenge, we follow the idea of the so-called soft-constrained Schr\"odinger bridge problem (SCSBP), in which the terminal constraint is replaced by a general penalty function. This relaxation leads to a more flexible stochastic control formulation of McKean-Vlasov type. We establish the existence of optimal solutions for all penalty levels and prove that, as the penalty grows, both the controls and value functions converge to those of the classical SBP at a linear rate. Our analysis builds on Doob's h-transform representations, the stability results of Schr\"odinger potentials, Gamma-convergence, and a novel fixed-point argument that couples an optimization problem over the space of measures with an auxiliary entropic optimal transport problem. These results not only provide the first quantitative convergence guarantees for soft-constrained bridges but also shed light on how penalty regularization enables robust generative modeling, fine-tuning, and transfer learning.
- Abstract(参考訳): 生成的AIは、単純な参照測度を複雑なデータ分布にマッピングするモデルを学ぶ問題であり、最近、エントロピー規則化された確率力学を通して所定の辺縁間を補間するという共通の性質から、シュリンガー橋問題(SBP)の古典理論と強い関連性を見出した。
しかし、古典的なSBPはハードターミナルの制約を強制し、特に高次元またはデータスカースなシステムにおいて、実践的な実装では不安定になることが多い。
この課題に対処するために、終端制約を一般ペナルティ関数に置き換えるいわゆる「ソフト制約型シュリンガーブリッジ問題 (SCSBP) の考え方に従う。
この緩和により、マッキーン・ブラソフ型のより柔軟な確率制御が定式化される。
すべてのペナルティレベルの最適解の存在を確立し、ペナルティが大きくなるにつれて、制御と値関数の両方が古典的なSBPのものと線形速度で収束することを証明する。
我々の分析は、ドオブのh-変換表現、シュリンガーポテンシャルの安定性結果、ガンマ収束、および補助エントロピー的最適輸送問題を伴う測度空間上の最適化問題を結合する新しい固定点論に基づく。
これらの結果は, ソフト拘束ブリッジの定量的収束保証を提供するだけでなく, ペナルティ正規化によって, 堅牢な生成モデル, 微調整, 伝達学習が可能になることを示唆している。
関連論文リスト
- Conditionally adaptive augmented Lagrangian method for physics-informed learning of forward and inverse problems using artificial neural networks [0.24578723416255746]
本稿では,物理・等式制約付きニューラルネットワーク(PECANN)フレームワークについて述べる。
拡張ラグランジアン法(ALM)を一般化し、複数の独立ペナルティパラメータをサポートする。
我々は、制約項に対する期待として、ポイントワイズ制約強制とラグランジュ乗算を再構成する。
論文 参考訳(メタデータ) (2025-08-21T16:22:40Z) - Nonconvex Optimization Framework for Group-Sparse Feedback Linear-Quadratic Optimal Control: Non-Penalty Approach [3.585860184121598]
固定通信(DFT-LQ)を用いた分散線形四元数問題と下位次次次フィードバック問題について検討した。
論文 参考訳(メタデータ) (2025-07-26T09:50:21Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - On the Contraction Coefficient of the Schr\"odinger Bridge for
Stochastic Linear Systems [15.022863946000495]
シュリンガー橋の問題を数値的に解く一般的な方法は、契約的不動点再帰(英語版)である。
それぞれのシュリンガー系の収束に伴う収縮係数の事前推定について検討する。
論文 参考訳(メタデータ) (2023-09-12T22:24:05Z) - A Variational Inference Approach to Inverse Problems with Gamma
Hyperpriors [60.489902135153415]
本稿では,ガンマハイパープライヤを用いた階層的逆問題に対する変分反復交替方式を提案する。
提案した変分推論手法は正確な再構成を行い、意味のある不確実な定量化を提供し、実装が容易である。
論文 参考訳(メタデータ) (2021-11-26T06:33:29Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。