論文の概要: Implicit Bias of the JKO Scheme
- arxiv url: http://arxiv.org/abs/2511.14827v1
- Date: Tue, 18 Nov 2025 18:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.487205
- Title: Implicit Bias of the JKO Scheme
- Title(参考訳): JKOスキーマの暗黙のバイアス
- Authors: Peter Halmos, Boris Hanin,
- Abstract要約: 簡単な数値例で,EmphJKO-Flow, Wasserstein 勾配流を$J$で研究する。
エンハンモディフィケーションエネルギー上のワッサーシュタイン勾配流により、$_k$を2ドルで注文できることが示される。
- 参考スコア(独自算出の注目度): 9.659199680879262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wasserstein gradient flow provides a general framework for minimizing an energy functional $J$ over the space of probability measures on a Riemannian manifold $(M,g)$. Its canonical time-discretization, the Jordan-Kinderlehrer-Otto (JKO) scheme, produces for any step size $η>0$ a sequence of probability distributions $ρ_k^η$ that approximate to first order in $η$ Wasserstein gradient flow on $J$. But the JKO scheme also has many other remarkable properties not shared by other first order integrators, e.g. it preserves energy dissipation and exhibits unconditional stability for $λ$-geodesically convex functionals $J$. To better understand the JKO scheme we characterize its implicit bias at second order in $η$. We show that $ρ_k^η$ are approximated to order $η^2$ by Wasserstein gradient flow on a \emph{modified} energy \[ J^η(ρ) = J(ρ) - \fracη{4}\int_M \Big\lVert \nabla_g \frac{δJ}{δρ} (ρ) \Big\rVert_{2}^{2} \,ρ(dx), \] obtained by subtracting from $J$ the squared metric curvature of $J$ times $η/4$. The JKO scheme therefore adds at second order in $η$ a \textit{deceleration} in directions where the metric curvature of $J$ is rapidly changing. This corresponds to canonical implicit biases for common functionals: for entropy the implicit bias is the Fisher information, for KL-divergence it is the Fisher-Hyv{ä}rinen divergence, and for Riemannian gradient descent it is the kinetic energy in the metric $g$. To understand the differences between minimizing $J$ and $J^η$ we study \emph{JKO-Flow}, Wasserstein gradient flow on $J^η$, in several simple numerical examples. These include exactly solvable Langevin dynamics on the Bures-Wasserstein space and Langevin sampling from a quartic potential in 1D.
- Abstract(参考訳): ワッサーシュタイン勾配フローはリーマン多様体上の確率測度空間上のエネルギー汎函数$J$を最小化するための一般的な枠組みを提供する。
標準時差分法であるJordan-Kinderlehrer-Otto (JKO) スキームは、任意のステップサイズ$η>0$で確率分布の列として$ρ_k^η$を、$J$上の$η$ワッサーシュタイン勾配フローにおいて1次に近似する。
しかし、JKOスキームは他の一階積分器で共有されない多くの顕著な性質を持ち、例えばエネルギーの散逸を保ち、$λ$-測地的凸汎函数$J$に対して無条件の安定性を示す。
JKOスキームをよりよく理解するために、2階目の暗黙バイアスを$η$で特徴づける。
J^η(ρ) = J(ρ) - \fracη{4}\int_M \Big\lVert \nabla_g \frac{δJ}{δρ} (ρ) \Big\rVert_{2}^{2} \,ρ(dx), \] は、$J$の2乗計量曲率を$J$×$η/4$とする。
したがって、JKOスキームは$η$ a \textit{deceleration} において、$J$の計量曲率が急速に変化している方向に二階加算する。
エントロピーの場合、暗黙のバイアスはフィッシャー情報であり、KL-偏移はフィッシャー-Hyv{ä}rinen発散であり、リーマン勾配勾配は計量$g$の運動エネルギーである。
J$ と $J^η$ の差を理解するために、いくつかの単純な数値例で、$J^η$ 上のワッサーシュタイン勾配流について研究する。
これらには、ブレス=ヴァッサーシュタイン空間上の正確に解けるランゲヴィンのダイナミクスや、1Dのクォートポテンシャルからのランゲヴィンのサンプリングが含まれる。
関連論文リスト
- Wigner quasi-probability distribution for symmetric multi-quDit systems and their generalized heat kernel [0.0]
我々はSchr"odinger $U(D)$-spin cat状態の位相空間構造を解析した。
準確率分布である $mathcalF(s)_rho$ と $mathcalF(s')_rho$ に関する一般化熱核を計算する。
論文 参考訳(メタデータ) (2025-07-20T08:26:28Z) - Proving the Limited Scalability of Centralized Distributed Optimization via a New Lower Bound Construction [57.93371273485736]
我々は、すべての労働者が同一の分布にアクセスする均質な(すなわちd.d.)場合であっても、すべての労働者が非バイアス付き境界 LDeltaepsilon2,$$$$$ のポリ対数的により良いポリ対数を求める集中型分散学習環境を考える。
論文 参考訳(メタデータ) (2025-06-30T13:27:39Z) - Improved Finite-Particle Convergence Rates for Stein Variational Gradient Descent [14.890609936348277]
我々は、Kernelized Stein Discrepancy (mathsfKSD$) と Wasserstein-2 メトリクスにおいて、スタイン変分勾配Descentアルゴリズムに対して有限粒子収束率を提供する。
我々の重要な洞察は、N$粒子位置の接合密度の間の相対エントロピーの時間微分が、期待される$mathsfKSD2$のN$倍とより小さな正の値に比例して支配的な負の部分に分裂するということである。
論文 参考訳(メタデータ) (2024-09-13T01:49:19Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Measurement-induced phase transition for free fermions above one dimension [46.176861415532095]
自由フェルミオンモデルに対する$d>1$次元における測定誘起エンタングルメント相転移の理論を開発した。
臨界点は、粒子数と絡み合いエントロピーの第2累積のスケーリング$$elld-1 ln ell$でギャップのない位相を分離する。
論文 参考訳(メタデータ) (2023-09-21T18:11:04Z) - Projected Langevin dynamics and a gradient flow for entropic optimal
transport [0.8057006406834466]
エントロピー規則化された最適輸送からサンプリングした類似拡散力学を導入する。
部分多様体 $Pi(mu,nu)$ の誘導されたワッサーシュタイン幾何学の研究により、SDE はこの結合空間上のワッサーシュタイン勾配フローとみなすことができると論じる。
論文 参考訳(メタデータ) (2023-09-15T17:55:56Z) - ReSQueing Parallel and Private Stochastic Convex Optimization [59.53297063174519]
本稿では,BFG凸最適化(SCO: Reweighted Query (ReSQue) 推定ツールを提案する。
我々はSCOの並列およびプライベート設定における最先端の複雑さを実現するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-01-01T18:51:29Z) - Learning Green's functions associated with parabolic partial
differential equations [1.5293427903448025]
関連するグリーン函数を学習するための理論的に厳密な最初のスキームを導出する。
我々はベベンドルフとハッカブッシュの低ランク理論を、任意の次元における1leq nleq 3$次元の楕円 PDE から放物的 PDE へと拡張する。
論文 参考訳(メタデータ) (2022-04-27T09:23:39Z) - Data-driven Efficient Solvers for Langevin Dynamics on Manifold in High
Dimensions [12.005576001523515]
多様体構造を持つ物理系のランゲヴィン力学を$mathcalMsubsetmathbbRp$で研究する。
我々は、多様体 $mathcalN$ 上の対応するフォッカー・プランク方程式を、反応座標 $mathsfy$ の観点から活用する。
このFokker-Planck方程式に対して、実装可能で、無条件で安定な、データ駆動有限体積スキームを提案する。
論文 参考訳(メタデータ) (2020-05-22T16:55:38Z) - Curse of Dimensionality on Randomized Smoothing for Certifiable
Robustness [151.67113334248464]
我々は、他の攻撃モデルに対してスムースな手法を拡張することは困難であることを示す。
我々はCIFARに関する実験結果を示し,その理論を検証した。
論文 参考訳(メタデータ) (2020-02-08T22:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。