論文の概要: Schr\"odinger Bridge Samplers
- arxiv url: http://arxiv.org/abs/1912.13170v1
- Date: Tue, 31 Dec 2019 04:49:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 21:09:59.645979
- Title: Schr\"odinger Bridge Samplers
- Title(参考訳): Schr\\odinger Bridge サンプリング
- Authors: Espen Bernton, Jeremy Heng, Arnaud Doucet, Pierre E. Jacob
- Abstract要約: 我々は、ターゲット分布を$mathbbRd$の$pi$で近似するために、Schr"odinger bridge samplersと呼ばれる新しいモンテカルロスキームを開発する。
これは、参照マルコフ連鎖の遷移カーネルを反復的に修正して、T$の限界分布が$pi_T = pi$に近づくプロセスを得る。
- 参考スコア(独自算出の注目度): 22.917747907170554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a reference Markov process with initial distribution $\pi_{0}$ and
transition kernels $\{M_{t}\}_{t\in[1:T]}$, for some $T\in\mathbb{N}$. Assume
that you are given distribution $\pi_{T}$, which is not equal to the marginal
distribution of the reference process at time $T$. In this scenario,
Schr\"odinger addressed the problem of identifying the Markov process with
initial distribution $\pi_{0}$ and terminal distribution equal to $\pi_{T}$
which is the closest to the reference process in terms of Kullback--Leibler
divergence. This special case of the so-called Schr\"odinger bridge problem can
be solved using iterative proportional fitting, also known as the Sinkhorn
algorithm. We leverage these ideas to develop novel Monte Carlo schemes, termed
Schr\"odinger bridge samplers, to approximate a target distribution $\pi$ on
$\mathbb{R}^{d}$ and to estimate its normalizing constant. This is achieved by
iteratively modifying the transition kernels of the reference Markov chain to
obtain a process whose marginal distribution at time $T$ becomes closer to
$\pi_T = \pi$, via regression-based approximations of the corresponding
iterative proportional fitting recursion. We report preliminary experiments and
make connections with other problems arising in the optimal transport, optimal
control and physics literatures.
- Abstract(参考訳): 初期分布 $\pi_{0}$ と遷移カーネル $\{M_{t}\}_{t\in[1:T]}$, for some $T\in\mathbb{N}$ の参照マルコフ過程を考える。
分布 $\pi_{T}$ が与えられると仮定すると、これは時の参照プロセスの限界分布に等しいものではない。
このシナリオでは、schr\"odinger は初期分布 $\pi_{0}$ と端末分布が $\pi_{t}$ に等しいマルコフ過程を特定する問題に対処した。
いわゆるSchr\"odinger bridge problemのこの特殊なケースは、反復比例フィッティング(シンクホーンアルゴリズム)を用いて解決することができる。
これらのアイデアを活用して、新しいモンテカルロスキーム(Schr\"odinger bridge samplers)を開発し、ターゲット分布 $\pi$ on $\mathbb{R}^{d}$ を近似し、正規化定数を推定する。
これは、参照マルコフ連鎖の遷移核を反復的に修正して、対応する反復比例フィッティング再帰の回帰に基づく近似により、T$の限界分布が$\pi_T = \pi$に近づく過程を得る。
予備実験を報告し, 最適輸送, 最適制御, 物理文献に生じる他の問題と接続する。
関連論文リスト
- Upper Bounds for Learning in Reproducing Kernel Hilbert Spaces for Orbits of an Iterated Function System [1.1510009152620668]
学習理論における重要な問題は、ある入力$x$と対応する出力$y$の関係を近似した関数$f$を計算することである。
この近似はサンプル点 $(x_t,y_t)_t=1m$ に基づいている。
論文 参考訳(メタデータ) (2024-10-10T20:34:22Z) - Theoretical guarantees in KL for Diffusion Flow Matching [9.618473763561418]
Flow Matching (FM) は、ターゲット分布 $nustar$ を補助分布 $mu$ で有限時間にブリッジすることを目的としている。
ブラウン運動に付随する条件分布を橋渡しする拡散フローマッチング(DFM)モデルの非漸近保証を得る。
論文 参考訳(メタデータ) (2024-09-12T15:19:00Z) - Provably learning a multi-head attention layer [55.2904547651831]
マルチヘッドアテンション層は、従来のフィードフォワードモデルとは分離したトランスフォーマーアーキテクチャの重要な構成要素の1つである。
本研究では,ランダムな例から多面的注意層を実証的に学習する研究を開始する。
最悪の場合、$m$に対する指数的依存は避けられないことを示す。
論文 参考訳(メタデータ) (2024-02-06T15:39:09Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Generalized Regret Analysis of Thompson Sampling using Fractional
Posteriors [12.43000662545423]
トンプソンサンプリング(Thompson sample, TS)は、マルチアームバンディット問題を解くアルゴリズムの1つである。
TSの変種である$alpha$-TSを考え、標準的な後続分布の代わりに$alpha$-posteriorまたは$alpha$-posteriorを使用する。
論文 参考訳(メタデータ) (2023-09-12T16:15:33Z) - Convergence of a Normal Map-based Prox-SGD Method under the KL
Inequality [0.0]
我々は、$symbol$k$収束問題に対して、新しいマップベースのアルゴリズム(mathsfnorMtext-mathsfSGD$)を提案する。
論文 参考訳(メタデータ) (2023-05-10T01:12:11Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Random quantum circuits transform local noise into global white noise [118.18170052022323]
低忠実度状態におけるノイズランダム量子回路の測定結果の分布について検討する。
十分に弱くユニタリな局所雑音に対して、一般的なノイズ回路インスタンスの出力分布$p_textnoisy$間の相関(線形クロスエントロピーベンチマークで測定)は指数関数的に減少する。
ノイズが不整合であれば、出力分布は、正確に同じ速度で均一分布の$p_textunif$に近づく。
論文 参考訳(メタデータ) (2021-11-29T19:26:28Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。