論文の概要: A Theoretical Comparison of No-U-Turn Sampler Variants: Necessary and Su?cient Convergence Conditions and Mixing Time Analysis under Gaussian Targets
- arxiv url: http://arxiv.org/abs/2603.18640v1
- Date: Thu, 19 Mar 2026 09:03:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.049144
- Title: A Theoretical Comparison of No-U-Turn Sampler Variants: Necessary and Su?cient Convergence Conditions and Mixing Time Analysis under Gaussian Targets
- Title(参考訳): 非U-Turn型サンプリング変数の理論的比較--ガウス目標下における必要・過渡的収束条件と混合時間解析-
- Authors: Samuel Gruffaz, Kyurae Kim, Fares Guehtar, Hadrien Duval-decaix, Pacôme Trautmann,
- Abstract要約: NUTS-mul と NUTS-BPS はほぼ同一の定性的挙動を示し,その幾何学的エルゴード性は分布の尾の性質に依存することを示した。
より正確には、標準ガウス測度の典型的な集合において、NUTS-mul と NUTS-BPS の混合時間は$O(d1/4)$ 対数因子までスケールし、$d$ は次元を表す。
- 参考スコア(独自算出の注目度): 6.1221185388686115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The No-U-Turn Sampler (NUTS) is the computational workhorse of modern Bayesian software libraries, yet its qualitative and quantitative convergence guarantees were established only recently. A significant gap remains in the theoretical comparison of its two main variants: NUTS-mul and NUTS-BPS, which use multinomial sampling and biased progressive sampling, respectively, for index selection. In this paper, we address this gap in three contributions. First, we derive the first necessary conditions for geometric ergodicity for both variants. Second, we establish the first sufficient conditions for geometric ergodicity and ergodicity for NUTS-mul. Third, we obtain the first mixing time result for NUTS-BPS on a standard Gaussian distribution. Our results show that NUTS-mul and NUTS-BPS exhibit nearly identical qualitative behavior, with geometric ergodicity depending on the tail properties of the target distribution. However, they differ quantitatively in their convergence rates. More precisely, when initialized in the typical set of the canonical Gaussian measure, the mixing times of both NUTS-mul and NUTS-BPS scale as $O(d^{1/4})$ up to logarithmic factors, where $d$ denotes the dimension. Nevertheless, the associated constants are strictly smaller for NUTS-BPS.
- Abstract(参考訳): No-U-Turn Sampler (NUTS) は現代のベイズソフトウェアライブラリの計算作業であるが、その定性的かつ定量的収束保証が最近確立された。
主要な2つの変種であるNUTS-mulとNUTS-BPSは、それぞれ指数選択に多項サンプリングと偏差プログレッシブサンプリングを用いる。
本稿では,このギャップを3つのコントリビューションで解決する。
まず、両変種に対する幾何学的エルゴディニティのための最初の必要条件を導出する。
第2に、NUTS-mulの幾何学的エルゴディディティとエルゴディディティのための最初の十分な条件を確立する。
第3に、標準ガウス分布におけるNUTS-BPSの最初の混合時間結果を得る。
その結果,NUTS-mul と NUTS-BPS はほぼ同一の定性的挙動を示すことが明らかとなった。
しかし、それらの収束速度は定量的に異なる。
より正確には、標準ガウス測度の典型的な集合で初期化されるとき、NUTS-mul と NUTS-BPS の混合時間は$O(d^{1/4})$ で、$d$ は次元を表す対数因子である。
それでも、関連する定数はNUTS-BPSでは厳密に小さい。
関連論文リスト
- Unregularized Linear Convergence in Zero-Sum Game from Preference Feedback [50.89125374999765]
NLHFにおける最適乗算重み更新(mathtOMWU$)に対する最初の収束保証を提供する。
本分析では, 稀に発生する行動の確率が指数関数的に小さい値から指数関数的に増大する新たな限界収束挙動を同定する。
論文 参考訳(メタデータ) (2025-12-31T12:08:29Z) - Optimal High-probability Convergence of Nonlinear SGD under Heavy-tailed Noise via Symmetrization [50.49466204159458]
雑音対称性に基づく2つの新しい推定器を提案する。
よりシャープな分析と改善されたレートを提供します。
モーメントと対称雑音を仮定する作業と比較して、よりシャープな解析と改善率を提供する。
論文 参考訳(メタデータ) (2025-07-12T00:31:13Z) - Instance-dependent Convergence Theory for Diffusion Models [7.237817437521988]
我々は、異なる対象分布の滑らかさに適応する収束率を開発し、これをインスタンス依存境界と呼ぶ。
さらに、$L$は緩和されたリプシッツ定数を表し、ガウス混合モデルの場合、成分の数と対数的にしかスケールしない。
論文 参考訳(メタデータ) (2024-10-17T16:37:33Z) - Bayesian Circular Regression with von Mises Quasi-Processes [57.88921637944379]
本研究では、円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
後部推論のために,高速ギブズサンプリングに寄与するストラトノビッチ様拡張法を導入する。
本研究では,このモデルを用いて風向予測と走行歩行周期のパーセンテージを関節角度の関数として適用する実験を行った。
論文 参考訳(メタデータ) (2024-06-19T01:57:21Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - A High-dimensional Convergence Theorem for U-statistics with
Applications to Kernel-based Testing [3.469038201881982]
次数2のU-統計量に対して収束定理を証明し、データ次元$d$はサンプルサイズ$n$でスケールすることができる。
我々はこの理論を、高次元性能の研究が困難である2つのカーネルベースの分散テスト MMD と KSD に適用した。
論文 参考訳(メタデータ) (2023-02-11T12:49:46Z) - Mean-Square Analysis with An Application to Optimal Dimension Dependence
of Langevin Monte Carlo [60.785586069299356]
この研究は、2-ワッサーシュタイン距離におけるサンプリング誤差の非同相解析のための一般的な枠組みを提供する。
我々の理論解析は数値実験によってさらに検証される。
論文 参考訳(メタデータ) (2021-09-08T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。