論文の概要: Generalization of Gibbs and Langevin Monte Carlo Algorithms in the Interpolation Regime
- arxiv url: http://arxiv.org/abs/2510.06028v1
- Date: Tue, 07 Oct 2025 15:25:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.313473
- Title: Generalization of Gibbs and Langevin Monte Carlo Algorithms in the Interpolation Regime
- Title(参考訳): 補間規則におけるギブズとランゲヴィンモンテカルロアルゴリズムの一般化
- Authors: Andreas Maurer, Erfan Mirzaei, Massimiliano Pontil,
- Abstract要約: 境界はランゲヴィン・モンテカルロアルゴリズムによる近似の下で安定である。
MNISTとCIFAR-10データセットの実験は、境界が真のラベル付きデータに非自明な予測をもたらすことを検証している。
- 参考スコア(独自算出の注目度): 25.99627853121106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper provides data-dependent bounds on the test error of the Gibbs algorithm in the overparameterized interpolation regime, where low training errors are also obtained for impossible data, such as random labels in classification. The bounds are stable under approximation with Langevin Monte Carlo algorithms. Experiments on the MNIST and CIFAR-10 datasets verify that the bounds yield nontrivial predictions on true labeled data and correctly upper bound the test error for random labels. Our method indicates that generalization in the low-temperature, interpolation regime is already signaled by small training errors in the more classical high temperature regime.
- Abstract(参考訳): 本論文は, ランダムラベルなどの不可能なデータに対して, 低トレーニング誤差が得られる過パラメータ補間方式において, ギブスアルゴリズムのテスト誤差に関するデータ依存境界を提供する。
境界はランゲヴィン・モンテカルロアルゴリズムによる近似の下で安定である。
MNISTとCIFAR-10データセットの実験は、境界が真のラベル付きデータに対して非自明な予測をもたらし、ランダムラベルに対するテストエラーを正しく上限にしていることを検証した。
本手法は, 低温補間法における一般化が, より古典的な高温法における小さな訓練誤差によってすでに示されていることを示唆している。
関連論文リスト
- When Langevin Monte Carlo Meets Randomization: Non-asymptotic Error Bounds beyond Log-Concavity and Gradient Lipschitzness [7.783499788849107]
ランダム化したランゲヴィンモンテカルロ (RLMC) を, 対数凹みのない高次元分布からサンプリングするために再検討する。
RLMCサンプリングアルゴリズムに対して,$mathcalW$-distance of order $O(sqrtdh)$の均一時間誤差を証明した。
改良されたRLMCアルゴリズムが提案され,非漸近誤差境界が確立された。
論文 参考訳(メタデータ) (2025-09-30T00:48:51Z) - Consistency of Learned Sparse Grid Quadrature Rules using NeuralODEs [1.3654846342364308]
本稿では,高次元分布の数値積分のためのスパースグリッドの整合性の証明を行う。
二次誤差と統計誤差の合計数値誤差の分解を行う。
論文 参考訳(メタデータ) (2025-07-02T09:37:16Z) - Maximum a Posteriori Inference for Factor Graphs via Benders' Decomposition [0.38233569758620056]
一般ベイズ因子モデルにおける最大a-ポストペリオーリ推定法を提案する。
ベイジアン・ガウス混合モデルと潜在ディリクレ割り当てに対するMAP推定アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-10-24T19:57:56Z) - General regularization in covariate shift adaptation [1.5469452301122175]
データ分布の違いを伴わない標準教師付き学習と同等の精度を達成するために必要なサンプルの量は、最先端の分析によって証明されたものよりも少ないことを示す。
論文 参考訳(メタデータ) (2023-07-21T11:19:00Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Information-Theoretic Generalization Bounds for Iterative
Semi-Supervised Learning [81.1071978288003]
特に,情報理論の原理を用いて,反復型SSLアルゴリズムのエミュレータ一般化誤差の振る舞いを理解することを目的とする。
我々の理論的結果は、クラス条件分散があまり大きくない場合、一般化誤差の上限は反復数とともに単調に減少するが、すぐに飽和することを示している。
論文 参考訳(メタデータ) (2021-10-03T05:38:49Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Matrix Completion with Quantified Uncertainty through Low Rank Gaussian
Copula [30.84155327760468]
本稿では,不確かさを定量化した値計算の欠如に対する枠組みを提案する。
モデルに適合するために必要な時間は、データセット内の行数や列数と線形にスケールする。
実験結果から,本手法は様々な種類のデータに対して最先端の計算精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-18T19:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。