Fugu-MT 論文翻訳(概要): PAC-Chernoff Bounds: Understanding Generalization in the Interpolation Regime

論文の概要: PAC-Chernoff Bounds: Understanding Generalization in the Interpolation Regime

arxiv url: http://arxiv.org/abs/2306.10947v3
Date: Mon, 29 Apr 2024 08:47:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-01 01:24:18.963915
Title: PAC-Chernoff Bounds: Understanding Generalization in the Interpolation Regime
Title（参考訳）: PAC-Chernoff境界:補間規則の一般化を理解する
Authors: Andrés R. Masegosa, Luis A. Ortega,
Abstract要約: 本稿では,補間器の完全密度を示す分布依存型PAC-Chernoff境界を提案する。我々は、ある補間子がなぜ例外的な一般化を示すのかを示す統一的な理論的枠組みを提示する。
参考スコア（独自算出の注目度）: 6.645111950779666
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This paper introduces a distribution-dependent PAC-Chernoff bound that exhibits perfect tightness for interpolators, even within over-parameterized model classes. This bound, which relies on basic principles of Large Deviation Theory, defines a natural measure of the smoothness of a model, characterized by simple real-valued functions. Building upon this bound and the new concept of smoothness, we present an unified theoretical framework revealing why certain interpolators show an exceptional generalization, while others falter. We theoretically show how a wide spectrum of modern learning methodologies, encompassing techniques such as $\ell_2$-norm, distance-from-initialization and input-gradient regularization, in combination with data augmentation, invariant architectures, and over-parameterization, collectively guide the optimizer toward smoother interpolators, which, according to our theoretical framework, are the ones exhibiting superior generalization performance. This study shows that distribution-dependent bounds serve as a powerful tool to understand the complex dynamics behind the generalization capabilities of over-parameterized interpolators.
Abstract（参考訳）: 本稿では,超パラメータモデルクラスにおいても,補間器の完全密度を示す分布依存型PAC-Chernoffバウンダリを提案する。この境界は、大偏差理論の基本原理に依存し、単純な実数値関数によって特徴づけられるモデルの滑らかさの自然な測度を定義する。この境界と滑らか性という新たな概念に基づいて、ある補間子が例外的な一般化を示すのに対して、ある補間者が極端に一般化を示す理由を明らかにする統一的な理論的枠組みを提示する。理論的には、データ拡張、不変アーキテクチャ、過パラメータ化と組み合わせて、$\ell_2$-norm, distance-from-initialization, input-gradient regularizationなどの手法を包含した、現代的な学習手法の幅広いスペクトルが、よりスムーズな補間器へと導かれ、より優れた一般化性能を示すものであることを示す。本研究では、分布依存境界が、過パラメータ化補間器の一般化能力の背後にある複雑な力学を理解する強力なツールであることを示す。

関連論文リスト

Towards A Unified PAC-Bayesian Framework for Norm-based Generalization Bounds [63.47271262149291]
PAC-Bayesianノルムに基づく一般化のための統一的なフレームワークを提案する。提案手法の鍵となるのは、構造的重み摂動に関してネットワーク出力を定量化する感度行列である。我々は、いくつかの既存のPAC-ベイジアン結果を特殊ケースとして回復する一般化境界の族を導出する。
論文参考訳（メタデータ） (2026-01-13T00:42:22Z)
Random-Matrix-Induced Simplicity Bias in Over-parameterized Variational Quantum Circuits [72.0643009153473]
本稿では,観測可能な期待値とパラメータ勾配の両方がシステムサイズに指数関数的に集中するHaar型普遍性クラスに,表現的変分アンサーゼが入ることを示す。その結果、そのような回路によって誘導される仮説クラスは、近点関数の狭い族に高い確率で崩壊する。テンソル-ネットワークベースおよびテンソル-ハイパーネットワークパラメータ化を含むテンソル構造VQCは、ハール型普遍性クラスの外にある。
論文参考訳（メタデータ） (2026-01-05T08:04:33Z)
A General Weighting Theory for Ensemble Learning: Beyond Variance Reduction via Spectral and Geometric Structure [0.0]
本稿では,アンサンブル学習のための一般的な重み付け理論を開発する。我々は、仮説空間に作用する線型作用素としてアンサンブルを定式化する。非一様構造重みが平均値よりも優れていることを示す。
論文参考訳（メタデータ） (2025-12-25T08:51:01Z)
Loss-Complexity Landscape and Model Structure Functions [56.01537787608726]
我々はコルモゴロフ構造関数 $h_x(alpha)$ を双対化するためのフレームワークを開発する。情報理論構造と統計力学の数学的類似性を確立する。構造関数と自由エネルギーの間のルジャンドル・フェンシェル双対性を明確に証明する。
論文参考訳（メタデータ） (2025-07-17T21:31:45Z)
Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。本研究では,時間領域毎に最適な因果予測値が得られることを示す。合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文参考訳（メタデータ） (2025-06-21T14:05:37Z)
Theoretical Foundations of the Deep Copula Classifier: A Generative Approach to Modeling Dependent Features [0.0]
ディープコピュラ(Deep Copula、DCC)は、各特徴の辺縁分布の学習を、その結合依存構造をモデル化することから分離する生成モデルである。軽量ニューラルネットワークは、機能相互作用を柔軟かつ適応的にキャプチャするために使用される。 DCCは依存性を意識した分類のための数学的基盤と解釈可能なフレームワークを提供する。
論文参考訳（メタデータ） (2025-05-29T02:07:26Z)
Continuous Domain Generalization [20.41728538658197]
本稿では,予測モデルを未確認領域に一般化することを目的とした連続領域一般化(CDG)の課題を紹介する。幾何学的および代数的理論に基礎を置き、領域をまたいだ最適モデルパラメータが低次元多様体上に存在することを示す。リモートセンシング, 科学文書, 交通予報などの合成および実世界のデータセットを用いた実験により, 本手法は, 記述不完全条件下での一般化精度と堅牢性において, 既存のベースラインを著しく上回っていることがわかった。
論文参考訳（メタデータ） (2025-05-17T12:39:45Z)
Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文参考訳（メタデータ） (2024-07-24T12:00:30Z)
Topological Generalization Bounds for Discrete-Time Stochastic Optimization Algorithms [15.473123662393169]
ディープニューラルネットワーク(DNN)は、顕著な一般化特性を示す。これらの能力の源泉は依然として解明され、確立された統計的学習理論を否定している。近年の研究では、訓練軌跡の性質が一般化の指標であることが示されている。
論文参考訳（メタデータ） (2024-07-11T17:56:03Z)
A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文参考訳（メタデータ） (2023-11-13T01:48:08Z)
A Unified Approach to Controlling Implicit Regularization via Mirror Descent [18.536453909759544]
ミラー降下(MD)は勾配降下(GD)の顕著な一般化である MDを効率的に実装することができ、適切な条件下での高速収束を享受できることを示す。
論文参考訳（メタデータ） (2023-06-24T03:57:26Z)
DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文参考訳（メタデータ） (2023-01-23T15:18:54Z)
Towards Principled Disentanglement for Domain Generalization [90.9891372499545]
機械学習モデルの根本的な課題は、アウト・オブ・ディストリビューション(OOD)データへの一般化である。私たちはまず、DEC(Disentanglement-Constrained Domain Generalization)と呼ばれる制約付き最適化としてOOD一般化問題を定式化する。この変換に基づいて、結合表現の不絡合と領域一般化のための原始双対アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-11-27T07:36:32Z)
Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。新規な構造化融合正規化に基づく一般グラフ推定器を提案する。提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文参考訳（メタデータ） (2021-03-05T04:42:32Z)
Posterior Differential Regularization with f-divergence for Improving Model Robustness [95.05725916287376]
クリーン入力とノイズ入力のモデル後部差を規則化する手法に着目する。後微分正則化を$f$-divergencesの族に一般化する。実験の結果, 後方微分を$f$-divergenceで正規化することで, モデルロバスト性の向上が期待できることがわかった。
論文参考訳（メタデータ） (2020-10-23T19:58:01Z)
Generalization Properties of Optimal Transport GANs with Latent Distribution Learning [52.25145141639159]
本研究では,潜伏分布とプッシュフォワードマップの複雑さの相互作用が性能に与える影響について検討する。我々の分析に感銘を受けて、我々はGANパラダイム内での潜伏分布とプッシュフォワードマップの学習を提唱した。
論文参考訳（メタデータ） (2020-07-29T07:31:33Z)
Stochastic spectral embedding [0.0]
確率スペクトル埋め込み(SSE)に基づく新しい逐次適応サロゲートモデリング法を提案する。本手法は,複雑性と入力次元の異なるモデルの集合上で,最先端のスパースカオス展開に対して,どのように好意的に比較されるかを示す。
論文参考訳（メタデータ） (2020-04-09T11:00:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。