論文の概要: Probability Distribution Learning: A theoretical framework for Deep Learning
- arxiv url: http://arxiv.org/abs/2406.05666v6
- Date: Mon, 30 Sep 2024 12:20:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:00:52.927197
- Title: Probability Distribution Learning: A theoretical framework for Deep Learning
- Title(参考訳): 確率分布学習 : 深層学習のための理論的枠組み
- Authors: Binchuan Qi,
- Abstract要約: 本稿では,機械学習と統計的タスクを包括的に扱うことを目的とした,新しい理論学習フレームワークである学習分布(PD Learning)を紹介する。
PDラーニングは、分類、回帰、パラメータ推定を含む、機械学習と統計的なタスクに対処する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper introduces Probability Distribution Learning (PD learning), a novel theoretical learning framework designed to address a comprehensive range of machine learning and statistical tasks, including classification, regression, and parameter estimation. Departing from the traditional statistical learning framework, PD learning focuses on learning the underlying probability distribution of a dataset, which is modeled as a random variable within the probability simplex. In this framework, the learning error is decomposed into uncertainty and the model's fitting error to the optimal estimate. Uncertainty, which is non-optimizable and independent of both the model and optimization algorithm, depends solely on prior knowledge and sampling data, constituting the optimal bound of the learning error. Minimizing the fitting error represents a typical non-convex optimization problem. To address this, we initially demonstrate that under the conditions of unique optimum and sampling stability, the loss function exhibits a unified mathematical form, which we refer to as the standard loss function. Moreover, we prove that by employing the standard loss function, the optima of fitting error minimization can be approached by reducing the gradient norm and structural error. Subsequently, we demonstrate that with random parameter initialization, increasing network depth and the parameter count can reduce structural error. Consequently, from the perspective of structural error, techniques such as over-parameterization, non-convex optimization, and the flat minima in deep learning are beneficial in reducing structural error, thereby ensuring that gradient-based iterative algorithms can attain an approximate global optimum for fitting error minimization. Ultimately, the experimental results on various models have validated the effectiveness of the framework proposed in this paper.
- Abstract(参考訳): 本稿では,確率分布学習(PD Learning, Probability Distribution Learning)について紹介する。
従来の統計学習フレームワークとは別に、PD学習では、確率単純度内のランダム変数としてモデル化されたデータセットの基盤となる確率分布の学習に重点を置いている。
この枠組みでは、学習誤差は不確実性に分解され、モデルが最適推定値に適合する。
不確実性は、モデルと最適化アルゴリズムの両方とは独立であり、学習誤差の最適境界を構成する事前知識とサンプリングデータにのみ依存する。
嵌合誤差の最小化は典型的な非凸最適化問題である。
この問題に対処するために、まず、一意の最適化とサンプリング安定性の条件下では、損失関数は統一的な数学的形式を示し、これは標準損失関数と呼ばれる。
さらに、標準損失関数を用いることで、勾配ノルムと構造誤差を小さくすることで、適合誤差最小化の最適化が可能であることを証明した。
その後、ランダムパラメータの初期化、ネットワーク深度の増加、パラメータカウントが構造誤差を低減できることを示した。
したがって, 構造誤差の観点からは, オーバーパラメータ化や非凸最適化, ディープラーニングにおけるフラット最小化といった手法は, 構造誤差の低減に有効である。
最終的に、様々なモデルに関する実験結果により、本論文で提案したフレームワークの有効性が検証された。
関連論文リスト
- Error Bounds of Supervised Classification from Information-Theoretic Perspective [5.281849820329249]
誤差は, 分布の滑らかさとサンプルサイズの影響を受け, 予測されるリスクの上限となる。
実験による検証により, 導出理論境界と実用的予測リスクとの間に有意な正の相関が認められた。
論文 参考訳(メタデータ) (2024-06-07T01:07:35Z) - Learning Latent Graph Structures and their Uncertainty [63.95971478893842]
グラフニューラルネットワーク(GNN)は、モデル精度を高めるために帰納バイアスとしてリレーショナル情報を使用する。
課題関連関係が不明なため,下流予測タスクを解きながら学習するためのグラフ構造学習手法が提案されている。
論文 参考訳(メタデータ) (2024-05-30T10:49:22Z) - C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics [5.395560682099634]
本稿では, 最適プラグイン推定器に対して, ニュアンスパラメータ推定に対する推定器の1次誤差がゼロであるという制約の下で, 最適プラグイン推定器の補正手法を提案する。
C-Learner”と呼ばれる私たちの半推論アプローチは、ニューラルネットワークやツリーアンサンブルといった現代的な機械学習手法で実装できます。
論文 参考訳(メタデータ) (2024-05-15T16:38:28Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - DF2: Distribution-Free Decision-Focused Learning [53.2476224456902]
決定中心学習(DFL)は近年,予測最適化問題に対する強力なアプローチとして出現している。
既存のエンドツーエンドDFL法は、モデル誤差、サンプル平均近似誤差、予測対象の分布に基づくパラメータ化の3つの重大なボトルネックによって妨げられている。
DF2は,これら3つのボトルネックに明示的に対処するために設計された,初となるテキストフリーな意思決定型学習手法である。
論文 参考訳(メタデータ) (2023-08-11T00:44:46Z) - Leveraging Variational Autoencoders for Parameterized MMSE Estimation [10.141454378473972]
条件付き線形最小二乗誤差推定器のパラメータ化のための変分オートエンコーダに基づくフレームワークを提案する。
導出した推定器は、推定問題の生成前として変分オートエンコーダを用いて最小平均2乗誤差推定器を近似する。
提案手法と最小平均二乗誤差推定器の差分を限定して厳密な解析を行う。
論文 参考訳(メタデータ) (2023-07-11T15:41:34Z) - Tight Guarantees for Interactive Decision Making with the
Decision-Estimation Coefficient [51.37720227675476]
我々は、決定推定係数の新たな変種を導入し、それを用いて、3つの面における事前の作業を改善する新しい下界を導出する。
我々は同じ量でスケールした後悔について上界を与え、フォスター等における上界と下界の間のギャップの1つを除いて全てを閉じる。
この結果は、後悔のフレームワークとPACフレームワークの両方に適用され、我々が期待するいくつかの新しい分析とアルゴリズム設計技術を利用して、より広範な利用が期待できる。
論文 参考訳(メタデータ) (2023-01-19T18:24:08Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Robust Unsupervised Learning via L-Statistic Minimization [38.49191945141759]
教師なし学習に焦点をあて、この問題に対する一般的なアプローチを提示する。
重要な仮定は、摂動分布は、許容モデルの特定のクラスに対するより大きな損失によって特徴付けられることである。
教師なし学習におけるいくつかのポピュラーモデルに対する提案基準に関して,一様収束境界を証明した。
論文 参考訳(メタデータ) (2020-12-14T10:36:06Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Nonconvex sparse regularization for deep neural networks and its
optimality [1.9798034349981162]
ディープニューラルネットワーク(DNN)推定器は、回帰と分類問題に対して最適な収束率を得ることができる。
スパースDNNに対する新たなペナル化推定法を提案する。
スパースペンタライズされた推定器は、様々な非パラメトリック回帰問題に対する最小収束率を適応的に達成できることを示す。
論文 参考訳(メタデータ) (2020-03-26T07:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。