Fugu-MT 論文翻訳(概要): Probability Distribution Learning and Its Application in Deep Learning

論文の概要: Probability Distribution Learning and Its Application in Deep Learning

arxiv url: http://arxiv.org/abs/2406.05666v9
Date: Thu, 19 Dec 2024 12:13:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-27 15:47:06.451306
Title: Probability Distribution Learning and Its Application in Deep Learning
Title（参考訳）: 確率分布学習と深層学習への応用
Authors: Binchuan Qi,
Abstract要約: 本稿では,確率分布学習(PD Learning)と呼ばれる理論学習フレームワークを紹介する。 PD学習は確率分布の学習に重点を置いており、確率の単純さの中で確率変数としてモデル化される。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces a novel theoretical learning framework, termed probability distribution learning (PD learning). Departing from the traditional statistical learning framework, PD learning focuses on learning the underlying probability distribution, which is modeled as a random variable within the probability simplex. In this framework, the optimization objective is the learning error, which quantifies the posterior expected discrepancy between the model's predicted distribution and the underlying true distribution, given available sample data and prior knowledge. To optimize the learning error, this paper proposes the necessary conditions for loss functions, models, and optimization algorithms, ensuring that these conditions are met in real-world machine learning scenarios. Based on these conditions, the non-convex optimization mechanism corresponding to model training can be theoretically resolved. Moreover, this paper provides model-dependent and model-independent bounds on learning error, offering new insights into the model's fitting and generalization capabilities. Furthermore, the paper applies the PD learning framework to elucidate the mechanisms by which various techniques, including random parameter initialization, over-parameterization, and dropout, influence deep model training. Finally, the paper substantiates the key conclusions of the proposed framework through experimental results.
Abstract（参考訳）: 本稿では,確率分布学習(PD Learning)と呼ばれる理論学習フレームワークを提案する。従来の統計学習フレームワークとは別に、PD学習は確率分布の学習に重点を置いている。このフレームワークにおいて、最適化の目的は学習誤差であり、モデルが予測した分布と基礎となる真の分布との間の後続の予測誤差を、利用可能なサンプルデータと事前知識が与えられたときに定量化する。学習誤差を最適化するために、損失関数、モデル、最適化アルゴリズムに必要な条件を提案し、これらの条件が現実の機械学習シナリオで満たされることを保証する。これらの条件に基づき、モデルトレーニングに対応する非凸最適化機構を理論的に解くことができる。さらに,本論文では,学習エラーに対するモデル依存およびモデル非依存のバウンダリを提供し,モデルの適合性と一般化能力に関する新たな洞察を提供する。さらに,パラメータの初期化,過パラメータ化,ドロップアウトといった様々な手法が深層モデルトレーニングに影響を及ぼすメカニズムを明らかにするために,PD学習フレームワークを適用した。最後に,提案手法の重要な結論を実験的に検証した。

関連論文リスト

Demystifying Data-Driven Probabilistic Medium-Range Weather Forecasting [63.8116386935854]
最先端の確率的スキルは、複雑なアーキテクチャ制約や専門的な訓練を必要としないことを実証する。直下型遅延空間と履歴条件付きローカルプロジェクタを組み合わせることで,マルチスケールの大気力学を学習するためのスケーラブルなフレームワークを提案する。我々のフレームワーク設計は確率的推定器の選択に頑健であり、補間、拡散モデル、CRPSに基づくアンサンブルトレーニングをシームレスにサポートする。
論文参考訳（メタデータ） (2026-01-26T03:52:16Z)
Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文参考訳（メタデータ） (2025-02-11T19:24:09Z)
On uniqueness in structured model learning [0.542249320079018]
偏微分方程式系(PDE)の物理法則学習における一意性の問題に対処する。構造化されたモデル学習のフレームワークとして、データから学習されるコンポーネントによって、既存のほぼ正しい物理モデルが強化される。この一意性の結果は、完全なノイズレス測定の理想的な設定において、未知のモデル成分のユニークな識別が可能であることを示している。
論文参考訳（メタデータ） (2024-10-29T12:56:39Z)
ProFL: Performative Robust Optimal Federated Learning [20.54517189040872]
変形予測(Performative prediction)は、機械学習モデルのトレーニング中に発生する凸分布シフトである。本稿では,フェデレート学習における性能最適点を抽出するPerformative Learningアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-23T17:57:14Z)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳（メタデータ） (2024-10-04T15:44:23Z)
Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文参考訳（メタデータ） (2024-02-02T05:53:22Z)
Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-12-22T02:12:08Z)
A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文参考訳（メタデータ） (2023-11-13T01:48:08Z)
A Mathematical Framework for Learning Probability Distributions [0.0]
生成的モデリングと密度推定は近年非常にポピュラーな話題になっています本論文は、すべての有名なモデルを単純な原理に基づいて導出できる数学的枠組みを提供する。特に,これらのモデルが訓練中に暗黙的な正規化を楽しむことを証明し,早期停止時の一般化誤差が次元性の呪いを避ける。
論文参考訳（メタデータ） (2022-12-22T04:41:45Z)
Correcting Model Bias with Sparse Implicit Processes [0.9187159782788579]
SIP(Sparse Implicit Processes)は,データ生成機構がモデルによって入力されるものと強く異なる場合,モデルバイアスを補正できることを示す。合成データセットを用いて、SIPは、初期推定モデルの正確な予測よりもデータをよりよく反映する予測分布を提供することができることを示す。
論文参考訳（メタデータ） (2022-07-21T18:00:01Z)
Learning Neural Models for Natural Language Processing in the Face of Distributional Shift [10.990447273771592]
特定のデータセットでひとつのタスクを実行するための強力な神経予測器をトレーニングするNLPのパラダイムが、さまざまなアプリケーションで最先端のパフォーマンスを実現している。データ分布が定常である、すなわち、トレーニングとテストの時間の両方で、データは固定された分布からサンプリングされる、という仮定に基づいて構築される。この方法でのトレーニングは、人間が絶えず変化する情報の流れの中で学習し、操作できる方法と矛盾する。データ分散がモデル寿命の経過とともにシフトすることが期待される実世界のユースケースに不適応である。
論文参考訳（メタデータ） (2021-09-03T14:29:20Z)
MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文参考訳（メタデータ） (2021-06-03T12:59:16Z)
Transferring model structure in Bayesian transfer learning for Gaussian process regression [1.370633147306388]
本稿では、転送源分布上の目標確率分布を条件付けるタスクを定義する。この最適意思決定問題を解決するために、完全な確率的設計が採用されている。ソースのより高いモーメントを転送することで、ターゲットは信頼できないソース知識を拒否することができる。
論文参考訳（メタデータ） (2021-01-18T05:28:02Z)
Trust but Verify: Assigning Prediction Credibility by Counterfactual Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文参考訳（メタデータ） (2020-11-24T19:52:38Z)
Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文参考訳（メタデータ） (2020-07-11T19:44:09Z)
Bootstrapped model learning and error correction for planning with uncertainty in model-based RL [1.370633147306388]
自然の目的は、環境のダイナミクスを正確に反映したモデルを学ぶことである。本稿では,不確実性を考慮した強化学習エージェントによるモデルミス特定の問題について検討する。本稿では,将来の状態と報酬の分布を学習するブートストラップ型マルチヘッドニューラルネットワークを提案する。
論文参考訳（メタデータ） (2020-04-15T15:41:21Z)
A comprehensive study on the prediction reliability of graph neural networks for virtual screening [0.0]
本稿では,モデルアーキテクチャ,正規化手法,損失関数が分類結果の予測性能および信頼性に与える影響について検討する。その結果,高い成功率を達成するためには,正則化と推論手法の正しい選択が重要であることが明らかとなった。
論文参考訳（メタデータ） (2020-03-17T10:13:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。