Fugu-MT 論文翻訳(概要): Understanding Pathologies of Deep Heteroskedastic Regression

論文の概要: Understanding Pathologies of Deep Heteroskedastic Regression

arxiv url: http://arxiv.org/abs/2306.16717v2
Date: Tue, 13 Feb 2024 22:46:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-15 19:45:11.268502
Title: Understanding Pathologies of Deep Heteroskedastic Regression
Title（参考訳）: 深部ヘテロケクタスティック回帰の病態の解明
Authors: Eliot Wong-Toi, Alex Boyd, Vincent Fortuin, Stephan Mandt
Abstract要約: ヘテロスケダスティックモデルは各データポイントの平均ノイズと残留ノイズの両方を予測する。極端に言えば、これらのモデルはすべてのトレーニングデータを完璧に適合させ、残音を完全に排除する。他方では、一定で非形式的な平均を予測しながら残音を過度に補正する。中間地盤の欠如を観察し, モデル正則化強度に依存する相転移を示唆した。
参考スコア（独自算出の注目度）: 25.509884677111344
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Deep, overparameterized regression models are notorious for their tendency to overfit. This problem is exacerbated in heteroskedastic models, which predict both mean and residual noise for each data point. At one extreme, these models fit all training data perfectly, eliminating residual noise entirely; at the other, they overfit the residual noise while predicting a constant, uninformative mean. We observe a lack of middle ground, suggesting a phase transition dependent on model regularization strength. Empirical verification supports this conjecture by fitting numerous models with varying mean and variance regularization. To explain the transition, we develop a theoretical framework based on a statistical field theory, yielding qualitative agreement with experiments. As a practical consequence, our analysis simplifies hyperparameter tuning from a two-dimensional to a one-dimensional search, substantially reducing the computational burden. Experiments on diverse datasets, including UCI datasets and the large-scale ClimSim climate dataset, demonstrate significantly improved performance in various calibration tasks.
Abstract（参考訳）: 過度にパラメータ化された回帰モデルは、過度に適合する傾向があることで悪名高い。この問題は、各データポイントの平均ノイズと残留ノイズの両方を予測するヘテロスケダスティックモデルで悪化する。極端に言えば、これらのモデルはすべてのトレーニングデータを完璧に適合させ、残音を完全に排除します。中間地盤の欠如を観察し, モデル正規化強度に依存する相転移を示唆する。経験的検証は、多くのモデルに平均と分散正規化を適合させることでこの予想を支持している。遷移を説明するために, 統計的場理論に基づく理論的枠組みを開発し, 実験と定性的一致を与える。その結果,2次元から1次元の探索へのハイパーパラメータチューニングを簡略化し,計算負担を大幅に軽減した。 UCIデータセットや大規模ClimSim気候データセットを含む多様なデータセットの実験では、さまざまなキャリブレーションタスクのパフォーマンスが大幅に向上した。

関連論文リスト

On the Effect of Regularization on Nonparametric Mean-Variance Regression [22.758981850171548]
実験結果と一致して観測された相転移を捉える統計場理論フレームワークを開発した。 UCIデータセットと大規模ClimSimデータセットの実験は、堅牢な校正性能を示し、予測の不確実性を効果的に定量化している。
論文参考訳（メタデータ） (2025-11-27T01:09:28Z)
More Data or Better Algorithms: Latent Diffusion Augmentation for Deep Imbalanced Regression [0.0]
多くの実世界の回帰タスクでは、データ分布は著しく歪められ、モデルは大多数のサンプルから主に学習される。このフレームワークは、優先度ベース生成を用いた条件拡散モデルを用いて、遅延表現空間における高品質な特徴を合成する。 3つのDIRベンチマークの実験は、全体の精度を維持しながら少数地域の大幅な改善を示している。
論文参考訳（メタデータ） (2025-09-27T10:44:28Z)
H-AddiVortes: Heteroscedastic (Bayesian) Additive Voronoi Tessellations [0.0]
Heteroscedastic AddiVortesモデルは、応答変数の条件平均と分散を同時にモデル化する。平均値の総和法と変分に対する積積算法を用いることにより、モデルは複雑で予測因子に依存した関係を捉える柔軟かつ解釈可能な手段を提供する。
論文参考訳（メタデータ） (2025-03-17T10:41:31Z)
A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文参考訳（メタデータ） (2025-02-26T06:18:13Z)
Preconditioned Inexact Stochastic ADMM for Deep Model [35.37705488695026]
本稿では,拡張性のある並列計算を可能にするアルゴリズム PISA を開発し,様々な第2モーメント方式をサポートする。厳密な理論的な保証の下で、アルゴリズムは勾配のリプシッツの唯一の仮定の下で収束する。視覚モデル、大規模言語モデル、強化学習モデル、生成的敵ネットワーク、繰り返しニューラルネットワークを含む様々なFMの総合的または微調整実験は、様々な最先端の方向と比較して優れた数値性能を示す。
論文参考訳（メタデータ） (2025-02-15T12:28:51Z)
Heteroscedastic Double Bayesian Elastic Net [1.1240642213359266]
平均分散と対数分散を共同でモデル化する新しいフレームワークであるヘテロセダスティックダブルベイズ弾性ネット(HDBEN)を提案する。本手法は, 回帰係数と分散パラメータの分散とグループ化を同時に引き起こし, データの複雑な分散構造を捉える。
論文参考訳（メタデータ） (2025-02-04T05:44:19Z)
DiffPuter: Empowering Diffusion Models for Missing Data Imputation [56.48119008663155]
本稿ではDiffPuterについて紹介する。DiffPuterは、データ計算の欠如に対する期待最大化(EM)アルゴリズムと組み合わせた、カスタマイズされた拡散モデルである。我々の理論的解析は、DiffPuterのトレーニングステップがデータ密度の最大推定値に対応することを示している。 DiffPuterは,最も競争力のある既存手法と比較して,MAEが6.94%,RMSEが4.78%向上した。
論文参考訳（メタデータ） (2024-05-31T08:35:56Z)
Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文参考訳（メタデータ） (2024-02-19T02:08:09Z)
Out of the Ordinary: Spectrally Adapting Regression for Covariate Shift [12.770658031721435]
本稿では,学習前のニューラル回帰モデルの最後の層の重みを適応させて,異なる分布から得られる入力データを改善する手法を提案する。本稿では,この軽量なスペクトル適応手法により,合成および実世界のデータセットの分布外性能が向上することを示す。
論文参考訳（メタデータ） (2023-12-29T04:15:58Z)
Structured Radial Basis Function Network: Modelling Diversity for Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文参考訳（メタデータ） (2023-09-02T01:27:53Z)
Bayesian Additive Main Effects and Multiplicative Interaction Models using Tensor Regression for Multi-environmental Trials [0.0]
本稿では,複数の因子が表現型予測に与える影響を考慮したベイズテンソル回帰モデルを提案する。我々は、モデルのパラメータ間で生じる可能性のある識別可能性の問題を解決するための、事前分布のセットを採用する。我々は2010年から2019年までのアイルランドにおける小麦生産に関する実世界のデータを分析して、我々のモデルの適用性を探る。
論文参考訳（メタデータ） (2023-01-09T19:54:50Z)
On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。理論的にも経験的にも二重降下現象を観察する。
論文参考訳（メタデータ） (2021-10-13T17:47:39Z)
Estimation of Bivariate Structural Causal Models by Variational Gaussian Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文参考訳（メタデータ） (2021-09-06T14:52:58Z)
Post-mortem on a deep learning contest: a Simpson's paradox and the complementary roles of scale metrics versus shape metrics [61.49826776409194]
我々は、ニューラルネットワーク(NN)モデルの一般化精度を予測するために、コンテストで公に利用可能にされたモデルのコーパスを分析する。メトリクスが全体としてよく機能するが、データのサブパーティションではあまり機能しない。本稿では,データに依存しない2つの新しい形状指標と,一連のNNのテスト精度の傾向を予測できるデータ依存指標を提案する。
論文参考訳（メタデータ） (2021-06-01T19:19:49Z)
Memorizing without overfitting: Bias, variance, and interpolation in over-parameterized models [0.0]
バイアス分散トレードオフは教師あり学習における中心的な概念である。現代のDeep Learningメソッドは、最先端のパフォーマンスを達成するために、このドグマを浮かび上がらせる。
論文参考訳（メタデータ） (2020-10-26T22:31:04Z)
Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。分散による離散乗法雑音のパラメータによく現れることを示す。最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文参考訳（メタデータ） (2020-06-11T09:58:01Z)
Maximum likelihood estimation and uncertainty quantification for Gaussian process approximation of deterministic functions [10.319367855067476]
本稿は、ガウス過程の回帰の文脈において、ノイズのないデータセットを用いた最初の理論的分析の1つを提供する。本稿では,スケールパラメータのみの最大推定がガウス過程モデルの不特定に対する顕著な適応をもたらすことを示す。
論文参考訳（メタデータ） (2020-01-29T17:20:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。