Fugu-MT 論文翻訳(概要): Double Descent Risk and Volume Saturation Effects: A Geometric Perspective

論文の概要: Double Descent Risk and Volume Saturation Effects: A Geometric Perspective

arxiv url: http://arxiv.org/abs/2006.04366v2
Date: Tue, 10 Nov 2020 05:18:20 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-24 00:33:59.337083
Title: Double Descent Risk and Volume Saturation Effects: A Geometric Perspective
Title（参考訳）: 二重発振リスクと容積飽和効果:幾何学的視点
Authors: Prasad Cheema, Mahito Sugiyama
Abstract要約: モデルボリュームの対数:$log V$はAICおよびBICモデル選択基準の背景にある直観を拡張する。等方的線形回帰と統計格子の特定のモデルクラスに対して、$log V$項は異なる成分の和に分解できる。
参考スコア（独自算出の注目度）: 5.634825161148483
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The appearance of the double-descent risk phenomenon has received growing interest in the machine learning and statistics community, as it challenges well-understood notions behind the U-shaped train-test curves. Motivated through Rissanen's minimum description length (MDL), Balasubramanian's Occam's Razor, and Amari's information geometry, we investigate how the logarithm of the model volume: $\log V$, works to extend intuition behind the AIC and BIC model selection criteria. We find that for the particular model classes of isotropic linear regression and statistical lattices, the $\log V$ term may be decomposed into a sum of distinct components, each of which assist in their explanations of the appearance of this phenomenon. In particular they suggest why generalization error does not necessarily continue to grow with increasing model dimensionality.
Abstract（参考訳）: 複発リスク現象の出現は、U字型の列車試験曲線の背後にあるよく理解された概念に挑戦するため、機械学習と統計学コミュニティへの関心が高まっている。リッサネンの最小記述長(MDL)、バラスラマニアのOccam's Razor、アマリの情報幾何を通して、モデル体積の対数:$\log V$は、AICとBICモデル選択基準の背景にある直観を拡張するためにどのように機能するかを考察する。等方的線形回帰と統計格子の特定のモデルクラスに対して、$\log V$ 項は異なる成分の和に分解され、それぞれがこの現象の出現を説明するのに役立つ。特に、一般化誤差がモデル次元の増加とともに必ずしも増大しない理由を示唆している。

関連論文リスト

Do Larger Language Models Imply Better Generalization? A Pretraining Scaling Law for Implicit Reasoning [89.17086632436363]
本研究では,実世界の大規模知識グラフの構造と分布を再現する合成マルチホップ推論環境を提案する。我々の推論タスクは、グラフの欠落したエッジを補完することであり、これは高度なマルチホップ推論を必要とし、現実世界の推論シナリオを模倣する。特定の知識グラフに対して最適なモデルサイズを予測するために,知識グラフ探索エントロピーを最適モデルサイズに線形にマッピングする経験的スケーリングを求める。
論文参考訳（メタデータ） (2025-04-04T17:57:22Z)
The poison of dimensionality [0.0]
本稿では,機械学習モデルのサイズが毒性の脆弱性に与える影響について理解を深める。実験では、モデル表現力の増強と毒薬の攻撃面の増大の基本的なトレードオフを明らかにする。
論文参考訳（メタデータ） (2024-09-25T20:06:33Z)
Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文参考訳（メタデータ） (2024-05-01T15:59:00Z)
Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文参考訳（メタデータ） (2024-03-08T18:50:19Z)
A U-turn on Double Descent: Rethinking Parameter Counting in Statistical Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。これは二重降下と統計的直観の間の緊張を解消する。
論文参考訳（メタデータ） (2023-10-29T12:05:39Z)
Realization of Causal Representation Learning to Adjust Confounding Bias in Latent Space [28.133104562449212]
因果DAG (Directed Acyclic Graphs) は通常、2次元平面において考慮される。本稿では,変数の値がもはや時間スタンプに依存しておらず,時系列を軸と見なすことができるEmphdo-DAGとして因果DAGを再定義する。
論文参考訳（メタデータ） (2022-11-15T23:35:15Z)
Multiple Descent in the Multiple Random Feature Model [8.988540634325691]
多成分予測モデルのクラスにおける多重降下現象について検討する。特定の降下数を持つリスク曲線が、多成分予測モデルの学習に一般的に存在することを示す。
論文参考訳（メタデータ） (2022-08-21T14:53:15Z)
Inverting brain grey matter models with likelihood-free inference: a tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文参考訳（メタデータ） (2021-11-15T09:08:27Z)
On the Role of Optimization in Double Descent: A Least Squares Study [30.44215064390409]
最小二乗対象の降下勾配解に対して過大なリスクを負うことを示す。ノイズのない回帰の場合、二重降下は最適化関連量によってのみ説明される。ニューラルネットワークの予測が保たれているかどうかを実証的に調査する。
論文参考訳（メタデータ） (2021-07-27T09:13:11Z)
Do-calculus enables causal reasoning with latent variable models [2.294014185517203]
潜在変数モデル(LVM)は、トレーニング中に変数の一部が隠蔽される確率モデルである。因果推論は,確率的モデリングコミュニティで長年確立されてきた幅広いlvmのクラスを拡張できることを示す。
論文参考訳（メタデータ） (2021-02-12T17:12:53Z)
Why do classifier accuracies show linear trends under distribution shift? [58.40438263312526]
あるデータ分布上のモデルの精度は、別の分布上の精度のほぼ線形関数である。 2つのモデルが予測で一致する確率は、精度レベルだけで推測できるものよりも高いと仮定します。分布シフトの大きさが大きければ, 2 つの分布のモデルを評価する場合, 線形傾向が生じなければならない。
論文参考訳（メタデータ） (2020-12-31T07:24:30Z)
The Generalized Lasso with Nonlinear Observations and Generative Priors [63.541900026673055]
我々は、幅広い測定モデルで満たされるガウス下測度を仮定する。この結果から, 局所埋込特性を仮定して, 均一回復保証まで拡張できることが示唆された。
論文参考訳（メタデータ） (2020-06-22T16:43:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。