論文の概要: Extrapolation in Statistical Learning with Extreme Value Theory
- arxiv url: http://arxiv.org/abs/2605.01909v1
- Date: Sun, 03 May 2026 14:43:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.989124
- Title: Extrapolation in Statistical Learning with Extreme Value Theory
- Title(参考訳): 極値理論を用いた統計的学習における外挿
- Authors: Sebastian Engelke, Nicola Gnecco, Anne Sabourin,
- Abstract要約: 極値理論は、厳密な理論と機械学習の統計ツールを提供する。
トレーニングデータ以外のレグレッションや分類を含む、幅広いタスクは、これらの進歩の恩恵を受ける。
本稿では,統計的学習と極値理論の交点におけるこれらの分野の最近の発展を概説する。
- 参考スコア(独自算出の注目度): 2.5306981887848514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme value theory provides rigorous theory and statistical tools for extrapolation in machine learning, particularly in settings where traditional methods struggle due to data scarcity in the tails. A broad range of tasks benefit from these advances, including regression and classification beyond the training data, extreme quantile regression, supervised and unsupervised dimension reduction, generative artificial intelligence and anomaly detection. This review synthesizes recent developments in these fields at the intersection of statistical learning and extreme value theory, with a focus on principled methods based on asymptotically motivated representations of the tail of univariate and multivariate distributions. We consider different theoretical frameworks for both asymptotically dependent and independent data and discuss how they translate into efficient statistical methods for extrapolation to extreme regions. By addressing both theoretical and practical aspects, we offer a comprehensive overview of the state-of-the-art in this quickly evolving field, and identify promising directions for future research.
- Abstract(参考訳): 極端値理論は、特に尾部のデータの不足によって従来の手法が苦労する環境で、機械学習における外挿のための厳密な理論と統計ツールを提供する。
トレーニングデータ以外の回帰と分類、極端な量子回帰、教師付きおよび教師なしの次元縮小、生成人工知能、異常検出など、幅広いタスクがこれらの進歩の恩恵を受けている。
本稿では, 統計的学習と極値理論の交点におけるこれらの分野の最近の発展を, 一変量分布と多変量分布の尾の漸近的動機付け表現に基づく原理的手法に焦点をあてて合成する。
我々は、漸近的依存データと独立データの両方に対する異なる理論的枠組みを検討し、それらが極端領域への外挿のための効率的な統計的方法にどのように変換されるかについて議論する。
理論的側面と実践的側面の両方に対処することにより、この急速に発展する分野における最先端技術の概要を包括的に把握し、将来的な研究の道筋を明らかにする。
関連論文リスト
- Fused Multinomial Logistic Regression Utilizing Summary-Level External Machine-learning Information [3.2819213801147282]
本稿では、モーメント制約による外部予測を組み込んだ一般的な経験的類似のフレームワークを提案する。
我々は,主モデルとして多項ロジスティック回帰に着目し,外部ソースにおける共通データ品質問題に対処する。
外部予測を組み込むと、一次のみの推定値に対して厳密な効率向上が得られる。
論文 参考訳(メタデータ) (2026-04-05T02:37:23Z) - Takeuchi's Information Criteria as Generalization Measures for DNNs Close to NTK Regime [56.89793618576349]
一般化のギャップをよりよく特徴付けるため、機械学習コミュニティにおいて一般化対策が広く研究されている。
本研究では,この古典的尺度が深層ニューラルネットワーク(DNN)の一般化ギャップを効果的に説明できる条件を明らかにするために,竹内の情報基準(TIC)に着目した。
論文 参考訳(メタデータ) (2026-02-26T17:01:14Z) - Imperfect Influence, Preserved Rankings: A Theory of TRAK for Data Attribution [10.662938465357158]
本稿では、TRAKアルゴリズムの理論的解析を行い、その性能を特徴付け、手法が依存する近似による誤差を定量化する。
この近似は大きな誤差を生じるが、TRAKの推定値の影響はもともとの影響と強く相関しており、したがってデータポイントの相対的なランクを保っている。
論文 参考訳(メタデータ) (2026-02-01T16:11:49Z) - Multiply Robust Conformal Risk Control with Coarsened Data [0.0]
コンフォーマル予測(CP)は近年,膨大な関心を集めている。
本稿では、粗いデータから得られる結果に対して、分布自由な有効予測領域を得るという一般的な問題について考察する。
半パラメトリック理論の原則的利用は、フレキシブルな機械学習手法の促進の鍵となる利点を持つ。
論文 参考訳(メタデータ) (2025-08-21T12:14:44Z) - Global Convergence of Continual Learning on Non-IID Data [51.99584235667152]
回帰モデルの連続学習のための総合的・包括的理論的解析を行う。
一般データ条件下で連続学習のほぼ確実に収束する結果を初めて確立する。
論文 参考訳(メタデータ) (2025-03-24T10:06:07Z) - In-Context Linear Regression Demystified: Training Dynamics and Mechanistic Interpretability of Multi-Head Softmax Attention [52.159541540613915]
本研究では,マルチヘッド型ソフトマックスアテンションモデルを用いて,線形データを用いたコンテキスト内学習を行う方法について検討する。
この結果から,学習内容の学習能力は,そのアーキテクチャと基礎となるデータ分布の集約的効果として,訓練されたトランスフォーマーから出現することが明らかとなった。
論文 参考訳(メタデータ) (2025-03-17T02:00:49Z) - A Mathematics Framework of Artificial Shifted Population Risk and Its Further Understanding Related to Consistency Regularization [7.944280447232545]
本稿では,データ拡張のためのより包括的な数学的枠組みを紹介する。
シフトする人口の予測リスクは、当初の人口リスクとギャップ項の合計であることを示す。
本稿は、このギャップの理論的理解も提供し、トレーニングの初期段階における負の効果を強調している。
論文 参考訳(メタデータ) (2025-02-15T08:26:49Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - On Regression in Extreme Regions [0.7974430263940756]
我々は、余変数の観測されていない尾に外挿、あるいは領域外一般化を目的とした統計的学習理論の枠組みを確立する。
本稿では,Vapnik-Chervonenkisクラスから選択した予測器を用いて,非パラメトリック最小二乗回帰のスタイリング問題に対処する。
本研究では, 余剰リスクの観点から, テール領域の予測性能を定量化し, 明確なバイアス分散分解を伴う有限サンプルリスクとして提示する。
論文 参考訳(メタデータ) (2023-03-06T12:55:38Z) - On the Benefits of Invariance in Neural Networks [56.362579457990094]
データ拡張によるトレーニングは、リスクとその勾配をよりよく見積もることを示し、データ拡張でトレーニングされたモデルに対して、PAC-Bayes一般化を提供する。
また,データ拡張と比べ,平均化は凸損失を伴う場合の一般化誤差を低減し,PAC-Bayes境界を狭めることを示した。
論文 参考訳(メタデータ) (2020-05-01T02:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。