Fugu-MT 論文翻訳(概要): Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory

論文の概要: Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory

arxiv url: http://arxiv.org/abs/2404.07170v1
Date: Wed, 10 Apr 2024 17:05:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-11 14:01:43.080004
Title: Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory
Title（参考訳）: 極限値理論によるMLアルゴリズムの最悪の収束時間
Authors: Saeid Tizpaz-Niari, Sriram Sankaranarayanan,
Abstract要約: 本稿では、極端な値の統計を利用して、機械学習アルゴリズムの最悪の収束時間を予測する。タイミングはMLシステムの重要な非機能特性であり、最悪の収束時間を提供することは、MLとそのサービスの可用性を保証するために不可欠である。
参考スコア（独自算出の注目度）: 8.540426791244533
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper leverages the statistics of extreme values to predict the worst-case convergence times of machine learning algorithms. Timing is a critical non-functional property of ML systems, and providing the worst-case converge times is essential to guarantee the availability of ML and its services. However, timing properties such as worst-case convergence times (WCCT) are difficult to verify since (1) they are not encoded in the syntax or semantics of underlying programming languages of AI, (2) their evaluations depend on both algorithmic implementations and underlying systems, and (3) their measurements involve uncertainty and noise. Therefore, prevalent formal methods and statistical models fail to provide rich information on the amounts and likelihood of WCCT. Our key observation is that the timing information we seek represents the extreme tail of execution times. Therefore, extreme value theory (EVT), a statistical discipline that focuses on understanding and predicting the distribution of extreme values in the tail of outcomes, provides an ideal framework to model and analyze WCCT in the training and inference phases of ML paradigm. Building upon the mathematical tools from EVT, we propose a practical framework to predict the worst-case timing properties of ML. Over a set of linear ML training algorithms, we show that EVT achieves a better accuracy for predicting WCCTs than relevant statistical methods such as the Bayesian factor. On the set of larger machine learning training algorithms and deep neural network inference, we show the feasibility and usefulness of EVT models to accurately predict WCCTs, their expected return periods, and their likelihood.
Abstract（参考訳）: 本稿では、極端な値の統計を利用して、機械学習アルゴリズムの最悪の収束時間を予測する。タイミングはMLシステムの重要な非機能特性であり、最悪の収束時間を提供することは、MLとそのサービスの可用性を保証するために不可欠である。しかし,(1)AIの基盤となるプログラミング言語の構文やセマンティクスにコード化されていないこと,(2)アルゴリズムの実装と基盤システムに依存すること,(3)不確実性とノイズを伴うことなどから,最悪のケース収束時間(WCCT)などのタイミング特性の検証は困難である。したがって、一般的な形式的手法や統計モデルは、WCCTの量や可能性についての豊富な情報を提供していない。私たちのキーとなる観察は、私たちが求めるタイミング情報は実行時間の極端なテールを表しているということです。したがって、結果の尾における極端な値の分布の理解と予測に焦点を当てた統計学分野であるEVTは、MLパラダイムのトレーニングと推論フェーズにおいてWCCTをモデル化し分析するための理想的な枠組みを提供する。本稿では,EVTの数学的ツールに基づいて,MLの最悪のタイミング特性を予測するための実践的枠組みを提案する。一連の線形MLトレーニングアルゴリズムにおいて、EVTはベイズ係数などの関連する統計手法よりもWCCTの予測精度が高いことを示す。より大規模な機械学習トレーニングアルゴリズムとディープニューラルネットワーク推論のセットにおいて、EVTモデルがWCCTを正確に予測し、予測したリターン期間を予測し、その可能性を示す。

関連論文リスト

STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。 STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-12T16:30:07Z)
Imperfect Influence, Preserved Rankings: A Theory of TRAK for Data Attribution [10.662938465357158]
本稿では、TRAKアルゴリズムの理論的解析を行い、その性能を特徴付け、手法が依存する近似による誤差を定量化する。この近似は大きな誤差を生じるが、TRAKの推定値の影響はもともとの影響と強く相関しており、したがってデータポイントの相対的なランクを保っている。
論文参考訳（メタデータ） (2026-02-01T16:11:49Z)
Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文参考訳（メタデータ） (2025-09-27T20:57:48Z)
A Unified Framework for Inference with General Missingness Patterns and Machine Learning Imputation [12.350330523619336]
本稿では,一般的なZ推定問題に対して有効な統計的推論フレームワークを提供する新しい手法を提案する。中心となる技術的な考え方は、観察を異なる欠落パターンで階層化し、パターン固有の情報を適切に重み付け、集約することで推定器を構築することである。提案した推定器の正規性の理論的保証と重み付き完全ケース解析に対する効率優位性を提供する。
論文参考訳（メタデータ） (2025-08-21T01:59:59Z)
Unveil Sources of Uncertainty: Feature Contribution to Conformal Prediction Intervals [0.3495246564946556]
共形予測(CP)に基づく新しいモデルに依存しない不確実性属性(UA)法を提案する。我々は,CP間隔特性-幅や境界条件-を値関数として定義し,入力特徴に対する予測不確かさを属性とする協調ゲームを定義する。人工ベンチマークと実世界のデータセットを用いた実験は、我々のアプローチの実用的有用性と解釈的深さを実証する。
論文参考訳（メタデータ） (2025-05-19T13:49:05Z)
Prediction Models That Learn to Avoid Missing Values [7.302408149992981]
失敗回避機械学習(英: Missingness-avoiding、MA)は、テスト時に欠落する機能の価値をほとんど必要としないモデルをトレーニングするためのフレームワークである。我々は,決定木,木アンサンブル,疎線形モデルに適したMA学習アルゴリズムを作成する。我々のフレームワークは、テスト時に欠落した値の予測において、解釈可能性を維持する強力なツールを提供する。
論文参考訳（メタデータ） (2025-05-06T10:16:35Z)
New Statistical Framework for Extreme Error Probability in High-Stakes Domains for Reliable Machine Learning [4.14360329494344]
極端な価値理論(EVT)は、最悪のケースの失敗を推定するための厳密なアプローチを提供する統計フレームワークである。 EVTを合成および実世界のデータセットに適用することにより、破滅的故障確率のロバストな推定を可能にする。この作業は、EVTをモデルの信頼性を評価し、新しいテクノロジにおけるより安全なAIデプロイメントを保証するための基本的なツールとして確立する。
論文参考訳（メタデータ） (2025-03-31T16:08:11Z)
Uncertainty quantification for Markov chains with application to temporal difference learning [63.49764856675643]
マルコフ連鎖のベクトル値および行列値関数に対する新しい高次元濃度不等式とベリー・エッシー境界を開発する。我々は、強化学習における政策評価に広く用いられているTD学習アルゴリズムを解析する。
論文参考訳（メタデータ） (2025-02-19T15:33:55Z)
Probabilistic Iterative Hard Thresholding for Sparse Learning [2.5782973781085383]
本稿では,基本性制約を用いた予測目標最適化問題の解法を提案する。基礎となるプロセスの収束を証明し、2つの機械学習問題における性能を実証する。
論文参考訳（メタデータ） (2024-09-02T18:14:45Z)
Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文参考訳（メタデータ） (2023-12-19T21:45:38Z)
Dynamic Model Agnostic Reliability Evaluation of Machine-Learning Methods Integrated in Instrumentation & Control Systems [1.8978726202765634]
データ駆動型ニューラルネットワークベースの機械学習アルゴリズムの信頼性は十分に評価されていない。 National Institute for Standards and Technologyの最近のレポートでは、MLにおける信頼性は採用にとって重要な障壁となっている。トレーニングデータセットにアウト・オブ・ディストリビューション検出を組み込むことにより、ML予測の相対的信頼性を評価するためのリアルタイムモデル非依存手法を実証する。
論文参考訳（メタデータ） (2023-08-08T18:25:42Z)
Fairness Uncertainty Quantification: How certain are you that the model is fair? [13.209748908186606]
現代の機械学習において、グラディエント・Descent(SGD)型アルゴリズムは、学習されたモデルがランダムであることを示す訓練アルゴリズムとして、ほぼ常に使用される。本研究では,グループフェアネスを意識した信頼区間(CI)、特にDI(Disparate Impact)とDM(Disparate Mistreatment)を意識した線形二項分類器をオンラインSGD型アルゴリズムを用いてトレーニングする場合に,不公平性テストのための信頼区間(CI)を提供する。
論文参考訳（メタデータ） (2023-04-27T04:07:58Z)
Self-learning locally-optimal hypertuning using maximum entropy, and comparison of machine learning approaches for estimating fatigue life in composite materials [0.0]
疲労損傷を予測するための最大エントロピーの原理に基づくML近傍近似アルゴリズムを開発した。予測は、他のMLアルゴリズムと同様、高いレベルの精度を達成する。
論文参考訳（メタデータ） (2022-10-19T12:20:07Z)
Bias-Variance Tradeoffs in Single-Sample Binary Gradient Estimators [100.58924375509659]
ストレートスルー (ST) 推定器はその単純さと効率性から人気を得た。計算の複雑さを低く保ちながら、STよりも改善するいくつかの手法が提案された。我々は、トレードオフを理解し、元来主張された特性を検証するために、これらの手法のバイアスとばらつきの理論解析を行う。
論文参考訳（メタデータ） (2021-10-07T15:16:07Z)
Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文参考訳（メタデータ） (2021-06-07T17:47:16Z)
Amortized Conditional Normalized Maximum Likelihood: Reliable Out of Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文参考訳（メタデータ） (2020-11-05T08:04:34Z)
A comparison of Monte Carlo dropout and bootstrap aggregation on the performance and uncertainty estimation in radiation therapy dose prediction with deep learning neural networks [0.46180371154032895]
本稿では,モンテカルロ投棄法(MCDO)とブートストラップアグリゲーション(バッグング)をディープラーニングモデルに応用し,放射線治療用線量予測の不確かさを推定する手法を提案する。パフォーマンス面では、バギングは調査対象のほとんどの指標において統計的に顕著な損失値と誤差を減少させる。
論文参考訳（メタデータ） (2020-11-01T00:24:43Z)
Machine learning for causal inference: on the use of cross-fit estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文参考訳（メタデータ） (2020-04-21T23:09:55Z)
Localized Debiased Machine Learning: Efficient Inference on Quantile Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。 Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文参考訳（メタデータ） (2019-12-30T14:42:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。