論文の概要: Blind-Spot Mass: A Good-Turing Framework for Quantifying Deployment Coverage Risk in Machine Learning Systems
- arxiv url: http://arxiv.org/abs/2604.05057v1
- Date: Mon, 06 Apr 2026 18:06:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.427184
- Title: Blind-Spot Mass: A Good-Turing Framework for Quantifying Deployment Coverage Risk in Machine Learning Systems
- Title(参考訳): Blind-Spot Mass:機械学習システムにおけるデプロイメントカバレッジリスクの定量化のためのグッドチューリングフレームワーク
- Authors: Biplab Pal, Santanu Bhattacharya, Madanjit Singh,
- Abstract要約: Blindspot massは、機械学習におけるデプロイメントカバレッジリスクを定量化するためのグッドチューリングフレームワークである。
実験支援がしきい値タウ以下となる状態に割り当てられた総確率質量を推定する展開距離であるブラインドスポット質量B_n(tau)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Blind-spot mass is a Good-Turing framework for quantifying deployment coverage risk in machine learning. In modern ML systems, operational state distributions are often heavy-tailed, implying that a long tail of valid but rare states is structurally under-supported in finite training and evaluation data. This creates a form of 'coverage blindness': models can appear accurate on standard test sets yet remain unreliable across large regions of the deployment state space. We propose blind-spot mass B_n(tau), a deployment metric estimating the total probability mass assigned to states whose empirical support falls below a threshold tau. B_n(tau) is computed using Good-Turing unseen-species estimation and yields a principled estimate of how much of the operational distribution lies in reliability-critical, under-supported regimes. We further derive a coverage-imposed accuracy ceiling, decomposing overall performance into supported and blind components and separating capacity limits from data limits. We validate the framework in wearable human activity recognition (HAR) using wrist-worn inertial data. We then replicate the same analysis in the MIMIC-IV hospital database with 275 admissions, where the blind-spot mass curve converges to the same 95% at tau = 5 across clinical state abstractions. This replication across structurally independent domains - differing in modality, feature space, label space, and application - shows that blind-spot mass is a general ML methodology for quantifying combinatorial coverage risk, not an application-specific artifact. Blind-spot decomposition identifies which activities or clinical regimes dominate risk, providing actionable guidance for industrial practitioners on targeted data collection, normalization/renormalization, and physics- or domain-informed constraints for safer deployment.
- Abstract(参考訳): Blind-spot massは、機械学習におけるデプロイメントカバレッジリスクを定量化するためのグッドチューリングフレームワークである。
現代のMLシステムでは、運用状態の分布はしばしば重み付けされており、有効だが稀な状態の長い尾は、有限のトレーニングと評価データにおいて構造的に不足していることを示している。
モデルは標準的なテストセットで正確に見えるが、デプロイメント状態領域の広い領域で信頼性が保たれる。
実験支援がしきい値タウ以下となる状態に割り当てられた総確率質量を推定する展開距離であるブラインドスポット質量B_n(tau)を提案する。
B_n(tau) は Good-Turing unseen-species 推定を用いて計算され、運用分布のどれだけが信頼性に限界があり、サポートされていない状態にあるかの原理的な推定値が得られる。
さらに、カバレッジを付与した精度天井を導き、全体的な性能をサポート対象と盲点に分解し、データ制限からキャパシティ制限を分離する。
手首の慣性データを用いたウェアラブルヒューマンアクティビティ認識(HAR)の枠組みを検証する。
次に,MIMIC-IV 病院データベースに 275 件の入院を認め,当院における盲点質量曲線は 95% に収束する。
構造的に独立したドメイン(モダリティ、特徴空間、ラベル空間、アプリケーションなど)にまたがるこのレプリケーションは、盲点質量がアプリケーション固有のアーティファクトではなく、組合せカバレッジリスクを定量化する一般的なML手法であることを示している。
盲点分解(Blind-spot decomposition)は、どの活動や臨床体制がリスクを支配しているかを特定し、ターゲットデータ収集、正規化/正規化、安全な配置のための物理学またはドメインインフォームド制約に関する実践者に対して実行可能なガイダンスを提供する。
関連論文リスト
- Sparse, self-organizing ensembles of local kernels detect rare statistical anomalies [7.472760645164855]
弱い信号や稀な信号は、通常のデータの明らかな規則性の中に隠され、異常を検出して解釈する能力のギャップを生じさせます。
統計的不均衡領域の周囲の表現空間を適応的に分割する自己組織型ローカルカーネルのクラスを提案する。
本稿では,提案モデルにおける検出と自己組織化を駆動するメカニズムに関する理論的知見を提供し,本手法が現実的な高次元問題に与える影響を実証する。
論文 参考訳(メタデータ) (2025-11-05T00:55:56Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [22.231565523932286]
AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-10-20T11:14:51Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - A Distance-based Anomaly Detection Framework for Deep Reinforcement Learning [33.623558899286635]
深層強化学習(RL)システムでは、異常な状態が予測不能な行動や安全でない行動を引き起こす可能性があり、重大なリスクを引き起こす。
深部RLアルゴリズムのための新しいMahalanobis distance-based anomaly detection framework, textitMDXを提案する。
MDXは、オフラインとオンラインの両方の設定において、ランダム、逆境、およびアウト・オブ・ディストリビューション(OOD)状態のアウトレイラに同時に対処する。
論文 参考訳(メタデータ) (2021-09-21T00:09:03Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - Unifying supervised learning and VAEs -- coverage, systematics and
goodness-of-fit in normalizing-flow based neural network models for
astro-particle reconstructions [0.0]
統計的不確実性、包括性、体系的不確実性、あるいは適度な尺度はしばしば計算されない。
データとラベルの共分散のKL分割の目的は、教師付き学習と変分オートエンコーダの統合を可能にすることを示す。
本稿では,特定の「基本順序」輪郭の数値積分を伴わずにカバレッジ確率を計算する方法について論じる。
論文 参考訳(メタデータ) (2020-08-13T11:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。