論文の概要: Evidence Sufficiency Under Delayed Ground Truth: Proxy Monitoring for Risk Decision Systems
- arxiv url: http://arxiv.org/abs/2604.15740v1
- Date: Fri, 17 Apr 2026 06:30:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.766676
- Title: Evidence Sufficiency Under Delayed Ground Truth: Proxy Monitoring for Risk Decision Systems
- Title(参考訳): 遅れた地中真実の証拠:リスク判定システムのプロキシモニタリング
- Authors: Oleg Solozobov,
- Abstract要約: 本稿では,4次元(完全性,新鮮性,信頼性,代表性)と意思決定対応ゲートを備えたエビデンスモデルの定式化を行う。
補完的なプロキシインジケータフレームワークは、ラベルなしで十分劣化を推定する。
このフレームワークは、ガバナンスの十分な監視手段に貢献している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning systems in fraud detection, credit scoring, and clinical risk assessment operate under delayed ground truth: outcome labels arrive days to months after the decision they evaluate. During this blind period, governance evidence degrades through mechanisms that neither drift detection methods nor governance frameworks adequately address. This paper formalizes an evidence sufficiency model with four dimensions (completeness, freshness, reliability, representativeness) and a decision-readiness gate that quantifies how label latency degrades evidence quality. The model maps three drift types to dimension-specific degradation trajectories. A complementary proxy indicator framework comprising seven measurement categories estimates sufficiency degradation without labels, with explicit coverage mapping and characterized blind spots per drift type. Evaluation on the IEEE-CIS Fraud Detection dataset (~590K transactions) with controlled drift injection shows that composite proxy monitoring detects covariate and mixed drift with 100% detection rate, while concept drift without feature change remains undetected -- consistent with the theoretical impossibility of unsupervised detection when P(X) is unchanged. Blind period simulation confirms monotone sufficiency degradation, with concept drift degrading fastest (S=0.242 at day 60 vs 0.418 for no-drift). The framework contributes a governance sufficiency monitoring instrument; its value lies in translating drift signals into auditable sufficiency assessments with characterized blind spots. Mapping sufficiency levels to governance actions requires deployment-specific calibration beyond this study's scope.
- Abstract(参考訳): 不正検出、信用スコアリング、臨床リスク評価の機械学習システムは、遅れた真実の下で運用される。
この盲目な期間に、ガバナンスのエビデンスは、ドリフト検出方法やガバナンスフレームワークが適切に対応していないメカニズムを通じて低下します。
本稿では,4次元(完全性,新鮮性,信頼性,代表性)のエビデンス十分性モデルと,ラベルの遅延によるエビデンス品質の劣化を定量化する決定対応ゲートを定式化する。
モデルは3つのドリフトタイプを次元特異的な劣化軌跡にマッピングする。
7つの測定カテゴリからなる相補的プロキシインジケータフレームワークは,ラベルを含まない十分劣化を推定し,明示的なカバレッジマッピングとドリフトタイプ毎の盲点を特徴付ける。
制御ドリフトインジェクションによるIEEE-CISフラッド検出データセット(~590Kトランザクション)の評価では、複合プロキシ監視が100%検出率で共変量と混合ドリフトを検出し、機能変更のないコンセプトドリフトは未検出のままである。
ブラインド周期シミュレーションはモノトン飽和度劣化を確認し、コンセプトドリフトの速度は60日目のS=0.242と0.418)。
このフレームワークは,ドリフト信号から視覚的視覚障害者評価への変換に有効である。
満足度レベルをガバナンス行動にマッピングするには、この研究の範囲を超えて、デプロイメント固有のキャリブレーションが必要です。
関連論文リスト
- Cognitive Friction: A Decision-Theoretic Framework for Bounded Deliberation in Tool-Using Agents [0.0]
制約のないツール使用エージェントは、どの情報ソースをクエリして実行するかを決めなければなりません。
本稿では,これらの障害モードを認知的摩擦によって形式化する決定論的枠組みであるTCAを提案する。
我々は,TCAを2つの制御された環境において,停止品質,混雑時の行動選択,時間的緊急性の分離を図った。
論文 参考訳(メタデータ) (2026-03-31T17:30:25Z) - DriftGuard: A Hierarchical Framework for Concept Drift Detection and Remediation in Supply Chain Forecasting [0.0]
現在の業界慣行は、3~6ヶ月ごとに手動の監視と定期的な再訓練に依存している。
DriftGuardは、早期にドリフトを検出し、その根本原因を説明し、影響を受けるモデルを自動的に修正するエンド・ツー・エンドのシステムである。
論文 参考訳(メタデータ) (2026-01-13T19:08:11Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - A Neighbor-Searching Discrepancy-based Drift Detection Scheme for Learning Evolving Data [40.00357483768265]
本研究では,Nighbor-Searching Discrepancyに基づく新しい概念ドリフト検出手法を提案する。
提案手法は,仮想ドリフトを無視しながら,実概念ドリフトを高精度に検出することができる。
また、ある階級の侵略や撤退を特定することで、分類境界の変化の方向を示すこともできる。
論文 参考訳(メタデータ) (2024-05-23T04:03:36Z) - An Empirical Study of Uncertainty Estimation Techniques for Detecting
Drift in Data Streams [4.818865062632567]
本研究では,ドリフト検出における誤差率の代用として不確実性値を用いた総合的な実験的検討を行った。
実世界の7つのデータセットにまたがるADWIN検出器を用いた5つの不確実性推定手法について検討した。
その結果、SWAG法はキャリブレーションが優れているが、ドリフト検出の全体的な精度は不確実性推定法の選択によって顕著に影響しないことが明らかとなった。
論文 参考訳(メタデータ) (2023-11-22T13:17:55Z) - Uncertainty-aware Unsupervised Multi-Object Tracking [33.53331700312752]
教師なしマルチオブジェクトトラッカーは、信頼できる機能埋め込みの学習に劣る。
最近の自己監督技術は採用されているが、時間的関係を捉えられなかった。
本稿では、不確実性問題は避けられないが、不確実性自体を活用して学習された一貫性を向上させることができると論じる。
論文 参考訳(メタデータ) (2023-07-28T09:03:06Z) - Tracking the risk of a deployed model and detecting harmful distribution
shifts [105.27463615756733]
実際には、デプロイされたモデルのパフォーマンスが大幅に低下しないという、良心的なシフトを無視することは理にかなっている。
我々は,警告を発射する有効な方法は,(a)良性な警告を無視しながら有害なシフトを検知し,(b)誤報率を増大させることなく,モデル性能の連続的なモニタリングを可能にすることを論じる。
論文 参考訳(メタデータ) (2021-10-12T17:21:41Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。