Fugu-MT 論文翻訳(概要): Beyond Accuracy: A Unified Random Matrix Theory Diagnostic Framework for Crash Classification Models

論文の概要: Beyond Accuracy: A Unified Random Matrix Theory Diagnostic Framework for Crash Classification Models

arxiv url: http://arxiv.org/abs/2602.19528v1
Date: Mon, 23 Feb 2026 05:42:54 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.688947
Title: Beyond Accuracy: A Unified Random Matrix Theory Diagnostic Framework for Crash Classification Models
Title（参考訳）: クラッシュ分類モデルのための統一ランダム行列理論診断フレームワーク
Authors: Ibne Farabi Shihab, Sanjeda Akter, Anuj Sharma,
Abstract要約: ランダム行列理論(RMT)とヘビープレート自己正規化(HTSR)に基づく診断枠組みを導入する。アイオワDOTの2つのクラッシュ分類タスク(173,512,371,062)において,9つのモデルファミリーを評価した。正規化されたモデルは常に$[2, 4]$(平均2.87 pm 0.34$)内で$を出力します。我々は、$$ベースの早期停止基準とスペクトルモデル選択プロトコルを提案し、両者が相互検証されたFに対して検証する。
参考スコア（独自算出の注目度）: 6.908972852063454
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Crash classification models in transportation safety are typically evaluated using accuracy, F1, or AUC, metrics that cannot reveal whether a model is silently overfitting. We introduce a spectral diagnostic framework grounded in Random Matrix Theory (RMT) and Heavy-Tailed Self-Regularization (HTSR) that spans the ML taxonomy: weight matrices for BERT/ALBERT/Qwen2.5, out-of-fold increment matrices for XGBoost/Random Forest, empirical Hessians for Logistic Regression, induced affinity matrices for Decision Trees, and Graph Laplacians for KNN. Evaluating nine model families on two Iowa DOT crash classification tasks (173,512 and 371,062 records respectively), we find that the power-law exponent $α$ provides a structural quality signal: well-regularized models consistently yield $α$ within $[2, 4]$ (mean $2.87 \pm 0.34$), while overfit variants show $α< 2$ or spectral collapse. We observe a strong rank correlation between $α$ and expert agreement (Spearman $ρ= 0.89$, $p < 0.001$), suggesting spectral quality captures model behaviors aligned with expert reasoning. We propose an $α$-based early stopping criterion and a spectral model selection protocol, and validate both against cross-validated F1 baselines. Sparse Lanczos approximations make the framework scalable to large datasets.
Abstract（参考訳）: 交通安全におけるクラッシュ分類モデルは、一般的に、モデルが静かに過度に適合しているかどうかを明らかにすることができない精度、F1、またはAUCを用いて評価される。本稿では,RMT(Random Matrix Theory)とHTSR(Heaved-Tailed Self-Regularization)に基づくスペクトル診断フレームワークを導入する。これはML分類にまたがるもので,BERT/ALBERT/Qwen2.5の重量行列,XGBoost/Random Forestのアウト・オブ・フォールド・インクリメント行列,ロジスティック回帰の経験的ヘッセン,決定木への親和性行列,KNNのグラフラプラシアンである。アイオワ DOT の2つのクラッシュ分類タスク (173,512 と 371,062 レコード) の9つのモデルファミリを評価すると、パワーロー指数 $α$ が構造的品質信号を提供することがわかった: 規則化されたモデルが一貫して$[2, 4]$ (平均 2.87 pm 0.34$) の範囲内で$α$ を出力し、オーバーフィットな変種は$α<2$ またはスペクトル崩壊を示す。我々は、α$と専門家合意(Spearman $ρ= 0.89$, $p < 0.001$)の強いランク相関を観察し、スペクトル品質が専門家の推論に沿ったモデル行動を取得することを示唆する。本稿では,α$の早期停止基準とスペクトルモデル選択プロトコルを提案する。 Sparse Lanczos近似は、フレームワークを大規模データセットにスケーラブルにする。

関連論文リスト

ReLE: A Scalable System and Structured Benchmark for Diagnosing Capability Anisotropy in Chinese LLMs [37.23311145049677]
本稿では,機能異方性(Capability Anisotropy)を診断するためのスケーラブルなシステムであるReLEを提案する。我々は,207,843サンプルからなる領域$times$ Capability SymbolicMatrixの304モデルを評価した。
論文参考訳（メタデータ） (2026-01-24T09:57:59Z)
Spectral Sentinel: Scalable Byzantine-Robust Decentralized Federated Learning via Sketched Random Matrix Theory on Blockchain [0.0]
ビザンチンのクライアントは、不均一な(Non-IID)データの下での濃度勾配を中毒する。本稿では,ビザンチン検出・集約フレームワークであるSpectral Sentinelを提案する。 Polygonネットワーク上でブロックチェーンを統合することで,完全なシステムを実現しています。
論文参考訳（メタデータ） (2025-12-14T09:43:03Z)
Skewness-Robust Causal Discovery in Location-Scale Noise Models [47.09233752567902]
位置スケールノイズモデルに基づく因果発見のための確率に基づくアルゴリズムであるSkewDを提案する。 SkewDは通常の正規分布フレームワークをスキュー正規設定に拡張し、対称性と歪んだ雑音下での信頼性推論を可能にする。我々は、スキューノイズを伴う新しい合成データセットと、確立されたベンチマークデータセットに基づいてSkewDを評価する。
論文参考訳（メタデータ） (2025-11-18T12:40:41Z)
Computational-Statistical Tradeoffs at the Next-Token Prediction Barrier: Autoregressive and Imitation Learning under Misspecification [50.717692060500696]
対数損失を伴う次のトーケン予測は自己回帰シーケンスモデリングの基盤となる。次トーケン予測は、適度な誤差増幅を表す$C=tilde O(H)$を達成するために堅牢にすることができる。 C=e(log H)1-Omega(1)$。
論文参考訳（メタデータ） (2025-02-18T02:52:00Z)
Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文参考訳（メタデータ） (2024-03-08T18:50:19Z)
On the Identifiability and Estimation of Causal Location-Scale Noise Models [122.65417012597754]
位置スケール・異方性雑音モデル(LSNM)のクラスについて検討する。症例によっては, 因果方向が同定可能であることが示唆された。我々は,LSNMの2つの推定器を提案し,その1つは(非線形)特徴写像に基づく推定器と,1つはニューラルネットワークに基づく推定器を提案する。
論文参考訳（メタデータ） (2022-10-13T17:18:59Z)
Developing and Improving Risk Models using Machine-learning Based Algorithms [6.245537312562826]
本研究の目的は,ビジネスの欠陥を分類する優れたリスクモデルを開発することである。この解析の理論的根拠は、まず正則化により良質な基底二項分類器を得ることである。優れたベース分類器上で、バッジやブーストを含む2つのモデルアンサンブルアルゴリズムを実行し、さらなるモデル改善を行う。
論文参考訳（メタデータ） (2020-09-09T20:38:00Z)
The Generalized Lasso with Nonlinear Observations and Generative Priors [63.541900026673055]
我々は、幅広い測定モデルで満たされるガウス下測度を仮定する。この結果から, 局所埋込特性を仮定して, 均一回復保証まで拡張できることが示唆された。
論文参考訳（メタデータ） (2020-06-22T16:43:35Z)
Towards Assessment of Randomized Smoothing Mechanisms for Certifying Adversarial Robustness [50.96431444396752]
主な課題は、各ランダム化メカニズムの適切性を評価する方法である。まず最初に、ガウスのメカニズムが$ell$-normを証明するための適切な選択肢であると結論付ける。驚いたことに、ガウスのメカニズムは指数機構の代わりに$ell_infty$-normを証明するための適切な選択肢でもある。
論文参考訳（メタデータ） (2020-05-15T03:54:53Z)
A Precise High-Dimensional Asymptotic Theory for Boosting and Minimum-$\ell_1$-Norm Interpolated Classifiers [3.167685495996986]
本稿では,分離可能なデータの強化に関する高精度な高次元理論を確立する。統計モデルのクラスでは、ブースティングの普遍性誤差を正確に解析する。また, 推力試験誤差と最適ベイズ誤差の関係を明示的に説明する。
論文参考訳（メタデータ） (2020-02-05T00:24:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。