論文の概要: Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect
- arxiv url: http://arxiv.org/abs/2511.14317v1
- Date: Tue, 18 Nov 2025 10:21:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.048178
- Title: Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect
- Title(参考訳): インターベンション効率と摂動検証フレームワーク:羅生門効果下における容量認識とロバストな臨床モデル選択
- Authors: Yuwen Zhang, Viet Tran, Paul Weng,
- Abstract要約: 同等のパフォーマンスを持つ複数のモデルの共存は、信頼できるデプロイメントと評価に根本的な課題をもたらします。
我々は,頑健なモデルアセスメントと選択のための2つの補完的ツールを提案する: 介入効率(IE)と摂動検証フレームワーク(PVF)。
IEはキャパシティを意識したメトリクスであり、限られた介入しか実現できない場合、モデルが実行可能な真の正をいかに効率的に識別するかを定量化する。
PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
- 参考スコア(独自算出の注目度): 8.16102315566872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In clinical machine learning, the coexistence of multiple models with comparable performance -- a manifestation of the Rashomon Effect -- poses fundamental challenges for trustworthy deployment and evaluation. Small, imbalanced, and noisy datasets, coupled with high-dimensional and weakly identified clinical features, amplify this multiplicity and make conventional validation schemes unreliable. As a result, selecting among equally performing models becomes uncertain, particularly when resource constraints and operational priorities are not considered by conventional metrics like F1 score. To address these issues, we propose two complementary tools for robust model assessment and selection: Intervention Efficiency (IE) and the Perturbation Validation Framework (PVF). IE is a capacity-aware metric that quantifies how efficiently a model identifies actionable true positives when only limited interventions are feasible, thereby linking predictive performance with clinical utility. PVF introduces a structured approach to assess the stability of models under data perturbations, identifying models whose performance remains most invariant across noisy or shifted validation sets. Empirical results on synthetic and real-world healthcare datasets show that using these tools facilitates the selection of models that generalize more robustly and align with capacity constraints, offering a new direction for tackling the Rashomon Effect in clinical settings.
- Abstract(参考訳): 臨床機械学習では、Rashomon効果の現れである同等のパフォーマンスを持つ複数のモデルの共存が、信頼できるデプロイメントと評価に根本的な課題を提起している。
小型で不均衡でノイズの多いデータセットと高次元的かつ弱い臨床特徴を組み合わせることで、この乗法を増幅し、従来の検証スキームを信頼できないものにする。
その結果、F1スコアのような従来の指標ではリソース制約や運用上の優先順位が考慮されない場合、等しく動作するモデルの選択が不確実になる。
これらの問題に対処するため、我々は、頑健なモデル評価と選択のための2つの補完ツール、インターベンション効率(IE)と摂動検証フレームワーク(PVF)を提案する。
IEは、限られた介入しか実現できない場合に、モデルが実行可能な真の正をいかに効果的に識別するかを定量化し、予測性能と臨床ユーティリティをリンクするキャパシティ対応メトリックである。
PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
人工的および現実的な医療データセットの実証的な結果は、これらのツールを使用することで、より堅牢に一般化し、容量制約に適合するモデルの選択が容易になり、臨床環境でのRashomon効果に対処するための新たな方向が提供されることを示している。
関連論文リスト
- A Comparative Study of Controllability, Explainability, and Performance in Dysfluency Detection Models [6.837099592935974]
我々は, YOLO-Stutter, FluentNet, UDM, SSDMの4つの非定常モデリング手法を比較した。
YOLO-StutterとFluentNetは効率とシンプルさを提供するが、透明性は限られている。
UDMは、精度と臨床的解釈可能性の最良のバランスを達成する。
論文 参考訳(メタデータ) (2025-08-25T14:23:09Z) - Beyond the ATE: Interpretable Modelling of Treatment Effects over Dose and Time [46.2482873419289]
本研究では, 治療効果トラジェクトリを線量および時間とともに滑らかな表面としてモデル化する枠組みを提案する。
本研究は, 臨床的に有意な特性の特定から, 軌道形状の推定を分離する。
本手法は, 処理力学の精度, 解釈可能, 編集可能なモデルを生成する。
論文 参考訳(メタデータ) (2025-07-09T20:33:33Z) - Improving Omics-Based Classification: The Role of Feature Selection and Synthetic Data Generation [0.18846515534317262]
本研究では,特徴選択とデータ拡張技術を統合した機械学習に基づく分類フレームワークを提案する。
提案したパイプラインは、小さなデータセット上で、相互に検証されたパーフォマンスが得られることを示す。
論文 参考訳(メタデータ) (2025-05-06T10:09:50Z) - MOSIC: Model-Agnostic Optimal Subgroup Identification with Multi-Constraint for Improved Reliability [11.997050225896679]
そこで本研究では,最適部分群を同定するために,初期制約付き最適化問題を直接解決する統一最適化フレームワークを提案する。
我々の鍵となる革新は、勾配降下勾配アルゴリズムによって解決された、制約のない微分可能な min-max の目的として、制約された原始問題の再構成である。
このフレームワークは、モデルに依存しず、幅広いCATE推定器と互換性があり、コスト制限や公正性基準のような追加の制約への適合性がある。
論文 参考訳(メタデータ) (2025-04-29T16:25:23Z) - Bridging the Generalisation Gap: Synthetic Data Generation for Multi-Site Clinical Model Validation [0.3362278589492841]
既存のモデル評価アプローチは、可用性に制限のある実世界のデータセットに頼っていることが多い。
本稿では, ベンチマークモデル, 公正性, 一般化性の制御されたロバスト性を考慮した, 構造化された合成データフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-29T11:04:28Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Decomposed Adversarial Learned Inference [118.27187231452852]
我々は,DALI(Decomposed Adversarial Learned Inference)という新しいアプローチを提案する。
DALIは、データ空間とコード空間の両方の事前および条件分布を明示的に一致させる。
MNIST, CIFAR-10, CelebAデータセットにおけるDALIの有効性を検証する。
論文 参考訳(メタデータ) (2020-04-21T20:00:35Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。