論文の概要: RobustModelMaker: Coupling Bootstrap Stability Selection with Leakage-Safe Nested Cross-Validation for Scientific Machine Learning
- arxiv url: http://arxiv.org/abs/2606.01566v1
- Date: Mon, 01 Jun 2026 02:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.869632
- Title: RobustModelMaker: Coupling Bootstrap Stability Selection with Leakage-Safe Nested Cross-Validation for Scientific Machine Learning
- Title(参考訳): RobustModelMaker: 科学的機械学習のためのリークセーフネストクロスバリデーションによるブートストラップ安定性の選択の結合
- Authors: Amanda S Barnard,
- Abstract要約: RobustModelMakerは、厳密なネストされたクロスバリデーションで安定性の選択をブートストラップするPythonフレームワークである。
安定性テストされた機能サブセットとリークセーフなパフォーマンス見積を生成する。
バイナリ分類、マルチクラス分類、レグレッションの9つのアルゴリズムをサポートする。
- 参考スコア(独自算出の注目度): 2.0052993723676895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Small-to-medium scientific datasets place machine learning pipelines under two compounding pressures. Single-run feature selection produces feature sets that change substantially under small perturbations of the training data, and any procedure that uses the same data for selection, tuning, and evaluation produces optimistically biased performance estimates. The two failure modes are routinely treated as separable, but in the regimes where scientific data live, they interact: an unstable selection inflates the variance of an already-optimistic score, and standard remedies for one rarely address the other. RobustModelMaker is a Python framework that couples bootstrap stability selection with strict nested cross-validation, performs all preprocessing and selection inside each fold, and produces a stability-tested feature subset together with a leakage-safe performance estimate. The framework supports nine algorithms across binary classification, multiclass classification, and regression. Behaviour is verified by a deterministic test suite spanning unit, performance, and reproducibility checks on three real scientific datasets comparing to three alternative selectors (ANOVA F-test, recursive feature elimination with cross-validation, and Boruta) on both predictive score and a Jaccard measure of selection stability. RobustModelMaker is competitive in score with the best alternative selector on each dataset, and occupies a position on the joint score-stability frontier that none of the alternatives match across all three task types. Two example applications, ovarian cancer biomarker discovery from the PLCO Trial and critical-temperature regression on the UCI Superconductivity Data, illustrate how the framework is used in practice and what trade-offs become visible when stability is treated as a first-class deliverable rather than an emergent property.
- Abstract(参考訳): 小規模な科学データセットは、機械学習パイプラインを2つの複合圧力の下に配置する。
単一実行機能選択は、トレーニングデータの小さな摂動の下で実質的に変化する特徴セットを生成し、同じデータを使って選択、チューニング、評価を行う手順は、楽観的にバイアスのある性能推定を生成する。
不安定な選択は、既に最適化されたスコアのばらつきを膨らませるものであり、一方の標準的な改善は、他方にほとんど対処しない。
RobustModelMakerはPythonフレームワークで、ブートストラップの安定性の選択と厳密なネストされたクロスバリデーションを結合し、各フォルダ内ですべての前処理と選択を実行する。
このフレームワークは、バイナリ分類、マルチクラス分類、レグレッションの9つのアルゴリズムをサポートしている。
3つの代替セレクタ(ANOVA F-test, recursive feature elimination with cross-validation, Boruta)と比較し, 予測スコアとジャカードによる選択安定性の測定値を比較する。
RobustModelMakerは、データセットごとに最適な代替セレクタとスコアを競い合っており、いずれの選択肢も3つのタスクタイプすべてにマッチしない、ジョイントスコア-安定性フロンティアのポジションを占めている。
PLCO試験による卵巣癌バイオマーカーの発見とUCI超伝導データにおける臨界温度回帰の2つの例は、このフレームワークが実際にどのように使われているか、安定性が創発的特性よりも第一級の成果物として扱われる場合のトレードオフがどのようなものになるかを説明するものである。
関連論文リスト
- Multimodal Learning on Low-Quality Data with Conformal Predictive Self-Calibration [72.0672328514289]
マルチモーダル学習は、しばしば低品質データの課題に悩まされる。
コンフォーマル予測自己校正(Conformal Predictive Self-Calibration)と呼ばれる統合フレームワークを提案する。
私たちのフレームワークは、既存の最先端メソッドを一貫して上回ります。
論文 参考訳(メタデータ) (2026-05-05T14:48:52Z) - Reference-Free Rating of LLM Responses via Latent Information [53.463883683503106]
本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。
次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。
ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-29T12:15:52Z) - From Invariant Representations to Invariant Data: Provable Robustness to Spurious Correlations via Noisy Counterfactual Matching [14.679039741833305]
トレーニングデータから急激な相関関係を学習するモデルは、新しい環境にデプロイすると失敗することが多い。
我々は、不変表現の学習から不変データペアの活用へと焦点を移す、データ中心の代替案を提案する。
ノイズの反事実マッチングは、少数の反事実ペアでさえも活用することで、堅牢性を向上させる。
論文 参考訳(メタデータ) (2025-05-30T17:42:32Z) - Optimized Conformal Selection: Powerful Selective Inference After Conformity Score Optimization [4.984656106595651]
本稿では、フレキシブルなデータ駆動モデル最適化後に有効な統計的テスト(選択)を可能にするOptCSを提案する。
我々は,データ再利用が十分であるにもかかわらず,OptCSが正則なp-値を構成する一般的な条件を紹介する。
モデルごとに異なる最適化を行うFDR制御手順を3つ提案する。
論文 参考訳(メタデータ) (2024-11-27T01:40:50Z) - Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [50.6382396309597]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Contrastive Neural Ratio Estimation for Simulation-based Inference [15.354874711988662]
Likelihood-to-evidence ratio Estimation は通常、バイナリ (NRE-A) またはマルチクラス (NRE-B) の分類タスクとしてキャストされる。
バイナリ分類フレームワークとは対照的に、現在のマルチクラスバージョンの定式化は本質的で未知のバイアス項を持つ。
我々は,NRE-Bに固有のバイアスを最適に含まないマルチクラスフレームワークを提案し,実践者が依存する診断を行う立場に置かれる。
論文 参考訳(メタデータ) (2022-10-11T00:12:51Z) - Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。
標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。
選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:20:25Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。