論文の概要: A Reproducible Framework for Bias-Resistant Machine Learning on Small-Sample Neuroimaging Data
- arxiv url: http://arxiv.org/abs/2602.02920v1
- Date: Mon, 02 Feb 2026 23:47:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.142632
- Title: A Reproducible Framework for Bias-Resistant Machine Learning on Small-Sample Neuroimaging Data
- Title(参考訳): 小サンプルニューロイメージングデータを用いたバイアス耐性機械学習のための再現可能なフレームワーク
- Authors: Jagan Mohan Reddy Dwarampudi, Jennifer L Purks, Joshua Wong, Renjie Hu, Tania Banerjee,
- Abstract要約: 我々は、ドメインインフォームドな特徴工学、ネストされたクロスバリデーション、小サンプルのニューロイメージングデータに対する調整された決定閾値最適化を統合した再現可能な、バイアス耐性の機械学習フレームワークを導入する。
この研究は、解釈可能性と偏見のない評価を組み合わせることで、データ限定バイオメディカル領域における信頼性の高い機械学習のための一般化可能な計算ブループリントを提供する。
- 参考スコア(独自算出の注目度): 1.2287733479434337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a reproducible, bias-resistant machine learning framework that integrates domain-informed feature engineering, nested cross-validation, and calibrated decision-threshold optimization for small-sample neuroimaging data. Conventional cross-validation frameworks that reuse the same folds for both model selection and performance estimation yield optimistically biased results, limiting reproducibility and generalization. Demonstrated on a high-dimensional structural MRI dataset of deep brain stimulation cognitive outcomes, the framework achieved a nested-CV balanced accuracy of 0.660\,$\pm$\,0.068 using a compact, interpretable subset selected via importance-guided ranking. By combining interpretability and unbiased evaluation, this work provides a generalizable computational blueprint for reliable machine learning in data-limited biomedical domains.
- Abstract(参考訳): 我々は、ドメインインフォームドな特徴工学、ネストされたクロスバリデーション、小サンプルのニューロイメージングデータに対する調整された決定閾値最適化を統合した再現可能な、バイアス耐性の機械学習フレームワークを導入する。
モデル選択と性能推定の両方で同じ折り畳みを再利用する従来のクロスバリデーションフレームワークは、楽観的に偏りがあり、再現性と一般化が制限される。
このフレームワークは、深部脳刺激認知結果の高次元構造的MRIデータセットに基づいて、重要誘導ランキングによって選択されたコンパクトで解釈可能なサブセットを用いて、ネストCVバランスの精度0.660\,$\pm$\,0.068を達成した。
この研究は、解釈可能性と偏見のない評価を組み合わせることで、データ限定バイオメディカル領域における信頼性の高い機械学習のための一般化可能な計算ブループリントを提供する。
関連論文リスト
- Improving Cardiac Risk Prediction Using Data Generation Techniques [37.94487163156369]
本研究は,実世界の観測と整合したリアルな臨床記録の合成のためのアーキテクチャを提案する。
主な目的は、心的リスク予測モデルの性能を高めるため、利用可能なデータセットのサイズと多様性を高めることである。
論文 参考訳(メタデータ) (2025-12-19T10:17:00Z) - Rethinking Convergence in Deep Learning: The Predictive-Corrective Paradigm for Anatomy-Informed Brain MRI Segmentation [30.94379425064039]
本稿では,学習を根本的に加速させるために,モデルタスクを分離するフレームワークである予測補正(PC)パラダイムを紹介する。
PCambaNetは2つの相乗的モジュールから構成される。第一に、予測優先モジュール(PPM)は計算コストの低い粗い近似を生成する。
次に、Corrective Residual Network (CRN)は、残差エラーをモデル化することを学び、ネットワークのフル容量をこれらの課題領域の精製に集中させる。
論文 参考訳(メタデータ) (2025-10-17T08:51:33Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Enhancing Orthopox Image Classification Using Hybrid Machine Learning and Deep Learning Models [40.325359811289445]
本稿では、機械学習モデルと事前訓練されたディープラーニングモデルを組み合わせて、拡張データを必要とせずに、深い特徴表現を抽出する。
その結果, この特徴抽出法は, 最先端技術における他の手法と組み合わせることで, 優れた分類結果が得られることがわかった。
論文 参考訳(メタデータ) (2025-06-06T11:52:07Z) - Neural Corrective Machine Unranking [3.2340528215722553]
正解法を定式化し、新しい教師学生の枠組みである正解法無依存蒸留(CuRD)を提案する。
CuRDは、(訓練された)ニューラルIRモデルを調整することで、その出力関連スコアが低レベルの非検索可能なサンプルを模倣するように、忘れることを容易にする。
トレーニングデータセットの1%と20%のセットサイズを忘れる実験は、CuRDが忘れと修正の点で7つの最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-11-13T12:19:46Z) - Refining Tuberculosis Detection in CXR Imaging: Addressing Bias in Deep Neural Networks via Interpretability [1.9936075659851882]
実験データから完全な分類精度を得ることができたとしても,深層学習モデルの信頼性は限られていると論じる。
大規模プロキシタスクでディープニューラルネットワークを事前トレーニングし、MOON(Mixed objective Optimization Network)を使用することで、モデルとエキスパート間の決定基盤の整合性を改善することができることを示す。
論文 参考訳(メタデータ) (2024-07-19T06:41:31Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。