論文の概要: MedFeat: Model-Aware and Explainability-Driven Feature Engineering with LLMs for Clinical Tabular Prediction
- arxiv url: http://arxiv.org/abs/2603.02221v1
- Date: Tue, 10 Feb 2026 15:05:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.083919
- Title: MedFeat: Model-Aware and Explainability-Driven Feature Engineering with LLMs for Clinical Tabular Prediction
- Title(参考訳): MedFeat: LLMを用いたモデル認識と説明可能性駆動型機能工学
- Authors: Zizheng Zhang, Yiming Li, Justin Xu, Jinyu Wang, Rui Wang, Lei Song, Jiang Bian, David W Eyre, Jingjing Fu,
- Abstract要約: フィードバック駆動でモデル対応の機能エンジニアリングフレームワークであるMedFeatを紹介します。
MedFeatは、下流モデルがその特性のために直接学習することが難しい情報信号の優先順位付けを行う。
様々なベースラインを安定的に改善し、分布シフトの下で一般化する臨床的に意味のある特徴を発見する。
- 参考スコア(独自算出の注目度): 35.51886877273642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In healthcare tabular predictions, classical models with feature engineering often outperform neural approaches. Recent advances in Large Language Models enable the integration of domain knowledge into feature engineering, offering a promising direction. However, existing approaches typically rely on a broad search over predefined transformations, overlooking downstream model characteristics and feature importance signals. We present MedFeat, a feedback-driven and model-aware feature engineering framework that leverages LLM reasoning with domain knowledge and provides feature explanations based on SHAP values while tracking successful and failed proposals to guide feature discovery. By incorporating model awareness, MedFeat prioritizes informative signals that are difficult for the downstream model to learn directly due to its characteristics. Across a broad range of clinical prediction tasks, MedFeat achieves stable improvements over various baselines and discovers clinically meaningful features that generalize under distribution shift, demonstrating robustness across years and from ICU cohorts to general hospitalized patients, thereby offering insights into real-world deployment. Code required to reproduce our experiments will be released, subject to dataset agreements and institutional policies.
- Abstract(参考訳): 医療表の予測では、機能工学を持つ古典的なモデルは、しばしば神経アプローチよりも優れている。
大規模言語モデルの最近の進歩は、ドメイン知識を機能工学に統合し、有望な方向性を提供する。
しかし、既存のアプローチは通常、下流モデルの特徴と特徴的重要信号を見渡すために、事前定義された変換よりも広い探索に依存している。
MedFeatは、LLM推論とドメイン知識を活用し、SHAP値に基づいた機能説明を提供する。
モデル認識を取り入れることで、MedFeatは、下流モデルがその特性のために直接学習することが難しい情報信号の優先順位付けを行う。
幅広い臨床予測タスクにおいて、MedFeatは、様々なベースラインを安定的に改善し、分布シフトの下で一般化する臨床的に有意義な特徴を発見し、何年もの間、ICUコホートから一般的な入院患者への堅牢性を示す。
私たちの実験を再現するために必要なコードは、データセットの合意と制度的なポリシーに従ってリリースされます。
関連論文リスト
- nnMIL: A generalizable multiple instance learning framework for computational pathology [11.640858438464159]
nnMILは、パッチレベルの基礎モデルと堅牢なスライドレベルの臨床推論を結びつける学習フレームワークである。
nnMILは、疾患診断、組織学的サブタイプ、分子バイオマーカー検出、パンガン予後予測において、既存のMIL法よりも一貫して優れていた。
結論として、nnMILは、病理基盤モデルを臨床的に有意義な予測に翻訳するための実用的で一般化可能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-11-18T20:56:37Z) - Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [40.35825564674249]
本研究では,基礎モデルにおける伝達学習戦略の堅牢性と効率性を評価するための最初の構造化されたベンチマークを紹介する。
新型コロナウイルス(COVID-19)の胸部X線データセットが4つ使用されており、死亡率、重症度、入院率をカバーしている。
一般またはバイオメディカルデータセットで事前訓練されたImageNetとFMで事前訓練されたCNNは、完全な微調整、線形探索、パラメータ効率のよい手法を用いて適応された。
論文 参考訳(メタデータ) (2025-06-23T09:16:04Z) - Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Intensive Care as One Big Sequence Modeling Problem [1.6114012813668932]
本稿では、患者と医療提供者とのインタラクションをイベントストリームとして表現する、シーケンスモデリングとしてのヘルスケアのパラダイムを提案する。
我々はMIMIC-IVデータセットから一様イベントストリームフォーマットに異種臨床記録を変換したシーケンスモデリングベンチマークMIMIC-SEQを開発した。
論文 参考訳(メタデータ) (2024-02-27T13:36:55Z) - Meta Transfer of Self-Supervised Knowledge: Foundation Model in Action
for Post-Traumatic Epilepsy Prediction [0.6291443816903801]
基礎モデルに新たなトレーニング戦略を導入する。
提案手法は,小規模臨床データセットのタスク性能を著しく向上することを示す。
さらに, 基礎モデルの一般化性の向上を実証した。
論文 参考訳(メタデータ) (2023-12-21T07:42:49Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。