論文の概要: Veridical Data Science for Medical Foundation Models
- arxiv url: http://arxiv.org/abs/2409.10580v1
- Date: Sun, 15 Sep 2024 18:44:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-18 20:59:28.889541
- Title: Veridical Data Science for Medical Foundation Models
- Title(参考訳): 医療ファウンデーションモデルのための検証データ科学
- Authors: Ahmed Alaa, Bin Yu,
- Abstract要約: 新しい基礎モデル(FM)は、データサイエンスの文化的変化をもたらした。
大量の非構造化データに基づいて事前訓練されたFMは、様々な臨床タスクや質問に適応することができる。
この新しいワークフローは、Veridical Data Scienceの原則に挑戦する。
- 参考スコア(独自算出の注目度): 6.5297926209838835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of foundation models (FMs) such as large language models (LLMs) has led to a cultural shift in data science, both in medicine and beyond. This shift involves moving away from specialized predictive models trained for specific, well-defined domain questions to generalist FMs pre-trained on vast amounts of unstructured data, which can then be adapted to various clinical tasks and questions. As a result, the standard data science workflow in medicine has been fundamentally altered; the foundation model lifecycle (FMLC) now includes distinct upstream and downstream processes, in which computational resources, model and data access, and decision-making power are distributed among multiple stakeholders. At their core, FMs are fundamentally statistical models, and this new workflow challenges the principles of Veridical Data Science (VDS), hindering the rigorous statistical analysis expected in transparent and scientifically reproducible data science practices. We critically examine the medical FMLC in light of the core principles of VDS: predictability, computability, and stability (PCS), and explain how it deviates from the standard data science workflow. Finally, we propose recommendations for a reimagined medical FMLC that expands and refines the PCS principles for VDS including considering the computational and accessibility constraints inherent to FMs.
- Abstract(参考訳): 大規模言語モデル(LLM)のような基礎モデル(FM)の出現は、医学とそれ以上のデータ科学に文化的な変化をもたらした。
このシフトは、特定の、明確に定義されたドメイン質問のために訓練された専門的な予測モデルから、大量の非構造化データに基づいて事前訓練されたジェネラリストFMへ移行することで、様々な臨床タスクや質問に適応することができる。
基礎モデルライフサイクル(FMLC)には、計算資源、モデルとデータアクセス、意思決定能力が複数の利害関係者に分散されている。
FMは基本的に統計モデルであり、この新しいワークフローは、透明で科学的に再現可能なデータサイエンスの実践で期待される厳密な統計分析を妨げる、検証データサイエンス(VDS)の原則に挑戦する。
VDSの原理である予測可能性、計算可能性、安定性(PCS)を考慮して医療用FMLCを批判的に検討し、それが標準データサイエンスワークフローからどのように逸脱するかを説明する。
最後に,VDS の PCS 原則を拡張・洗練する医療用 FMLC を提案する。
関連論文リスト
- Open Challenges and Opportunities in Federated Foundation Models Towards Biomedical Healthcare [14.399086205317358]
ファンデーションモデル(FM)は、教師なし事前訓練、自己教師付き学習、微調整の指導、人間のフィードバックからの強化学習など、膨大なデータセットで訓練される。
これらのモデルは、臨床報告、診断画像、マルチモーダル患者間相互作用などの多様なデータフォームの処理を必要とする生体医学的応用に不可欠である。
FLをこれらの洗練されたモデルに組み込むことは、機密性の高い医療データのプライバシーを守りながら、分析能力を活用するという有望な戦略を示す。
論文 参考訳(メタデータ) (2024-05-10T19:22:24Z) - Multimodal Interpretable Data-Driven Models for Early Prediction of
Antimicrobial Multidrug Resistance Using Multivariate Time-Series [6.804748007823268]
本稿では,フエンラブラダ大学附属病院の集中治療室 (ICU) における抗微生物多剤耐性 (AMR) 菌の出現を予測し, 理解することのできる, 解釈可能なマルチモーダルデータ駆動モデルの集合体上に構築したアプローチを提案する。
患者のプロファイルと初期健康状態は静的変数を用いてモデル化され、ICU滞在中の患者の健康状態の進化は、機械的換気や抗生物質摂取を含むいくつかのMSSを用いてモデル化される。
論文 参考訳(メタデータ) (2024-02-09T10:16:58Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Data-Centric Foundation Models in Computational Healthcare: A Survey [21.53211505568379]
AI技術の新たなスイートとしてのファンデーションモデル(FM)は、計算医療の波を巻き起こしている。
我々は、AIセキュリティ、アセスメント、および人間の価値との整合性における重要な視点について議論する。
本報告では,患者の予後と臨床ワークフローを向上するために,FMベースの分析を期待できる展望を提供する。
論文 参考訳(メタデータ) (2024-01-04T08:00:32Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Federated Learning of Medical Concepts Embedding using BEHRT [0.0]
医療概念の埋め込み学習のための連合学習手法を提案する。
我々のアプローチは、EHRのディープニューラルネットワークモデルであるBEHRTのような埋め込みモデルに基づいている。
我々は、FLで訓練されたモデルと集中型データで訓練されたモデルのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2023-05-22T14:05:39Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - Domain Shift in Computer Vision models for MRI data analysis: An
Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。
しかし、現在臨床応用はごくわずかである。
異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文 参考訳(メタデータ) (2020-10-14T16:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。