論文の概要: Multimodal Foundation Models for Early Disease Detection
- arxiv url: http://arxiv.org/abs/2510.01899v1
- Date: Thu, 02 Oct 2025 11:12:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.099097
- Title: Multimodal Foundation Models for Early Disease Detection
- Title(参考訳): 早期疾患検出のためのマルチモーダル基礎モデル
- Authors: Md Talha Mohsin, Ismail Abdulrashid,
- Abstract要約: 本稿では、注意に基づくトランスフォーマーフレームワークを通じて、多様な患者データを統合する基礎モデルを提案する。
このアーキテクチャは、多くのタスクを事前トレーニングするために作られており、新しい病気やデータセットへの適応を、余分な作業で簡単に行える。
我々は、早期検出タスクのテストを目的として、腫瘍学、心臓学、神経学のベンチマークデータセットを使用する実験戦略を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Healthcare generates diverse streams of data, including electronic health records (EHR), medical imaging, genetics, and ongoing monitoring from wearable devices. Traditional diagnostic models frequently analyze these sources in isolation, which constrains their capacity to identify cross-modal correlations essential for early disease diagnosis. Our research presents a multimodal foundation model that consolidates diverse patient data through an attention-based transformer framework. At first, dedicated encoders put each modality into a shared latent space. Then, they combine them using multi-head attention and residual normalization. The architecture is made for pretraining on many tasks, which makes it easy to adapt to new diseases and datasets with little extra work. We provide an experimental strategy that uses benchmark datasets in oncology, cardiology, and neurology, with the goal of testing early detection tasks. The framework includes data governance and model management tools in addition to technological performance to improve transparency, reliability, and clinical interpretability. The suggested method works toward a single foundation model for precision diagnostics, which could improve the accuracy of predictions and help doctors make decisions.
- Abstract(参考訳): 医療は、電子健康記録(EHR)、医療画像、遺伝学、ウェアラブルデバイスからの監視など、さまざまなデータストリームを生成する。
従来の診断モデルは、しばしばこれらのソースを分離して分析し、早期の疾患診断に不可欠な相互相関を識別する能力を制限する。
本研究は,集中型トランスフォーマー・フレームワークを用いて,多様な患者データを統合したマルチモーダル基盤モデルを提案する。
最初、専用エンコーダはそれぞれのモダリティを共有潜在空間に配置した。
そして、これらをマルチヘッドアテンションと残差正規化を用いて組み合わせる。
このアーキテクチャは、多くのタスクを事前トレーニングするために作られており、新しい病気やデータセットへの適応を、余分な作業で簡単に行える。
我々は、早期検出タスクのテストを目的として、腫瘍学、心臓学、神経学のベンチマークデータセットを使用する実験戦略を提供する。
このフレームワークには、透明性、信頼性、臨床解釈性を改善するための技術パフォーマンスに加えて、データガバナンスとモデル管理ツールが含まれている。
提案手法は, 精度診断のための単一基礎モデルに向けて機能し, 予測精度を向上し, 医師の意思決定を支援する。
関連論文リスト
- RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - Federated Foundation Model for GI Endoscopy Images [7.9528382609447545]
ファンデーションモデルは汎用表現を学習することで有望なソリューションを提供する。
ファンデーションモデルトレーニングは通常、広範なデータセットを必要とし、病院は大量のデータを生成するが、プライバシー制限は直接的なデータ共有を妨げている。
本稿では,腹腔鏡画像の基礎モデルをトレーニングするためのFLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T01:18:17Z) - A Vector-Quantized Foundation Model for Patient Behavior Monitoring [41.48188433408574]
本稿では,スマートフォンやウェアラブルデバイスからの実世界のデータを処理するために設計されたベクトル量子化変分自動エンコーダを改良した基礎モデルを提案する。
本研究では, 個別の潜伏表現を利用して, 微調整を必要とせず, 2つの下流課題, 自殺リスク評価, 情緒的状態予測を効果的に実施した。
論文 参考訳(メタデータ) (2025-03-19T14:01:16Z) - Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - A Transformer-based representation-learning model with unified
processing of multimodal input for clinical diagnostics [63.106382317917344]
本稿では,マルチモーダル入力を統一的に処理する臨床診断支援として,トランスフォーマーを用いた表現学習モデルについて報告する。
統一モデルは, 肺疾患の同定において, 画像のみのモデル, 非統一型マルチモーダル診断モデルより優れていた。
論文 参考訳(メタデータ) (2023-06-01T16:23:47Z) - MMLN: Leveraging Domain Knowledge for Multimodal Diagnosis [10.133715767542386]
肺疾患診断のための知識駆動型およびデータ駆動型フレームワークを提案する。
本研究は, 臨床医学ガイドラインに従って診断規則を定式化し, テキストデータから規則の重みを学習する。
テキストと画像データからなるマルチモーダル融合は、肺疾患の限界確率を推定するために設計されている。
論文 参考訳(メタデータ) (2022-02-09T04:12:30Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。