論文の概要: Enabling Few-Shot Alzheimer's Disease Diagnosis on Tabular Biomarker Data with LLMs
- arxiv url: http://arxiv.org/abs/2507.23227v1
- Date: Thu, 31 Jul 2025 03:49:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.027297
- Title: Enabling Few-Shot Alzheimer's Disease Diagnosis on Tabular Biomarker Data with LLMs
- Title(参考訳): LLMを用いた口蓋バイオマーカーデータによるFew-Shot Alzheimer病の診断
- Authors: Sophie Kearney, Shu Yang, Zixuan Wen, Bojian Hou, Duy Duong-Tran, Tianlong Chen, Jason Moore, Marylyn Ritchie, Li Shen,
- Abstract要約: 大規模言語モデル(LLM)は、構造化バイオメディカルデータを用いて予測する前例のない機会を提供する。
アルツハイマー病の診断にTableGPT2を適用したTAP-GPT(Tabular Alzheimer's Prediction GPT)と呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 31.886437003289583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Early and accurate diagnosis of Alzheimer's disease (AD), a complex neurodegenerative disorder, requires analysis of heterogeneous biomarkers (e.g., neuroimaging, genetic risk factors, cognitive tests, and cerebrospinal fluid proteins) typically represented in a tabular format. With flexible few-shot reasoning, multimodal integration, and natural-language-based interpretability, large language models (LLMs) offer unprecedented opportunities for prediction with structured biomedical data. We propose a novel framework called TAP-GPT, Tabular Alzheimer's Prediction GPT, that adapts TableGPT2, a multimodal tabular-specialized LLM originally developed for business intelligence tasks, for AD diagnosis using structured biomarker data with small sample sizes. Our approach constructs few-shot tabular prompts using in-context learning examples from structured biomedical data and finetunes TableGPT2 using the parameter-efficient qLoRA adaption for a clinical binary classification task of AD or cognitively normal (CN). The TAP-GPT framework harnesses the powerful tabular understanding ability of TableGPT2 and the encoded prior knowledge of LLMs to outperform more advanced general-purpose LLMs and a tabular foundation model (TFM) developed for prediction tasks. To our knowledge, this is the first application of LLMs to the prediction task using tabular biomarker data, paving the way for future LLM-driven multi-agent frameworks in biomedical informatics.
- Abstract(参考訳): 複雑な神経変性疾患であるアルツハイマー病(AD)の早期かつ正確な診断には、典型的には表形式で表される異種バイオマーカー(例えば、神経イメージング、遺伝的危険因子、認知検査、脳脊髄液タンパク質)の分析が必要である。
フレキシブルな数ショット推論、マルチモーダル統合、自然言語ベースの解釈可能性によって、大規模言語モデル(LLM)は、構造化されたバイオメディカルデータで予測する前例のない機会を提供する。
そこで我々はTAP-GPT(Tabular Alzheimer's Prediction GPT, Tabular Alzheimer's Prediction GPT)と呼ばれる新しいフレームワークを提案する。
提案手法は,AD と認知正常 (CN) の2次分類タスクに対して,パラメータ効率のよい qLoRA 適応法を用いて,構造化バイオメディカルデータとファイントゥネス TableGPT2 からテキスト内学習例を用いて,数発の表型プロンプトを構築した。
TAP-GPTフレームワークは、TableGPT2の強力な表理解能力とLLMの符号化された事前知識を利用して、より高度な汎用LLMと予測タスクのために開発された表基盤モデル(TFM)を上回ります。
我々の知る限り、LLMの表型バイオマーカーデータを用いた予測タスクへの最初の応用であり、バイオメディカルインフォマティクスにおける将来のLCM駆動型マルチエージェントフレームワークへの道を開くものである。
関連論文リスト
- Towards Artificial Intelligence Research Assistant for Expert-Involved Learning [64.7438151207189]
大規模言語モデル (LLMs) と大規模多モードモデル (LMMs) は科学研究における変革的ツールとして登場している。
textbfExpert-involved textbfLearning (ARIEL)のためのtextbfARtificial textbfIntelligence Research Assistantを提案する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - ADAM: An AI Reasoning and Bioinformatics Model for Alzheimer's Disease Detection and Microbiome-Clinical Data Integration [4.693680473621709]
Alzheimer's Disease Analysis Model (ADAM)は、マルチモーダルデータの統合と解析を目的とした多エージェント推論大言語モデル(LLM)フレームワークである。
ADAMは多様なデータソースから洞察を生成し、文献駆動の証拠で結果を文脈化します。
論文 参考訳(メタデータ) (2025-01-14T18:56:33Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Knowledge-Driven Feature Selection and Engineering for Genotype Data with Large Language Models [35.084222907099644]
FREEFORM, Free-flow Reasoning, Ensembling for Enhanced Feature Output and Robust Modeling。
https://github.com/PennShenLab/FREEFORM.com/FreeFORMはGitHubのオープンソースフレームワークとして利用可能だ。
論文 参考訳(メタデータ) (2024-10-02T17:53:08Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - CancerGPT: Few-shot Drug Pair Synergy Prediction using Large Pre-trained
Language Models [3.682742580232362]
大規模事前学習言語モデル(LLM)は、様々な分野にわたる数ショット学習において大きな可能性を秘めている。
我々の研究は、限られたデータを持つまれな組織において、薬物対のシナジー予測に最初に取り組みました。
論文 参考訳(メタデータ) (2023-04-18T02:49:53Z) - Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications [0.0]
本稿では, バイオメディカル問題データセットの k-fold cross-validation (CV) への階層化のための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
論文 参考訳(メタデータ) (2023-03-15T12:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。