論文の概要: AD-CARE: A Guideline-grounded, Modality-agnostic LLM Agent for Real-world Alzheimer's Disease Diagnosis with Multi-cohort Assessment, Fairness Analysis, and Reader Study
- arxiv url: http://arxiv.org/abs/2603.25322v1
- Date: Thu, 26 Mar 2026 11:10:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.257457
- Title: AD-CARE: A Guideline-grounded, Modality-agnostic LLM Agent for Real-world Alzheimer's Disease Diagnosis with Multi-cohort Assessment, Fairness Analysis, and Reader Study
- Title(参考訳): AD-CARE: マルチコホートアセスメント, フェアネス分析, 読者による現実的アルツハイマー病診断のためのガイドライン付きモダリティ非依存的LLMエージェント
- Authors: Wenlong Hou, Sheng Bi, Guangqian Yang, Lihao Liu, Ye Du, Hanxiao Xue, Juncheng Wang, Yuxiang Feng, Yue Xun, Nanxi Yu, Ning Mao, Mo Yang, Yi Wah Eva Cheung, Ling Long, Kay Chen Tan, Lequan Yu, Xiaomeng Ma, Shaozhen Yan, Shujun Wang,
- Abstract要約: 不完全で不均一な入力からガイドラインに基づく診断を行うモダリティ診断剤であるAD-CAREを導入する。
専門的な診断ツールを動的にオーケストレーションすることにより、AD-CAREは実際の臨床出力と整合した透明なレポートスタイルのアウトプットを生成する。
- 参考スコア(独自算出の注目度): 45.632341143278886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alzheimer's disease (AD) is a growing global health challenge as populations age, and timely, accurate diagnosis is essential to reduce individual and societal burden. However, real-world AD assessment is hampered by incomplete, heterogeneous multimodal data and variability across sites and patient demographics. Although large language models (LLMs) have shown promise in biomedicine, their use in AD has largely been confined to answering narrow, disease-specific questions rather than generating comprehensive diagnostic reports that support clinical decision-making. Here we expand LLM capabilities for clinical decision support by introducing AD-CARE, a modality-agnostic agent that performs guideline-grounded diagnostic assessment from incomplete, heterogeneous inputs without imputing missing modalities. By dynamically orchestrating specialized diagnostic tools and embedding clinical guidelines into LLM-driven reasoning, AD-CARE generates transparent, report-style outputs aligned with real-world clinical workflows. Across six cohorts comprising 10,303 cases, AD-CARE achieved 84.9% diagnostic accuracy, delivering 4.2%-13.7% relative improvements over baseline methods. Despite cohort-level differences, dataset-specific accuracies remain robust (80.4%-98.8%), and the agent consistently outperforms all baselines. AD-CARE reduced performance disparities across racial and age subgroups, decreasing the average dispersion of four metrics by 21%-68% and 28%-51%, respectively. In a controlled reader study, the agent improved neurologist and radiologist accuracy by 6%-11% and more than halved decision time. The framework yielded 2.29%-10.66% absolute gains over eight backbone LLMs and converges their performance. These results show that AD-CARE is a scalable, practically deployable framework that can be integrated into routine clinical workflows for multimodal decision support in AD.
- Abstract(参考訳): アルツハイマー病(alzheimer's disease, AD)は、人口の高齢化に伴う世界的な健康問題であり、タイムリーに言えば、個人の負担と社会的負担を軽減するために、正確な診断が不可欠である。
しかし、現実世界のAD評価は、不完全で異質なマルチモーダルデータと、サイトや患者人口の変動によって妨げられている。
大規模言語モデル(LLM)は生医学において有望であることを示しているが、ADでの使用は、臨床的な意思決定を支援する包括的な診断レポートを生成するのではなく、狭い、病気特有の質問に答えることに限られている。
そこで我々は,不完全で不均一な入力からガイドラインに基づく診断を行うためのモダリティ診断剤であるAD-CAREを導入することで,臨床診断支援のためのLCM機能を拡張した。
専門的な診断ツールを動的にオーケストレーションし、臨床ガイドラインをLLM駆動推論に組み込むことで、AD-CAREは実際の臨床ワークフローに沿った透過的なレポートスタイルのアウトプットを生成する。
10,303例からなる6つのコホートのうち、AD-CAREは84.9%の診断精度を達成し、ベースライン法よりも4.2%-13.7%改善した。
コホートレベルの違いにもかかわらず、データセット固有の精度(80.4%-98.8%)は安定であり、エージェントは一貫して全てのベースラインを上回っている。
AD-CAREは人種と年齢サブグループ間でのパフォーマンス格差を減らし、4つの指標の平均分散を21%-68%、平均分散を28%-51%減らした。
対照研究では、神経科医と放射線科医の精度が6%-11%向上し、判定時間が半減した。
このフレームワークは8基のバックボーン LLM に対して2.29%-10.66% の絶対ゲインを獲得し、その性能を集約した。
これらの結果から,AD-CAREは,ADにおけるマルチモーダル意思決定支援のための日常的な臨床ワークフローに統合可能な,スケーラブルで実用的なデプロイ可能なフレームワークであることが示唆された。
関連論文リスト
- Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.0716204095227]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。
本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。
LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文 参考訳(メタデータ) (2025-09-24T12:37:11Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。