論文の概要: Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments
- arxiv url: http://arxiv.org/abs/2603.12071v1
- Date: Thu, 12 Mar 2026 15:40:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.189774
- Title: Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments
- Title(参考訳): 論文>LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments
- Authors: Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu,
- Abstract要約: 本稿では、縦型T1強調脳MRIを読み取る3次元視覚言語モデルの訓練用パイプラインであるLoV3Dを提案する。
パイプラインは、ラベル一貫性、縦コヒーレンス、生物学的妥当性を強制することで最終的な診断を下す。
被験者レベルのADNIテストセットでは、LoV3Dは3クラスの診断精度が93.7%に達する。
- 参考スコア(独自算出の注目度): 14.481985722970238
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Longitudinal brain MRI is essential for characterizing the progression of neurological diseases such as Alzheimer's disease assessment. However, current deep-learning tools fragment this process: classifiers reduce a scan to a label, volumetric pipelines produce uninterpreted measurements, and vision-language models (VLMs) may generate fluent but potentially hallucinated conclusions. We present LoV3D, a pipeline for training 3D vision-language models, which reads longitudinal T1-weighted brain MRI, produces a region-level anatomical assessment, conducts longitudinal comparison with the prior scan, and finally outputs a three-class diagnosis (Cognitively Normal, Mild Cognitive Impairment, or Dementia) along with a synthesized diagnostic summary. The stepped pipeline grounds the final diagnosis by enforcing label consistency, longitudinal coherence, and biological plausibility, thereby reducing the risks of hallucinations. The training process introduces a clinically-weighted Verifier that scores candidate outputs automatically against normative references derived from standardized volume metrics, driving Direct Preference Optimization without a single human annotation. On a subject-level held-out ADNI test set (479 scans, 258 subjects), LoV3D achieves 93.7% three-class diagnostic accuracy (+34.8% over the no-grounding baseline), 97.2% on two-class diagnosis accuracy (+4% over the SOTA) and 82.6% region-level anatomical classification accuracy (+33.1% over VLM baselines). Zero-shot transfer yields 95.4% on MIRIAD (100% Dementia recall) and 82.9% three-class accuracy on AIBL, confirming high generalizability across sites, scanners, and populations. Code is available at https://github.com/Anonymous-TEVC/LoV-3D.
- Abstract(参考訳): 縦断的脳MRIは、アルツハイマー病などの神経疾患の進行を特徴づけるのに不可欠である。
しかし、現在のディープラーニングツールは、このプロセスを断片化している: 分類器はスキャンをラベルに還元し、ボリュームパイプラインは解釈されていない測定結果を生成し、視覚言語モデル(VLM)は、流動的でハロゲン化の可能性がある結論を生成する。
縦断的T1強調脳MRIを読み、領域レベルの解剖学的評価を行い、前回のスキャンと縦断的な比較を行い、最終的に3段階の診断(認知正常、軽度認知障害、認知症)を合成診断概要とともに出力する3次元視覚言語モデルの訓練用パイプラインであるLoV3Dを提案する。
ステップパイプラインは、ラベル一貫性、長手コヒーレンス、生物学的妥当性を強制することにより最終診断を下し、幻覚のリスクを低減する。
トレーニングプロセスでは、標準化されたボリュームメトリクスから派生した規範的基準に対して、候補出力を自動的にスコアする、臨床重み付き検証を導入し、単一の人間のアノテーションなしで直接優先度最適化を駆動する。
被験者レベルのADNIテストセット(479スキャン、258被験者)では、LoV3Dは3クラス診断精度93.7%(非接地ベースラインより+34.8%)、2クラス診断精度97.2%(SOTAより+4%)、領域レベルの解剖学的分類精度82.6%(VLMベースラインより+33.1%)を達成している。
ゼロショット転送はMIRIAD (100% Dementia recall) で95.4%、AIBLで82.9%の精度で行われ、サイト、スキャナー、人口間で高い一般化性が確認されている。
コードはhttps://github.com/Anonymous-TEVC/LoV-3Dで入手できる。
関連論文リスト
- An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - Focal Cortical Dysplasia Type II Detection Using Cross Modality Transfer Learning and Grad-CAM in 3D-CNNs for MRI Analysis [0.0]
焦点性皮質異形成症(FCD)II型は薬剤抵抗性てんかんの主要な原因であり、手術でのみ治癒することが多い。
臨床的に重要であるにもかかわらず、MRIでは微妙な異常が原因でFCDの診断は非常に困難であり、誤診に繋がる。
本研究では,T1強調MRIとFLAIRMRIを用いた170名の被験者(85名のFCD患者と85名のコントロール)のデータセットを用いて,FCD検出における3次元畳み込みニューラルネットワークの使用について検討した。
論文 参考訳(メタデータ) (2025-04-10T14:15:16Z) - AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [43.06293430764841]
本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。
提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。
ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文 参考訳(メタデータ) (2024-07-02T16:44:00Z) - Towards a Holistic Framework for Multimodal Large Language Models in Three-dimensional Brain CT Report Generation [42.06416052431378]
2Dラジオグラフィーキャプションは、ボリューム3D解剖学における現実の診断課題を反映するものではない。
我々は18,885組の3D-BrainCTデータセットを収集し,臨床ビジュアルインストラクション・チューニングを用いて,脳波モデルを用いて放射線治療を施した3D脳CTレポートを作成した。
私たちの研究は、3Dの脳CTデータセットのキュレーション、微調整による解剖学的意味のある言語モデル、堅牢な放射線学評価指標の提案など、総合的な枠組みを具現化したものです。
論文 参考訳(メタデータ) (2024-07-02T12:58:35Z) - Development of a Deep Learning Method to Identify Acute Ischemic Stroke
Lesions on Brain CT [38.06921198677509]
ディープラーニング技術は、自動化されたCT脳スキャンアセスメントを提供することができるが、通常は注釈付き画像を必要とする。
我々は,第3回国際ストローク裁判(IST-3)のCT脳スキャンを用いた畳み込みニューラルネットワークを用いたDLアルゴリズムを設計した。
DL法は病変の有無と側方で72%の精度が得られた。
論文 参考訳(メタデータ) (2023-09-29T15:28:16Z) - Sparse Dynamical Features generation, application to Parkinson's Disease
diagnosis [0.0]
本稿では,脳波の動的,頻度,時間的内容を用いて脳の機能に着想を得た新しいアプローチを提案する。
本手法は,N=50名の被験者を含む3眼球聴覚タスク中に記録された脳波信号を含む公開データセットを用いて評価し,そのうち25名がPDに罹患した。
論文 参考訳(メタデータ) (2022-10-20T22:39:29Z) - Spatio-spectral deep learning methods for in-vivo hyperspectral
laryngeal cancer detection [49.32653090178743]
頭頸部腫瘍の早期発見は患者の生存に不可欠である。
ハイパースペクトルイメージング(HSI)は頭頸部腫瘍の非侵襲的検出に用いられる。
HSIに基づく喉頭癌診断のための複数の深層学習手法を提案する。
論文 参考訳(メタデータ) (2020-04-21T17:07:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。