論文の概要: What Do LLMs Know About Alzheimer's Disease? Fine-Tuning, Probing, and Data Synthesis for AD Detection
- arxiv url: http://arxiv.org/abs/2602.11177v1
- Date: Tue, 20 Jan 2026 22:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-15 14:54:53.72846
- Title: What Do LLMs Know About Alzheimer's Disease? Fine-Tuning, Probing, and Data Synthesis for AD Detection
- Title(参考訳): LLMはアルツハイマー病について何を知っているか : AD検出のための微調整・探究・データ合成
- Authors: Lei Jiang, Yue Zhou, Natalie Parde,
- Abstract要約: 大規模言語モデル(LLM)はドメイン間の強い転送能力を示している。
本研究では,タスク関連情報を内部表現にエンコードする方法について検討する。
我々はシーケンス・ツー・シーケンス・モデルを用いて、構造的に一貫性があり、診断的に有益な合成サンプルを生成する。
- 参考スコア(独自算出の注目度): 18.66759087027059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable early detection of Alzheimer's disease (AD) is challenging, particularly due to limited availability of labeled data. While large language models (LLMs) have shown strong transfer capabilities across domains, adapting them to the AD domain through supervised fine-tuning remains largely unexplored. In this work, we fine-tune an LLM for AD detection and investigate how task-relevant information is encoded within its internal representations. We employ probing techniques to analyze intermediate activations across transformer layers, and we observe that, after fine-tuning, the probing values of specific words and special markers change substantially, indicating that these elements assume a crucial role in the model's improved detection performance. Guided by this insight, we design a curated set of task-aware special markers and train a sequence-to-sequence model as a data-synthesis tool that leverages these markers to generate structurally consistent and diagnostically informative synthetic samples. We evaluate the synthesized data both intrinsically and by incorporating it into downstream training pipelines.
- Abstract(参考訳): アルツハイマー病(AD)の早期診断は,特にラベル付きデータの利用が限られているため困難である。
大規模言語モデル(LLM)はドメイン間で強い転送能力を示してきたが、教師付き微調整によってADドメインに適応することは、ほとんど探索されていない。
本研究では,AD検出のためのLPMを微調整し,その内部表現にタスク関連情報をエンコードする方法を検討する。
我々は, 変圧器層間の中間活性化を解析するための探索手法を採用し, 微調整後, 特定の単語と特別なマーカーの探索値が大きく変化し, これらの要素がモデルによる検出性能の向上に重要な役割を担っていることを示す。
この知見に導かれて、我々は、構造化されたタスク認識特別マーカーセットを設計し、これらのマーカーを活用して、構造的に一貫性があり、診断的に有益な合成サンプルを生成するデータ合成ツールとしてシーケンス・ツー・シーケンスモデルを訓練する。
合成データを本質的に,下流トレーニングパイプラインに組み込むことで評価する。
関連論文リスト
- Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [60.83579255387347]
幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文 参考訳(メタデータ) (2025-04-14T10:06:27Z) - Detecting Dataset Bias in Medical AI: A Generalized and Modality-Agnostic Auditing Framework [8.017827642932746]
データセットに対する一般属性ユーティリティと検出可能性によるバイアステスト(G-AUDIT)は、モダリティに依存しないデータセット監査フレームワークである。
本手法は,患者属性を含むデータ特性とタスクレベルのアノテーションの関係について検討する。
G-AUDITは、従来の定性的手法で見過ごされる微妙な偏見をうまく識別する。
論文 参考訳(メタデータ) (2025-03-13T02:16:48Z) - AD-LLM: Benchmarking Large Language Models for Anomaly Detection [42.48028199802796]
本稿では,大規模な言語モデルが異常検出にどのように役立つかを評価する最初のベンチマークであるAD-LLMを紹介する。
我々は、ゼロショット検出、LLMの事前訓練された知識を用いて、タスク固有のトレーニングなしでADを実行すること、データ拡張、ADモデルを改善するために合成データとカテゴリ記述を生成すること、LLMを使用して教師なしADモデルを提案するモデル選択の3つの主要なタスクについて検討する。
論文 参考訳(メタデータ) (2024-12-15T10:22:14Z) - Diagnosing Alzheimer's Disease using Early-Late Multimodal Data Fusion
with Jacobian Maps [1.5501208213584152]
アルツハイマー病(英語: Alzheimer's disease、AD)は、老化に影響を及ぼす神経変性疾患である。
本稿では,自動特徴抽出とランダム森林のための畳み込みニューラルネットワークを利用する,効率的な早期融合(ELF)手法を提案する。
脳の容積の微妙な変化を検出するという課題に対処するために、画像をヤコビ領域(JD)に変換する。
論文 参考訳(メタデータ) (2023-10-25T19:02:57Z) - Longitudinal detection of new MS lesions using Deep Learning [0.0]
新たなMS病変の検出・分節作業に対処するディープラーニングベースのパイプラインについて述べる。
まず,1つの時間点を用いたセグメンテーションタスクで訓練されたモデルからの移動学習を提案する。
第2に、新しい病変を伴う現実的な縦断時間を生成するためのデータ合成戦略を提案する。
論文 参考訳(メタデータ) (2022-06-16T16:09:04Z) - Data-Efficient and Interpretable Tabular Anomaly Detection [54.15249463477813]
本稿では,ホワイトボックスモデルクラスである一般化付加モデルを適用し,異常を検出する新しいフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
論文 参考訳(メタデータ) (2022-03-03T22:02:56Z) - Encoding Domain Information with Sparse Priors for Inferring Explainable
Latent Variables [2.8935588665357077]
説明可能な因子の推論を促進するために,スパース先行の因子潜在変数モデルであるspex-LVMを提案する。
spex-LVMは、既存の生物医療経路の知識を利用して、潜在因子にアノテート属性を自動的に割り当てる。
シミュレーションおよび実シングルセルRNA-seqデータセットの評価は、本モデルが本質的に説明可能な方法で関連構造を頑健に識別することを示す。
論文 参考訳(メタデータ) (2021-07-08T10:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。