論文の概要: Cross-Modal Fine-Tuning of 3D Convolutional Foundation Models for ADHD Classification with Low-Rank Adaptation
- arxiv url: http://arxiv.org/abs/2511.06163v1
- Date: Sat, 08 Nov 2025 23:29:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.786563
- Title: Cross-Modal Fine-Tuning of 3D Convolutional Foundation Models for ADHD Classification with Low-Rank Adaptation
- Title(参考訳): 低ランク適応型ADHD分類のための3次元畳み込み基礎モデルのクロスモーダル微調整
- Authors: Jyun-Ping Kao, Shinyeong Rho, Shahar Lazarev, Hyun-Hae Cho, Fangxu Xing, Taehoon Shin, C. -C. Jay Kuo, Jonghye Woo,
- Abstract要約: 小児の注意欠陥・高活動障害(ADHD)の早期診断は、教育と精神保健の成果を改善する上で重要な役割を担っている。
我々は,MRIに基づくADHD分類タスクに対して,CT画像上で事前訓練された大規模3次元畳み込み基盤モデルを適用する,パラメータ効率のよい移動学習手法を提案する。
提案手法では, 3次元畳み込みカーネルを2次元低ランク更新に分解し, トレーニング可能なパラメータを劇的に削減し, 優れた性能を実現する。
- 参考スコア(独自算出の注目度): 21.53698715497362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early diagnosis of attention-deficit/hyperactivity disorder (ADHD) in children plays a crucial role in improving outcomes in education and mental health. Diagnosing ADHD using neuroimaging data, however, remains challenging due to heterogeneous presentations and overlapping symptoms with other conditions. To address this, we propose a novel parameter-efficient transfer learning approach that adapts a large-scale 3D convolutional foundation model, pre-trained on CT images, to an MRI-based ADHD classification task. Our method introduces Low-Rank Adaptation (LoRA) in 3D by factorizing 3D convolutional kernels into 2D low-rank updates, dramatically reducing trainable parameters while achieving superior performance. In a five-fold cross-validated evaluation on a public diffusion MRI database, our 3D LoRA fine-tuning strategy achieved state-of-the-art results, with one model variant reaching 71.9% accuracy and another attaining an AUC of 0.716. Both variants use only 1.64 million trainable parameters (over 113x fewer than a fully fine-tuned foundation model). Our results represent one of the first successful cross-modal (CT-to-MRI) adaptations of a foundation model in neuroimaging, establishing a new benchmark for ADHD classification while greatly improving efficiency.
- Abstract(参考訳): 小児の注意欠陥・高活動障害(ADHD)の早期診断は、教育と精神保健の成果を改善する上で重要な役割を担っている。
しかし、神経画像データを用いたADHDの診断は、異質な提示と他の症状と重なり合うため、依然として困難である。
そこで本研究では,CT画像上で事前学習した大規模3次元畳み込み基盤モデルをMRIに基づくADHD分類タスクに適用する,パラメータ効率のよい移動学習手法を提案する。
提案手法では, 3次元畳み込みカーネルを2次元低ランク更新に分解し, トレーニング可能なパラメータを劇的に削減し, 優れた性能を実現する。
公開拡散MRIデータベース上での5倍のクロスバリデーション評価では、3D LoRAファインチューニング戦略が最先端の結果を達成し、1つのモデル変種が71.9%、もう1つのAUCが0.716に達した。
どちらも1.64万のトレーニング可能なパラメータしか使用していない(完全に微調整された基礎モデルよりも113倍少ない)。
本研究は,脳神経画像診断における基礎モデル(CT-to-MRI)の適応が成功し,ADHD分類のための新しいベンチマークが確立され,効率が大幅に向上したことを示す。
関連論文リスト
- Beyond Data Scarcity Optimizing R3GAN for Medical Image Generation from Small Datasets [0.044780965967547055]
本研究では,GAN(Generative Adversarial Network)を小さなデータセットに最適化して,現実的かつ診断的に意味のある画像を生成する方法について検討する。
R3GANによる体系的な実験に基づいて,効率的なトレーニング戦略を確立し,256x256解像度データセットの最適化構成を設計した。
生成したサンプルは、不均衡な胚のデータセットのバランスをとるために使用され、分類性能が大幅に向上した。
論文 参考訳(メタデータ) (2025-10-29T13:03:36Z) - 3DViT-GAT: A Unified Atlas-Based 3D Vision Transformer and Graph Learning Framework for Major Depressive Disorder Detection Using Structural MRI Data [0.0]
大うつ病 (Major depressive disorder, MDD) は、個人の健康と世界的な公衆衛生の両方に悪影響を及ぼす精神疾患である。
本稿では、視覚変換器(ViT)を用いて、sMRIデータから3次元領域埋め込みを抽出し、グラフニューラルネットワーク(GNN)を分類する統合パイプラインを開発する。
論文 参考訳(メタデータ) (2025-09-15T17:10:39Z) - Towards a general-purpose foundation model for fMRI analysis [58.06455456423138]
我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-06-11T23:51:01Z) - 3D Brain MRI Classification for Alzheimer Diagnosis Using CNN with Data Augmentation [0.0]
3次元畳み込みニューラルネットワークは、T1強調脳スキャンを健康またはアルツハイマーと分類するために開発された。
ネットワークは、3D畳み込み、プーリング、バッチ正規化、密度の高いReLU層、シグモイド出力を含む。
論文 参考訳(メタデータ) (2025-05-07T03:32:25Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Video and Synthetic MRI Pre-training of 3D Vision Architectures for
Neuroimage Analysis [3.208731414009847]
トランスファーラーニングは、特定のタスクに適応するために、大規模なデータコーパスでディープラーニングモデルを事前訓練することを含む。
視覚変換器 (ViTs) と畳み込みニューラルネットワーク (CNNs) のベンチマークを行った。
得られた事前訓練されたモデルは、ターゲットタスクのトレーニングデータが制限されている場合でも、さまざまな下流タスクに適応することができる。
論文 参考訳(メタデータ) (2023-09-09T00:33:23Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Deep Implicit Statistical Shape Models for 3D Medical Image Delineation [47.78425002879612]
解剖学的構造の3次元デライン化は、医用画像解析の基本的な目標である。
ディープラーニング以前は、解剖学的制約を課し高品質の表面を作り出す統計的形状モデルはコア技術だった。
我々は,CNNの表現力とSSMの頑健さを合体させるデライン化の新しい手法であるディープ暗黙的統計的形状モデル(DISSMs)を提案する。
論文 参考訳(メタデータ) (2021-04-07T01:15:06Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。