論文の概要: DinoAtten3D: Slice-Level Attention Aggregation of DinoV2 for 3D Brain MRI Anomaly Classification
- arxiv url: http://arxiv.org/abs/2509.12512v1
- Date: Mon, 15 Sep 2025 23:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.809026
- Title: DinoAtten3D: Slice-Level Attention Aggregation of DinoV2 for 3D Brain MRI Anomaly Classification
- Title(参考訳): DinoAtten3D : 3次元脳MRI異常分類のためのDinoV2のスライスレベルアテンションアグリゲーション
- Authors: Fazle Rafsani, Jay Shah, Catherine D. Chong, Todd J. Schwedt, Teresa Wu,
- Abstract要約: 医用画像の異常検出と分類は早期診断には重要であるが, 注釈付きデータ, クラス不均衡, 専門家によるラベル付けのコストが高いため, 依然として困難である。
本稿では,3次元画像異常分類に特化して,注目に基づくグローバルアグリゲーションフレームワークを提案する。
- 参考スコア(独自算出の注目度): 2.731729370870452
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Anomaly detection and classification in medical imaging are critical for early diagnosis but remain challenging due to limited annotated data, class imbalance, and the high cost of expert labeling. Emerging vision foundation models such as DINOv2, pretrained on extensive, unlabeled datasets, offer generalized representations that can potentially alleviate these limitations. In this study, we propose an attention-based global aggregation framework tailored specifically for 3D medical image anomaly classification. Leveraging the self-supervised DINOv2 model as a pretrained feature extractor, our method processes individual 2D axial slices of brain MRIs, assigning adaptive slice-level importance weights through a soft attention mechanism. To further address data scarcity, we employ a composite loss function combining supervised contrastive learning with class-variance regularization, enhancing inter-class separability and intra-class consistency. We validate our framework on the ADNI dataset and an institutional multi-class headache cohort, demonstrating strong anomaly classification performance despite limited data availability and significant class imbalance. Our results highlight the efficacy of utilizing pretrained 2D foundation models combined with attention-based slice aggregation for robust volumetric anomaly detection in medical imaging. Our implementation is publicly available at https://github.com/Rafsani/DinoAtten3D.git.
- Abstract(参考訳): 医用画像の異常検出と分類は早期診断には重要であるが, 注釈付きデータ, クラス不均衡, 専門家によるラベル付けのコストが高いため, 依然として困難である。
DINOv2のような、広範囲でラベル付けされていないデータセットで事前訓練された新しいビジョン基盤モデルは、これらの制限を緩和する可能性のある一般化された表現を提供する。
本研究では,3次元画像異常分類に適した注意に基づくグローバルアグリゲーションフレームワークを提案する。
自己教師付きDINOv2モデルを事前訓練した特徴抽出器として活用し,脳MRIの個々の2次元軸スライスを処理し,ソフトアテンション機構を通じて適応スライスレベルの重み付けを行う。
データ不足に対処するために、教師付きコントラスト学習とクラス分散正規化を組み合わせた複合損失関数を用い、クラス間分離性とクラス内整合性を向上させる。
我々はADNIデータセットと機関的な多階級の頭痛コホートに関する枠組みを検証し,データ可用性に限界があるにもかかわらず,強い異常分類性能を示した。
本研究は,2次元基礎モデルと注意に基づくスライスアグリゲーションを併用した医用画像診断におけるロバストボリューム異常検出の有用性について検討した。
私たちの実装はhttps://github.com/Rafsani/DinoAtten3D.git.comで公開されています。
関連論文リスト
- Self-Supervised Cross-Encoder for Neurodegenerative Disease Diagnosis [6.226851122403944]
縦型MRIスキャンにおける時間的連続性を利用した自己監督型クロスエンコーダフレームワークを提案する。
このフレームワークは、学習した表現を2つのコンポーネントに分解する: 静的表現は、対照的な学習によって制約され、安定した解剖学的特徴を捉え、動的表現は、時間的変化を反映する入力漸進正規化によってガイドされる。
アルツハイマー病神経画像イニシアチブデータセットの実験結果から,本手法は分類精度が向上し,解釈性が向上することが示された。
論文 参考訳(メタデータ) (2025-09-09T11:52:24Z) - Unified Supervision For Vision-Language Modeling in 3D Computed Tomography [1.4193731654133002]
汎用視覚言語モデル(VLM)は放射線学において有望なツールとして登場し、ゼロショット機能を提供している。
診断放射線学のような高度な領域では、これらのモデルは信頼できる臨床使用に必要な識別精度を欠いていることが多い。
分類ラベルやセグメンテーションマスクにエンコードされた多種多様な監視信号を統合するボリュームVLMであるUniferumを,単一のトレーニングフレームワークに導入する。
論文 参考訳(メタデータ) (2025-09-01T15:30:17Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Weakly-supervised positional contrastive learning: application to
cirrhosis classification [45.63061034568991]
大規模な医療画像データセットは、低信頼で弱いラベルで安価に注釈を付けることができる。
組織学に基づく診断のような高信頼なラベルへのアクセスは稀で費用がかかる。
提案手法は,効率的な弱教師付き位置対応学習戦略 (WSP) を提案する。
論文 参考訳(メタデータ) (2023-07-10T15:02:13Z) - Feature robustness and sex differences in medical imaging: a case study
in MRI-based Alzheimer's disease detection [1.7616042687330637]
我々はADNI MRIデータセットの2つの分類方式を比較した。
訓練データセットの性構成に対する男女試験対象者のモデル性能の強い依存は見つからない。
論文 参考訳(メタデータ) (2022-04-04T17:37:54Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - VoxelHop: Successive Subspace Learning for ALS Disease Classification
Using Structural MRI [30.469124322749828]
Amyotrophic Lateral Sclerosis (ALS) の正確な分類のためのサブスペース学習モデルである VoxelHop を提案する。
一般的な畳み込みニューラルネットワーク(CNN)アーキテクチャと比較して、VoxelHopはモジュール構造と透過構造を持ち、バックプロパゲーションなしではパラメータが少ない。
我々のフレームワークは、異なる画像モダリティを用いて、他の分類タスクに容易に一般化できる。
論文 参考訳(メタデータ) (2021-01-13T15:25:57Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - A Self-ensembling Framework for Semi-supervised Knee Cartilage Defects
Assessment with Dual-Consistency [40.67137486295487]
本研究は, 重症度分類と病変局所化を含む, 膝軟骨欠損評価のための新しいアプローチを提案する。
自己理解フレームワークは、学生ネットワークと、同じ構造を持つ教師ネットワークとから構成される。
実験により, 膝軟骨欠損の分類と局所化の双方において, 提案手法は自己認識性能を著しく向上させることができることが示された。
論文 参考訳(メタデータ) (2020-05-19T04:47:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。