論文の概要: Self-Supervised Vision Transformers for CBCT-Based Detection of Temporomandibular Joint Osteoarthritis
- arxiv url: http://arxiv.org/abs/2606.08364v1
- Date: Sat, 06 Jun 2026 22:42:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.061008
- Title: Self-Supervised Vision Transformers for CBCT-Based Detection of Temporomandibular Joint Osteoarthritis
- Title(参考訳): CBCTを用いた顎関節症診断のための自己監督型視覚変換器
- Authors: Shradhdha Trivedi, Vrundan Sojitra, Mariela Padilla,
- Abstract要約: 顎関節症(TMJ OA)は, 顎関節症に合併した変形性関節症である。
自己監督型視覚変換器のDINOファミリーがCBCTにどのように移行するかについて検討する。
視覚変換器(ViT)のバックボーンを用いた簡単なスライスベースパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Temporomandibular joint osteoarthritis (TMJ OA) is a prevalent degenerative condition whose osseous changes are often subtle on cone-beam CT (CBCT), making automated detection challenging. We study how well the DINO family of self-supervised vision transformers -- DINOv1, DINOv2, DINOv2+reg, and RAD-DINO (a radiology-pretrained variant) -- transfers to CBCT, asking how much backbone adaptation is needed and of what kind. We propose a simple slice-based pipeline using Vision Transformer (ViT) backbones: axial CBCT slices are encoded per-slice by a frozen or partially adapted ViT and aggregated via attention-based multiple instance learning (MIL) for patient-level binary OA/Normal classification. Through systematic ablation across unfreezing strategies and aggregation designs on a multi-source CBCT dataset, we find that partial unfreezing of the final two transformer blocks is the decisive factor, improving AUC from 0.671 (fully frozen DINOv2) to 0.902. This outperforms DINOv1 (0.867), DINOv2+reg (0.774), and a supervised ImageNet ViT-B/16 baseline (0.843). Our results provide practical guidance for adapting DINO-family foundation models in low-data medical imaging settings, showing that adaptation strategy is a stronger driver of performance than backbone choice alone.
- Abstract(参考訳): 顎関節症(TMJ OA)は,関節円錐部CT(CBCT)において骨変化が軽快し,自動診断が困難である疾患である。
DINO1, DINOv2, DINOv2+reg, RAD-DINO(放射線前駆体)の自己監督型視覚トランスフォーマーのDINOファミリーがCBCTに移行し, バックボーンの適応がどの程度必要か, どのような種類かを検討する。
本研究では,視覚変換器 (ViT) のバックボーンを用いた簡単なスライスベースパイプラインを提案する: CBCTスライスを凍結あるいは部分的に適応したViTで符号化し, 患者レベルのバイナリOA/Normal分類のための注意ベース多重インスタンス学習 (MIL) を介して集約する。
マルチソースCBCTデータセット上での非凍結戦略の体系的アブレーションと集約設計により、最終2つの変圧器ブロックの部分的非凍結が決定的な要因となり、AUCは0.671(完全に凍結されたDINOv2)から0.902に改善された。
これはDINOv1(0.867)、DINOv2+reg(0.774)、ImageNet ViT-B/16ベースライン(0.843)を上回っている。
本研究は,低データ医用画像設定におけるDINOファウンデーションモデルの適用に関する実践的ガイダンスを提供し,背骨選択のみよりも適応戦略がパフォーマンスの強い要因であることが示唆された。
関連論文リスト
- A Heterogeneous Ensemble for Multi-Center COVID-19 Classification from Chest CT Scans [0.39998518782208775]
3つの推論パラダイムにまたがる9つのモデルの異種アンサンブルを示す。
アンサンブルは4つの病院センターで平均0.9280のマクロF1を達成し、最高のシングルモデルを上回っている。
論文 参考訳(メタデータ) (2026-03-15T21:34:59Z) - ZACH-ViT: A Zero-Token Vision Transformer with ShuffleStrides Data Augmentation for Robust Lung Ultrasound Classification [0.7495002546468839]
本稿では,ZACH-ViT (Zero- parameter Adaptive Compact Hierarchical Vision Transformer, 0.25 M-Hierarchical Vision Transformer)を導入する。
ZACH-ViTは、95人の重病患者の380のLUSビデオで、9つの最先端のベースラインに対して評価された。
ROC-AUC (0.80と0.79) は感度のバランス(0.60)と特異性(0.91)で最高評価と試験を達成し、全ての競合するモデルは簡単な分類に崩壊した。
論文 参考訳(メタデータ) (2025-10-20T15:26:38Z) - EqDiff-CT: Equivariant Conditional Diffusion model for CT Image Synthesis from CBCT [43.92108185590778]
画像誘導放射線療法(IGRT)に広く用いられているコーンビームCT(CBCT)
CBCTから高品質なCT画像を生成するために,EqDiff-CTという新しい拡散型条件生成モデルを提案する。
論文 参考訳(メタデータ) (2025-09-26T05:51:59Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - ViT-2SPN: Vision Transformer-based Dual-Stream Self-Supervised Pretraining Networks for Retinal OCT Classification [0.10241134756773226]
Vision Transformer-based Dual-Stream Self-Supervised Pretraining Network (ViT-2SPN) は、特徴抽出を強化し、診断精度を向上させるために設計された新しいフレームワークである。
ViT-2SPNは3段階のワークフロー、Supervised Pretraining、Self-Supervised Pretraining、Supervised Fine-Tuningを採用している。
ViT-2SPN は平均 AUC 0.93 、精度 0.77 、精度 0.81 、リコール 0.75 、F1 スコア 0.76 を達成し、既存の SSP 法より優れている。
論文 参考訳(メタデータ) (2025-01-28T19:41:38Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - A Two-Stage Generative Model with CycleGAN and Joint Diffusion for
MRI-based Brain Tumor Detection [41.454028276986946]
本稿では,脳腫瘍の検出とセグメンテーションを改善するための2段階生成モデル(TSGM)を提案する。
CycleGANは、未ペアデータに基づいてトレーニングされ、データとして正常な画像から異常な画像を生成する。
VE-JPは、合成対の異常画像をガイドとして使用して、健康な画像の再構成を行う。
論文 参考訳(メタデータ) (2023-11-06T12:58:26Z) - Learned Local Attention Maps for Synthesising Vessel Segmentations [43.314353195417326]
我々は、T2 MRIのみから、Willis(CoW)円の主大脳動脈の分節を合成するためのエンコーダ・デコーダモデルを提案する。
これは、セグメンテーションラベルを拡張することによって生成された学習されたローカルアテンションマップを使用し、ネットワークはCoWの合成に関連するT2 MRIからのみ情報を抽出する。
論文 参考訳(メタデータ) (2023-08-24T15:32:27Z) - Spatiotemporal Feature Learning Based on Two-Step LSTM and Transformer
for CT Scans [2.3682456328966115]
我々は、新型コロナウイルスの症状分類を徹底的に行うための、新しい、効果的、2段階のアプローチを提案する。
まず,従来のバックボーンネットワークにより,CTスキャンにおける各スライスの意味的特徴埋め込みを抽出する。
そこで我々は,時間的特徴学習を扱うために,LSTMとTransformerベースのサブネットワークを提案する。
論文 参考訳(メタデータ) (2022-07-04T16:59:05Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z) - Multi-Slice Net: A novel light weight framework for COVID-19 Diagnosis [38.32234937094937]
本稿では,CTスキャンを用いた軽量な新型コロナウイルス診断フレームワークを提案する。
特徴抽出器として強力なバックボーンネットワークを用い,識別的スライスレベルの特徴を抽出する。
これらの特徴は、患者レベル診断を得るために、軽量ネットワークによって集約される。
論文 参考訳(メタデータ) (2021-08-09T02:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。