論文の概要: DinoDental: Benchmarking DINOv3 as a Unified Vision Encoder for Dental Image Analysis
- arxiv url: http://arxiv.org/abs/2603.28297v1
- Date: Mon, 30 Mar 2026 11:23:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.356072
- Title: DinoDental: Benchmarking DINOv3 as a Unified Vision Encoder for Dental Image Analysis
- Title(参考訳): DinoDental: 歯科画像解析のための統合視覚エンコーダDINOv3のベンチマーク
- Authors: Kun Tang, Xinquan Yang, Mianjie Zheng, Xuefen Liu, Xuguang Li, Xiaoqi Guo, Ruihan Chen, Linlin Shen, He Meng,
- Abstract要約: 歯科分析においてDinov3を評価するためのベンチマークであるDinoDentalを紹介する。
DinoDentalは、分類、検出、パノラマ線写真と口腔内写真の両方のインスタンスセグメンテーションを含む幅広いタスクをカバーしている。
以上の結果から,DINOv3はパノラマ線写真と口腔内写真の両方において,歯科画像解析のための強力な統一エンコーダとして機能することが示唆された。
- 参考スコア(独自算出の注目度): 38.63106327057235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scarcity and high cost of expert annotations in dental imaging present a significant challenge for the development of AI in dentistry. DINOv3, a state-of-the-art, self-supervised vision foundation model pre-trained on 1.7 billion images, offers a promising pathway to mitigate this issue. However, its reliability when transferred to the dental domain, with its unique imaging characteristics and clinical subtleties, remains unclear. To address this, we introduce DinoDental, a unified benchmark designed to systematically evaluate whether DINOv3 can serve as a reliable, off-the-shelf encoder for comprehensive dental image analysis without requiring domain-specific pre-training. Constructed from multiple public datasets, DinoDental covers a wide range of tasks, including classification, detection, and instance segmentation on both panoramic radiographs and intraoral photographs. We further analyze the model's transfer performance by scaling its size and input resolution, and by comparing different adaptation strategies, including frozen features, full fine-tuning, and the parameter-efficient Low-Rank Adaptation (LoRA) method. Our experiments show that DINOv3 can serve as a strong unified encoder for dental image analysis across both panoramic radiographs and intraoral photographs, remaining competitive across tasks while showing particularly clear advantages for intraoral image understanding and boundary-sensitive dense prediction. Collectively, DinoDental provides a systematic framework for comprehensively evaluating DINOv3 in dental analysis, establishing a foundational benchmark to guide efficient and effective model selection and adaptation for the dental AI community.
- Abstract(参考訳): 歯科医用画像における専門家アノテーションの不足と高コストは、歯科医用AIの開発において重要な課題である。
DINOv3は17億枚の画像で事前訓練された最先端の自己監督型視覚基盤モデルで、この問題を緩和するための有望な道筋を提供する。
しかし, 歯科領域に移動した場合の信頼性は, 独自の画像特性と臨床的微妙さで明らかでない。
そこで我々はDinoDentalを,ドメイン固有の事前学習を必要とせずに,DINOv3が包括的画像解析のための信頼性の高いオフザシェルエンコーダとして機能するかどうかを体系的に評価する統合ベンチマークとして導入した。
複数の公開データセットから構築されたDinoDentalは、分類、検出、パノラマ線写真と口内写真の両方のインスタンスセグメンテーションを含む幅広いタスクをカバーしている。
さらに、そのサイズと入力解像度を拡大し、凍結した特徴、フル微調整、パラメータ効率の低いローランド適応(LoRA)法など、異なる適応戦略を比較することにより、モデルの転送性能を解析する。
実験の結果,DINOv3はパノラマ線写真と口腔内画像の両方で強力な統合型エンコーダとして機能し,特に口腔内画像理解と境界密度密度予測の優位性を示した。
総合的に、DinoDentalは、歯科分析においてDINOv3を包括的に評価するための体系的なフレームワークを提供する。
関連論文リスト
- Towards Generalist Intelligence in Dentistry: Vision Foundation Models for Oral and Maxillofacial Radiology [22.124686092997717]
DentVFMは歯科医療用に設計された視覚基礎モデル(VFM)の最初のファミリーである。
幅広い歯科応用のためのタスク非依存の視覚表現を生成する。
それは印象的な一般知性を示し、多様な歯科作業に対する堅牢な一般化を実証している。
論文 参考訳(メタデータ) (2025-10-16T10:24:23Z) - Does DINOv3 Set a New Medical Vision Standard? [67.33543059306938]
本報告は、DINOv3が、ドメイン固有の事前トレーニングなしで、医用視覚タスクのための強力な統合エンコーダとして機能するかどうかを考察する。
我々はDINOv3を2D/3D分類やセグメンテーションを含む一般的な医療ビジョンタスクでベンチマークした。
注目すべきは、いくつかのタスクでBiomedCLIPやCT-Netといった医療固有の基礎モデルよりも優れていることだ。
論文 参考訳(メタデータ) (2025-09-08T09:28:57Z) - Adapting Foundation Model for Dental Caries Detection with Dual-View Co-Training [53.77904429789069]
本稿では, 歯列検出のための新しいDual-View Co-TrainingネットワークであるAttention-TNetについて紹介する。
OurTNetは、自動歯肉検出を用いて、パノラマX線画像からのグローバルビューと、収穫した歯肉画像からのローカルビューの2つの補完的なビューを確立する。
両ビューからの情報を効果的に統合するために,Gated Cross-Viewモジュールを導入する。
論文 参考訳(メタデータ) (2025-08-28T14:13:26Z) - Metrics that matter: Evaluating image quality metrics for medical image generation [48.85783422900129]
本研究は、脳MRIデータを用いて、一般的に使用される非参照画像品質指標を包括的に評価する。
本研究は, ノイズ, 分布変化, および臨床的に関係のある不正確さを模倣した形態的変化を含む, 様々な課題に対する計量感度を評価する。
論文 参考訳(メタデータ) (2025-05-12T01:57:25Z) - QUBIQ: Uncertainty Quantification for Biomedical Image Segmentation Challenge [93.61262892578067]
医用画像分割作業の不確実性、特にラター間変動性は重要な課題である。
この可変性は、自動セグメンテーションアルゴリズムの開発と評価に直接影響を及ぼす。
バイオメディカル画像量化チャレンジ(QUBIQ)における不確実性の定量化のベンチマーク結果を報告する。
論文 参考訳(メタデータ) (2024-03-19T17:57:24Z) - Evaluating General Purpose Vision Foundation Models for Medical Image Analysis: An Experimental Study of DINOv2 on Radiology Benchmarks [5.8941124219471055]
DINOv2はオープンソースのファンデーションモデルで、1億4200万のキュレートされた自然画像に対する自己教師付き学習を事前訓練している。
本研究は放射線学におけるDINOv2の性能を総合的に評価する。
論文 参考訳(メタデータ) (2023-12-04T21:47:10Z) - Generative Adversarial Networks for Dental Patient Identity Protection
in Orthodontic Educational Imaging [0.0]
本研究は, 歯科患者イメージを効果的に識別するためのGANインバージョン技術を提案する。
この手法は, 重要な歯科的特徴を保ちながら, プライバシの懸念に対処し, 歯科教育や研究に有用な資源を創出する。
論文 参考訳(メタデータ) (2023-07-05T04:14:57Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。