論文の概要: Towards Generalist Intelligence in Dentistry: Vision Foundation Models for Oral and Maxillofacial Radiology
- arxiv url: http://arxiv.org/abs/2510.14532v1
- Date: Thu, 16 Oct 2025 10:24:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.814123
- Title: Towards Generalist Intelligence in Dentistry: Vision Foundation Models for Oral and Maxillofacial Radiology
- Title(参考訳): 歯科における汎用知能を目指して : 口腔・顎顔面放射線学のビジョン基礎モデル
- Authors: Xinrui Huang, Fan Xiao, Dongming He, Anqi Gao, Dandan Li, Xiaofan Zhang, Shaoting Zhang, Xudong Wang,
- Abstract要約: DentVFMは歯科医療用に設計された視覚基礎モデル(VFM)の最初のファミリーである。
幅広い歯科応用のためのタスク非依存の視覚表現を生成する。
それは印象的な一般知性を示し、多様な歯科作業に対する堅牢な一般化を実証している。
- 参考スコア(独自算出の注目度): 22.124686092997717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oral and maxillofacial radiology plays a vital role in dental healthcare, but radiographic image interpretation is limited by a shortage of trained professionals. While AI approaches have shown promise, existing dental AI systems are restricted by their single-modality focus, task-specific design, and reliance on costly labeled data, hindering their generalization across diverse clinical scenarios. To address these challenges, we introduce DentVFM, the first family of vision foundation models (VFMs) designed for dentistry. DentVFM generates task-agnostic visual representations for a wide range of dental applications and uses self-supervised learning on DentVista, a large curated dental imaging dataset with approximately 1.6 million multi-modal radiographic images from various medical centers. DentVFM includes 2D and 3D variants based on the Vision Transformer (ViT) architecture. To address gaps in dental intelligence assessment and benchmarks, we introduce DentBench, a comprehensive benchmark covering eight dental subspecialties, more diseases, imaging modalities, and a wide geographical distribution. DentVFM shows impressive generalist intelligence, demonstrating robust generalization to diverse dental tasks, such as disease diagnosis, treatment analysis, biomarker identification, and anatomical landmark detection and segmentation. Experimental results indicate DentVFM significantly outperforms supervised, self-supervised, and weakly supervised baselines, offering superior generalization, label efficiency, and scalability. Additionally, DentVFM enables cross-modality diagnostics, providing more reliable results than experienced dentists in situations where conventional imaging is unavailable. DentVFM sets a new paradigm for dental AI, offering a scalable, adaptable, and label-efficient model to improve intelligent dental healthcare and address critical gaps in global oral healthcare.
- Abstract(参考訳): 歯科医療において口腔・顎顔面X線学は重要な役割を担っているが、放射線画像の解釈は専門職の不足によって制限されている。
AIアプローチは将来性を示しているが、既存の歯科用AIシステムは、単一のモダリティの焦点、タスク固有の設計、高価なラベル付きデータへの依存によって制限されており、様々な臨床シナリオにおける一般化を妨げる。
これらの課題に対処するために,歯科用視覚基礎モデル(VFM)の最初のファミリーであるDentVFMを紹介した。
DentVFMは、広範囲の歯科応用に対してタスク非依存の視覚表現を生成し、様々な医療センターから約1.6万個のマルチモーダル・ラジオグラフィー画像を持つ大規模な歯科画像データセットであるDentVistaで自己教師付き学習を使用する。
DentVFMにはビジョントランスフォーマー(ViT)アーキテクチャに基づいた2Dと3Dのバリエーションが含まれている。
歯科インテリジェンス評価とベンチマークのギャップに対処するため,デントベンチ (DentBench) を紹介した。
デントVFMは、疾患の診断、治療分析、バイオマーカーの同定、解剖学的ランドマークの検出とセグメンテーションなど、多様な歯科のタスクに対する堅牢な一般化を実証している。
実験結果から、DentVFMは教師付き、自己教師付き、弱教師付きベースラインよりも優れ、より優れた一般化、ラベル効率、スケーラビリティを提供することが示された。
さらに、デントVFMは、従来の画像が利用できない状況において、経験豊富な歯科医よりも信頼性の高い結果を提供する、モダリティ横断診断を可能にする。
DentVFMは、インテリジェントな歯科医療を改善し、グローバルな口腔医療における重要なギャップに対処するために、スケーラブルで適応性があり、ラベル効率のよいモデルを提供する。
関連論文リスト
- DentVLM: A Multimodal Vision-Language Model for Comprehensive Dental Diagnosis and Enhanced Clinical Practice [71.62725911420627]
本稿では,専門レベルの口腔疾患診断のために設計された視覚言語モデルであるDentVLMを紹介する。
このモデルは、36の診断タスクで7つの2D経口画像モダリティを解釈できる。
若年者歯科医師13名(36名中21名)の診断成績を上回り,12名中12名(36名中12名)の診断成績を上回りました。
論文 参考訳(メタデータ) (2025-09-27T14:47:37Z) - A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。
我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。
最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文 参考訳(メタデータ) (2025-09-15T10:05:31Z) - Towards Better Dental AI: A Multimodal Benchmark and Instruction Dataset for Panoramic X-ray Analysis [16.403842140593706]
我々は,パノラマX線解釈に適した大規模マルチモーダル・インストラクション・データセットであるMMOralを紹介した。
MMOral-Benchは, 歯科医療における5つの重要な診断次元をカバーする総合的な評価スイートである。
また,厳密にキュレートされたMMOral命令データセットを用いて,Qwen2.5-VL-7B上で微調整を行うOralGPTを提案する。
論文 参考訳(メタデータ) (2025-09-11T08:39:08Z) - Adapting Foundation Model for Dental Caries Detection with Dual-View Co-Training [53.77904429789069]
本稿では, 歯列検出のための新しいDual-View Co-TrainingネットワークであるAttention-TNetについて紹介する。
OurTNetは、自動歯肉検出を用いて、パノラマX線画像からのグローバルビューと、収穫した歯肉画像からのローカルビューの2つの補完的なビューを確立する。
両ビューからの情報を効果的に統合するために,Gated Cross-Viewモジュールを導入する。
論文 参考訳(メタデータ) (2025-08-28T14:13:26Z) - Multimodal Causal-Driven Representation Learning for Generalizable Medical Image Segmentation [56.52520416420957]
医用画像セグメンテーションにおける領域一般化に取り組むために, MCDRL(Multimodal Causal-Driven Representation Learning)を提案する。
MCDRLは競合する手法より一貫して優れ、セグメンテーション精度が優れ、堅牢な一般化性を示す。
論文 参考訳(メタデータ) (2025-08-07T03:41:41Z) - EyecareGPT: Boosting Comprehensive Ophthalmology Understanding with Tailored Dataset, Benchmark and Model [51.66031028717933]
Med-LVLM(Med-LVLM)は、医療において重要な可能性を示す。
現在、知的眼科診断は、(i)データ、(ii)ベンチマーク、(iii)モデルという3つの大きな課題に直面している。
我々は、前述の3つの課題に対処するEyecare Kitを提案する。
論文 参考訳(メタデータ) (2025-04-18T12:09:15Z) - Improving Dental Diagnostics: Enhanced Convolution with Spatial Attention Mechanism [0.0]
本稿では,SimAMアテンションモジュールと統合されたResNet50アーキテクチャを改良し,歯科画像における限られたコントラストの課題に対処する。
本モデルでは,F1スコアの0.676を達成し,様々な特徴抽出技術に対して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-11T01:12:30Z) - Semi-supervised classification of dental conditions in panoramic radiographs using large language model and instance segmentation: A real-world dataset evaluation [6.041146512190833]
13種類の歯科疾患をパノラマX線写真で分類するための半教師付き学習フレームワークが提案されている。
このソリューションは、ジュニアスペシャリストに匹敵する精度のレベルを示した。
論文 参考訳(メタデータ) (2024-06-25T19:56:12Z) - Generative Adversarial Networks for Dental Patient Identity Protection
in Orthodontic Educational Imaging [0.0]
本研究は, 歯科患者イメージを効果的に識別するためのGANインバージョン技術を提案する。
この手法は, 重要な歯科的特徴を保ちながら, プライバシの懸念に対処し, 歯科教育や研究に有用な資源を創出する。
論文 参考訳(メタデータ) (2023-07-05T04:14:57Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。