論文の概要: Adaptive Texture-aware Masking for Self-Supervised Learning in 3D Dental CBCT Analysis
- arxiv url: http://arxiv.org/abs/2605.01741v1
- Date: Sun, 03 May 2026 06:42:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.917199
- Title: Adaptive Texture-aware Masking for Self-Supervised Learning in 3D Dental CBCT Analysis
- Title(参考訳): 3次元歯科用CBCT解析における適応型テクスチャー対応マスキング
- Authors: Xinquan Yang, Jianfeng Ren, Xuguang Li, Kian Ming Lim, He Meng, Linlin Shen, Yongqiang Deng,
- Abstract要約: Cone Beam Computed Tomography (CBCT) は歯科における3次元画像診断に重要である。
ボリューム分析のための堅牢なAIモデルの開発は、大きな注釈付きデータセットの不足によって制約されることが多い。
我々は,新しい適応マスキング戦略であるATMaskを提案する。
- 参考スコア(独自算出の注目度): 46.96606285805449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cone Beam Computed Tomography (CBCT) is pivotal for 3D diagnostic imaging in dentistry. However, the development of robust AI models for volumetric analysis is often constrained by the scarcity of large, annotated datasets. Self-supervised learning (SSL), particularly Masked Image Modeling (MIM), offers a promising pathway to leverage unlabeled data. A limitation of standard MIM is its reliance on random masking, which fails to prioritize diagnostically critical regions in dental CBCT volumes, such as subtle pathological changes and intricate anatomical boundaries. To address this, we propose ATMask, a novel adaptive masking strategy. Instead of applying random masks or employing computationally intensive attention modules, ATMask computes an inter-slice texture variation map to identify regions with high structural or textural complexity. These high-variation areas are then selectively masked during pre-training, compelling the model to learn richer contextual representations essential for inferring complex 3D morphological transitions. Furthermore, we contribute the first large-scale CBCT dataset, curated from both public and private sources, comprising 6,314 scans, for the dental AI model pretraining. Extensive experiments on three downstream dental CBCT tasks demonstrate that our ATMask enables more data-efficient and powerful representation learning than standard random masking and other advanced SSL baselines. The dataset and code will be released.
- Abstract(参考訳): Cone Beam Computed Tomography (CBCT) は歯科における3次元画像診断に重要である。
しかし、ボリューム分析のための堅牢なAIモデルの開発は、大きな注釈付きデータセットの不足によってしばしば制限される。
自己教師付き学習(SSL)、特にMasked Image Modeling(MIM)は、ラベルのないデータを活用するための有望な経路を提供する。
標準MIMの限界はランダムマスキングに依存しており、微妙な病理学的変化や複雑な解剖学的境界など、歯科CBCTボリュームの診断上重要な領域の優先順位付けに失敗する。
そこで本研究では,新しい適応マスキング戦略であるATMaskを提案する。
ランダムマスクを適用したり、計算集約的なアテンションモジュールを使用する代わりに、ATMaskはスライス間テクスチャ変動マップを計算し、構造やテクスチャの複雑さの高い領域を特定する。
これらの高変量領域は事前学習中に選択的にマスキングされ、複雑な3次元形態素遷移を推測するのに不可欠なより豊かな文脈表現を学習するようモデルに促す。
さらに, 歯科用AIモデル事前学習のための6,314スキャンを含む, パブリックおよびプライベートソースからキュレートされた最初の大規模CBCTデータセットを寄贈した。
3つの下流歯科用CBCTタスクに対する大規模な実験により、ATMaskは標準的なランダムマスキングや他の高度なSSLベースラインよりも、よりデータ効率が高く強力な表現学習を可能にします。
データセットとコードがリリースされる。
関連論文リスト
- SSMamba: A Self-Supervised Hybrid State Space Model for Pathological Image Classification [21.197869098405416]
SSMambaは、大規模な外部データセットに頼ることなく、効果的なきめ細かい機能学習を可能にするハイブリッドSSLフレームワークである。
SSMambaは10の公開ROIデータセットで11の最先端の病理的FMを上回り、6の公開WSIデータセットで8のSOTAメソッドを上回ります。
論文 参考訳(メタデータ) (2026-04-17T05:32:28Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - 3D MRI Synthesis with Slice-Based Latent Diffusion Models: Improving Tumor Segmentation Tasks in Data-Scarce Regimes [2.8498944632323755]
本稿では,ボリュームデータ生成の複雑さに対処するスライスに基づく遅延拡散アーキテクチャを提案する。
この手法は,医療用画像と関連するマスクの同時分布モデルを拡張し,データスカース体制下での同時生成を可能にする。
構造は, 大きさ, 形状, 相対位置などの腫瘍特性によって調節できるため, 腫瘍の多様性は様々である。
論文 参考訳(メタデータ) (2024-06-08T09:53:45Z) - Sparse Anatomical Prompt Semi-Supervised Learning with Masked Image Modeling for CBCT Tooth Segmentation [9.373643627609336]
Cone Beam Computed Tomography (CBCT) 歯科画像における歯の識別とセグメンテーションは, 歯科医が行う手技診断の効率と精度を著しく向上させることができる。
既存のセグメンテーション手法は主に大規模なデータボリュームトレーニングに基づいて開発され、そのアノテーションは非常に時間がかかります。
本研究では, 大量の未ラベルデータを効果的に活用し, 限られたラベル付きデータで正確な歯のセグメンテーションを実現するタスク指向Masked Auto-Encoderパラダイムを提案する。
論文 参考訳(メタデータ) (2024-02-07T05:05:21Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - SAR: Scale-Aware Restoration Learning for 3D Tumor Segmentation [23.384259038420005]
3次元腫瘍分割のためのSAR(Scale-Aware Restoration)を提案する。
新たなプロキシタスク、すなわちスケール差別は、自己回復タスクと組み合わせて3Dニューラルネットワークを事前訓練するために定式化される。
脳腫瘍セグメンテーション(Brain tumor segmentation),すなわち膵腫瘍セグメンテーション(Pancreas tumor segmentation)の2つの課題に対して,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-10-13T01:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。