論文の概要: Masked Latent Transformer with the Random Masking Ratio to Advance the Diagnosis of Dental Fluorosis
- arxiv url: http://arxiv.org/abs/2404.13564v1
- Date: Sun, 21 Apr 2024 07:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 18:21:27.417586
- Title: Masked Latent Transformer with the Random Masking Ratio to Advance the Diagnosis of Dental Fluorosis
- Title(参考訳): 歯科用フッ化物診断のためのランダムマスキング比を有する仮設潜伏変圧器
- Authors: Yun Wu, Hao Xu, Maohua Gu, Zhongchuan Jiang, Jun Xu, Youliang Tian,
- Abstract要約: 我々は、最初のオープンソース歯科用蛍光画像データセット(DFID)を構築した。
ランダムマスキング比(MLTrMR)を用いたマスク付き潜時変圧器という先駆的深層学習モデルを提案する。
MLTrMRの精度は80.19%、F1は75.79%、DFIDは81.28%である。
- 参考スコア(独自算出の注目度): 12.035241916178702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dental fluorosis is a chronic disease caused by long-term overconsumption of fluoride, which leads to changes in the appearance of tooth enamel. It is an important basis for early non-invasive diagnosis of endemic fluorosis. However, even dental professionals may not be able to accurately distinguish dental fluorosis and its severity based on tooth images. Currently, there is still a gap in research on applying deep learning to diagnosing dental fluorosis. Therefore, we construct the first open-source dental fluorosis image dataset (DFID), laying the foundation for deep learning research in this field. To advance the diagnosis of dental fluorosis, we propose a pioneering deep learning model called masked latent transformer with the random masking ratio (MLTrMR). MLTrMR introduces a mask latent modeling scheme based on Vision Transformer to enhance contextual learning of dental fluorosis lesion characteristics. Consisting of a latent embedder, encoder, and decoder, MLTrMR employs the latent embedder to extract latent tokens from the original image, whereas the encoder and decoder comprising the latent transformer (LT) block are used to process unmasked tokens and predict masked tokens, respectively. To mitigate the lack of inductive bias in Vision Transformer, which may result in performance degradation, the LT block introduces latent tokens to enhance the learning capacity of latent lesion features. Furthermore, we design an auxiliary loss function to constrain the parameter update direction of the model. MLTrMR achieves 80.19% accuracy, 75.79% F1, and 81.28% quadratic weighted kappa on DFID, making it state-of-the-art (SOTA).
- Abstract(参考訳): 歯科用フッ化物は長期のフッ化物過剰摂取によって引き起こされる慢性疾患であり、歯のエナメル質の出現に変化をもたらす。
早期の非侵襲的内在性フルオロシスの診断の基礎として重要である。
しかし, 歯科医でさえ, 歯像に基づいて, 歯のフッ素症とその重症度を正確に識別できない可能性がある。
現在, 歯科用フッ化物の診断に深層学習を適用する研究のギャップが残っている。
そこで我々は,この分野での深層学習研究の基礎となる,最初のオープンソース歯科用フッ化物画像データセット(DFID)を構築した。
歯科用フルオロシスの診断を進めるために,ランダムマスキング比 (MLTrMR) を用いたマスク付き潜伏変圧器(英語版)と呼ばれる先駆的な深層学習モデルを提案する。
MLTrMRはVision Transformerをベースとしたマスク潜時モデリング手法を導入し, 歯科用フッ化物病変の特徴の文脈学習を強化する。
MLTrMRは、潜伏埋め込み器、エンコーダ、デコーダで構成され、潜伏埋め込み器を用いて原画像から潜伏トークンを抽出する一方、潜伏変換器(LT)ブロックからなる復号器と復号器は、それぞれマスキングされていないトークンの処理とマスク付きトークンの予測に使用される。
視覚変換器における誘導バイアスの欠如を緩和するために、LTブロックは潜伏トークンを導入し、潜伏病変の特徴の学習能力を高める。
さらに,モデルのパラメータ更新方向を制約する補助損失関数を設計する。
MLTrMRの精度は80.19%、F1は75.79%、DFIDは81.28%である。
関連論文リスト
- Diff-FMT: Diffusion Models for Fluorescence Molecular Tomography [16.950699640321936]
拡散確率モデル(DDPM)に基づくFMT再構成手法を提案する。
ステップバイステップの確率サンプリング機構により、画像のきめ細かい再構築を実現し、画像詳細の喪失などの問題を回避する。
Diff-FMTは大規模データセットに頼らずに高解像度の再構成画像が得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T10:41:31Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Unveiling Incomplete Modality Brain Tumor Segmentation: Leveraging Masked Predicted Auto-Encoder and Divergence Learning [6.44069573245889]
脳腫瘍のセグメンテーションは、特にマルチモーダルMRI(Multi-modal magnetic resonance imaging)における重要な課題である。
本稿では,不完全なモダリティデータから頑健な特徴学習を可能にする,マスク付き予測事前学習方式を提案する。
微調整段階において、我々は知識蒸留技術を用いて、完全なモダリティデータと欠落したモダリティデータの間に特徴を整列させ、同時にモデルロバスト性を向上する。
論文 参考訳(メタデータ) (2024-06-12T20:35:16Z) - MARformer: An Efficient Metal Artifact Reduction Transformer for Dental CBCT Images [53.62335292022492]
金属歯のインプラントはCBCTイメージングの過程で不愉快な金属加工物をもたらす可能性がある。
歯科用CBCT画像から金属アーティファクト低減(MAR)を実現するための効率的なトランスフォーマーを開発した。
P2FFN (Patch-wise Perceptive Feed Forward Network) も提案されている。
論文 参考訳(メタデータ) (2023-11-16T06:02:03Z) - Latent Diffusion Model for Medical Image Standardization and Enhancement [11.295078152769559]
DiffusionCTは、異なる非標準分布を標準化形式に変換するスコアベースのDDPMモデルである。
このアーキテクチャは、ボトルネック位置に統合されたDDPMモデルにより強化されたU-Netベースのエンコーダデコーダを含む。
DiffusionCTによる画像の標準化の顕著な改善が示唆された。
論文 参考訳(メタデータ) (2023-10-08T17:11:14Z) - DETDet: Dual Ensemble Teeth Detection [0.0]
2023 MICCAI DENTEXは, 歯科用パノラマX線診断と列挙の精度を高めることを目的としている。
DeTDetはDual Ensemble Teeth Detection Networkである。
我々は列挙モジュールにMask-RCNN,診断モジュールにDINOを採用した。
論文 参考訳(メタデータ) (2023-08-27T11:04:26Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - Self-Supervised Learning with Masked Image Modeling for Teeth Numbering,
Detection of Dental Restorations, and Instance Segmentation in Dental
Panoramic Radiographs [8.397847537464534]
本研究の目的は,SimMIM や UM-MAE といった近年の自己教師型学習手法を応用して,限られた数の歯科用ラジオグラフィーのモデル効率と理解を高めることである。
我々の知る限りでは、歯科用パノラマX線写真にスイニングトランスフォーマーに自己教師あり学習法を適用した最初の研究である。
論文 参考訳(メタデータ) (2022-10-20T16:50:07Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。