論文の概要: Structure-Aware Long Short-Term Memory Network for 3D Cephalometric
Landmark Detection
- arxiv url: http://arxiv.org/abs/2107.09899v1
- Date: Wed, 21 Jul 2021 06:35:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-22 14:15:13.618573
- Title: Structure-Aware Long Short-Term Memory Network for 3D Cephalometric
Landmark Detection
- Title(参考訳): 3次元ケパロメトリランドマーク検出のための構造対応長期記憶ネットワーク
- Authors: Runnan Chen, Yuexin Ma, Nenglun Chen, Lingjie Liu, Zhiming Cui,
Yanhong Lin, Wenping Wang
- Abstract要約: 本研究では,3次元ランドマーク検出のための構造対応長短期記憶フレームワーク(SA-LSTM)を提案する。
SA-LSTMは、まず、ダウンサンプリングCBCTボリューム上の熱マップ回帰によって粗いランドマークを見つける。
その後、高解像度の収穫パッチを使用して、注意深いオフセット回帰によってランドマークを徐々に洗練する。
実験の結果,提案手法は効率と精度で最先端の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 37.031819721889676
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Detecting 3D landmarks on cone-beam computed tomography (CBCT) is crucial to
assessing and quantifying the anatomical abnormalities in 3D cephalometric
analysis. However, the current methods are time-consuming and suffer from large
biases in landmark localization, leading to unreliable diagnosis results. In
this work, we propose a novel Structure-Aware Long Short-Term Memory framework
(SA-LSTM) for efficient and accurate 3D landmark detection. To reduce the
computational burden, SA-LSTM is designed in two stages. It first locates the
coarse landmarks via heatmap regression on a down-sampled CBCT volume and then
progressively refines landmarks by attentive offset regression using
high-resolution cropped patches. To boost accuracy, SA-LSTM captures
global-local dependence among the cropping patches via self-attention.
Specifically, a graph attention module implicitly encodes the landmark's global
structure to rationalize the predicted position. Furthermore, a novel
attention-gated module recursively filters irrelevant local features and
maintains high-confident local predictions for aggregating the final result.
Experiments show that our method significantly outperforms state-of-the-art
methods in terms of efficiency and accuracy on an in-house dataset and a public
dataset, achieving 1.64 mm and 2.37 mm average errors, respectively, and using
only 0.5 seconds for inferring the whole CBCT volume of resolution 768*768*576.
Moreover, all predicted landmarks are within 8 mm error, which is vital for
acceptable cephalometric analysis.
- Abstract(参考訳): コーンビームCT(CBCT)における3Dランドマークの検出は,3次元脳波解析における解剖学的異常の評価と定量化に重要である。
しかし、現在の手法は時間がかかり、ランドマークの局在に大きなバイアスを被り、信頼性の低い診断結果をもたらす。
本研究では,効率的な3次元ランドマーク検出のための構造対応長短期記憶フレームワーク(SA-LSTM)を提案する。
計算負担を軽減するため、SA-LSTMは2段階設計されている。
まず、ダウンサンプリングされたCBCTボリュームのヒートマップレグレッションを用いて粗いランドマークを発見、次に高解像度のトリミングパッチを用いて、注意深いオフセットレグレッションによってランドマークを徐々に洗練する。
精度を高めるため、SA-LSTMは自己注意によって収穫パッチのグローバルな局所的依存を捉える。
具体的には、グラフアテンションモジュールがランドマークのグローバル構造を暗黙的にエンコードして予測位置を合理化する。
さらに,新たなアテンションゲートモジュールは,無関係な局所的特徴を再帰的にフィルタリングし,最終結果を集約するための高信頼な局所的予測を維持する。
実験の結果,本手法は内部データセットと公開データセットの効率と精度において,それぞれ1.64mm,2.37mmの平均誤差を達成し,CBCT全体の解像度768*768*576を0.5秒で推定できることがわかった。
さらに、予測された全てのランドマークは8mm以内の誤差であり、許容される脳波分析に不可欠である。
関連論文リスト
- DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Learn Fine-grained Adaptive Loss for Multiple Anatomical Landmark
Detection in Medical Images [15.7026400415269]
本稿ではランドマーク検出のための新しい学習学習フレームワークを提案する。
提案手法は汎用的であり,解剖学的ランドマーク検出の効率向上の可能性を示す。
論文 参考訳(メタデータ) (2021-05-19T13:39:18Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Automated 3D cephalometric landmark identification using computerized
tomography [1.4349468613117398]
頭蓋骨の形状を代用する3次元頭蓋骨計測のランドマークの同定は、頭蓋骨計測の基本的なステップである。
近年,ディープラーニング(dl)を用いた2次元頭部画像の自動ランドマーク作成が大きな成功を収めているが,80以上のランドマークに対する3次元ランドマークは,まだ満足のいくレベルには達していない。
本論文では,匿名化されたランドマークデータセットと対のCTデータを取り除いた,半教師付き3次元ランドマーク用DL法を提案する。
論文 参考訳(メタデータ) (2020-12-16T07:29:32Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Probabilistic 3D surface reconstruction from sparse MRI information [58.14653650521129]
スパース2次元MR画像データとアレータティック不確実性予測から3次元表面再構成を同時に行うための新しい確率論的深層学習手法を提案する。
本手法は,3つの準直交MR画像スライスから,限られたトレーニングセットから大きな表面メッシュを再構成することができる。
論文 参考訳(メタデータ) (2020-10-05T14:18:52Z) - Region Proposal Network with Graph Prior and IoU-Balance Loss for
Landmark Detection in 3D Ultrasound [16.523977092204813]
3D超音波(US)は胎児の成長モニタリングのための詳細な出生前検査を容易にする。
3DUSボリュームを分析するためには、解剖学的ランドマークを正確に同定することが基本である。
我々は3次元顔USボリュームのランドマークを検出するためにオブジェクト検出フレームワークを利用する。
論文 参考訳(メタデータ) (2020-04-01T03:00:03Z) - Volumetric landmark detection with a multi-scale shift equivariant
neural network [16.114319747246334]
本稿では,3次元画像における高速かつメモリ効率の高いランドマーク検出を実現するマルチスケールのエンドツーエンドディープラーニング手法を提案する。
今回我々は,263個のCT上における頸動脈分岐検出法について検討し,平均ユークリッド距離2.81mmで最先端の精度を実現した。
論文 参考訳(メタデータ) (2020-03-03T17:06:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。