論文の概要: ViT-NeBLa: A Hybrid Vision Transformer and Neural Beer-Lambert Framework for Single-View 3D Reconstruction of Oral Anatomy from Panoramic Radiographs
- arxiv url: http://arxiv.org/abs/2506.13195v1
- Date: Mon, 16 Jun 2025 08:01:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.708853
- Title: ViT-NeBLa: A Hybrid Vision Transformer and Neural Beer-Lambert Framework for Single-View 3D Reconstruction of Oral Anatomy from Panoramic Radiographs
- Title(参考訳): ViT-NeBLa:パノラマX線写真を用いた単一視野3次元口腔解剖再構成のためのハイブリッドビジョントランスフォーマとニューラルビールランバートフレームワーク
- Authors: Bikram Keshari Parida, Anusree P. Sunilkumar, Abhijit Sen, Wonsang You,
- Abstract要約: パノラマ線写真(PX)とコーンビームCT(CBCT)の2つの主要画像モダリティによる歯科診断
PX画像は費用対効果が高くアクセスしやすいが、深度情報の欠如により診断精度が低下する。CBCTはこの問題に対処するが、高コスト、放射線暴露の増加、アクセシビリティの制限などの欠点を提示する。
視覚変換器をベースとしたニューラルビール・ランバートモデルであるViT-NeBLaを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dental diagnosis relies on two primary imaging modalities: panoramic radiographs (PX) providing 2D oral cavity representations, and Cone-Beam Computed Tomography (CBCT) offering detailed 3D anatomical information. While PX images are cost-effective and accessible, their lack of depth information limits diagnostic accuracy. CBCT addresses this but presents drawbacks including higher costs, increased radiation exposure, and limited accessibility. Existing reconstruction models further complicate the process by requiring CBCT flattening or prior dental arch information, often unavailable clinically. We introduce ViT-NeBLa, a vision transformer-based Neural Beer-Lambert model enabling accurate 3D reconstruction directly from single PX. Our key innovations include: (1) enhancing the NeBLa framework with Vision Transformers for improved reconstruction capabilities without requiring CBCT flattening or prior dental arch information, (2) implementing a novel horseshoe-shaped point sampling strategy with non-intersecting rays that eliminates intermediate density aggregation required by existing models due to intersecting rays, reducing sampling point computations by $52 \%$, (3) replacing CNN-based U-Net with a hybrid ViT-CNN architecture for superior global and local feature extraction, and (4) implementing learnable hash positional encoding for better higher-dimensional representation of 3D sample points compared to existing Fourier-based dense positional encoding. Experiments demonstrate that ViT-NeBLa significantly outperforms prior state-of-the-art methods both quantitatively and qualitatively, offering a cost-effective, radiation-efficient alternative for enhanced dental diagnostics.
- Abstract(参考訳): パノラマX線写真(PX)は2Dの口腔像を提供し、CBCTは詳細な3D解剖学的情報を提供する。
PX画像は費用対効果が高くアクセスしやすいが、深度情報の欠如は診断精度を制限している。
CBCTはこれに対処するが、高いコスト、放射線被曝の増加、アクセシビリティの制限などの欠点を提示する。
既存の再建モデルは、CBCTの平坦化や歯科アーチの事前情報を必要とするため、しばしば臨床的には利用できないプロセスをさらに複雑にする。
視覚変換器をベースとしたニューラルビール・ランバートモデルであるViT-NeBLaを導入する。
主なイノベーションは,(1) CBCT平滑化や前歯列情報を必要としない再建機能向上のためのNeBLaフレームワークの強化,(2) 交差線による既存モデルの中間密度集約を排除した非交差線を用いた新しいホースシュー型点サンプリング戦略の実装,(3) グローバル・ローカル特徴抽出のためのハイブリッドVT-CNNアーキテクチャへのCNNベースのU-Netの置き換え,(4) 既存のフーリエ型高次位置符号化と比較して,より高次元の3Dサンプルの符号化のための学習可能なハッシュ位置符号化の実装などである。
実験により、ViT-NeBLaは従来の最先端の方法よりも定量的かつ質的に優れており、歯科診断の強化に費用対効果があり、放射線効率のよい代替手段を提供することが示された。
関連論文リスト
- DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction [9.579390210009521]
スパースビュー再構成は、画質を維持しながらX線投影を少なくすることで放射線を低減させる。
既存の手法では、高い計算要求や異なるデータセットに対する一般化性の欠如といった課題に直面している。
マルチビュー2次元特徴とマルチスケール3次元特徴を統合した新しいネットワークであるDiCEを特徴とする,スパースビューCBCT再構成のための最初の基盤モデルであるDeepSparseを提案する。
論文 参考訳(メタデータ) (2025-05-05T13:14:49Z) - PX2Tooth: Reconstructing the 3D Point Cloud Teeth from a Single Panoramic X-ray [20.913080797758816]
PX2Toothは2段階の枠組みで1枚のPX画像を用いて3次元歯の再構成を行う新しい手法である。
まず、PXSegNetを設計し、PX画像から永久歯を分割し、各歯の位置、形態、分類情報を提供する。
その後、ランダムな点雲を3次元歯に変換する新しい歯生成ネットワーク(TGNet)を設計する。
論文 参考訳(メタデータ) (2024-11-06T07:44:04Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - SdCT-GAN: Reconstructing CT from Biplanar X-Rays with Self-driven
Generative Adversarial Networks [6.624839896733912]
本稿では,3次元CT画像の再構成のための自己駆動型生成対向ネットワークモデル(SdCT-GAN)を提案する。
識別器に新しいオートエンコーダ構造を導入することにより、画像の詳細により多くの注意を払っている。
LPIPS評価基準は,既存画像よりも微細な輪郭やテクスチャを定量的に評価できる。
論文 参考訳(メタデータ) (2023-09-10T08:16:02Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - Oral-3Dv2: 3D Oral Reconstruction from Panoramic X-Ray Imaging with
Implicit Neural Representation [3.8215162658168524]
Oral-3Dv2は、単一のパノラマX線画像から3Dラジオロジーを再構成する非逆学習モデルである。
本モデルは,2次元座標を3次元空間内のボクセルの密度値にマッピングすることにより,暗黙的に3次元口腔構造を表現することを学習する。
我々の知る限りでは、これは1枚のパノラマX線画像から3Dラジオグラフィ再構成における非逆学習モデルの最初の作品である。
論文 参考訳(メタデータ) (2023-03-21T18:17:27Z) - Metal Artifact Reduction with Intra-Oral Scan Data for 3D Low Dose
Maxillofacial CBCT Modeling [0.7444835592104696]
高精度な3次元顎顔面CBCTモデリングのための2段階金属アーチファクト低減法を提案する。
第1段階では、金属関連アーティファクトを緩和するために画像と画像の深層学習ネットワークが使用される。
第2段階では、矯正された歯科用CBCT画像から骨を分割して3次元顎顔面モデルを構築する。
論文 参考訳(メタデータ) (2022-02-08T00:24:41Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。