論文の概要: Comparative Evaluation of 3D and 2D Deep Learning Techniques for
Semantic Segmentation in CT Scans
- arxiv url: http://arxiv.org/abs/2101.07612v1
- Date: Tue, 19 Jan 2021 13:23:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 02:50:10.313124
- Title: Comparative Evaluation of 3D and 2D Deep Learning Techniques for
Semantic Segmentation in CT Scans
- Title(参考訳): CTスキャンにおけるセマンティックセグメンテーションのための3次元および2次元深層学習手法の比較評価
- Authors: Abhishek Shivdeo, Rohit Lokwani, Viraj Kulkarni, Amit Kharat,
Aniruddha Pant
- Abstract要約: 本稿では,3次元CTスキャンにおける立体スタックを用いた深層学習手法を提案する。
本研究では,この3D手法と従来の2D深層学習手法とのセグメンテーション結果,コンテキスト情報保持,推論時間に基づく比較について述べる。
3D技術により、2D技術と比較して推論時間が5倍短縮されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image segmentation plays a pivotal role in several medical-imaging
applications by assisting the segmentation of the regions of interest. Deep
learning-based approaches have been widely adopted for semantic segmentation of
medical data. In recent years, in addition to 2D deep learning architectures,
3D architectures have been employed as the predictive algorithms for 3D medical
image data. In this paper, we propose a 3D stack-based deep learning technique
for segmenting manifestations of consolidation and ground-glass opacities in 3D
Computed Tomography (CT) scans. We also present a comparison based on the
segmentation results, the contextual information retained, and the inference
time between this 3D technique and a traditional 2D deep learning technique. We
also define the area-plot, which represents the peculiar pattern observed in
the slice-wise areas of the pathology regions predicted by these deep learning
models. In our exhaustive evaluation, 3D technique performs better than the 2D
technique for the segmentation of CT scans. We get dice scores of 79% and 73%
for the 3D and the 2D techniques respectively. The 3D technique results in a 5X
reduction in the inference time compared to the 2D technique. Results also show
that the area-plots predicted by the 3D model are more similar to the ground
truth than those predicted by the 2D model. We also show how increasing the
amount of contextual information retained during the training can improve the
3D model's performance.
- Abstract(参考訳): 画像セグメンテーションは、関心領域のセグメンテーションを支援することで、いくつかの医療画像アプリケーションにおいて重要な役割を果たす。
深層学習に基づくアプローチは医学データのセマンティクスセグメンテーションに広く採用されている。
近年,2次元深層学習アーキテクチャに加えて,3次元医用画像データの予測アルゴリズムとして3次元アーキテクチャが採用されている。
本稿では, 3次元ctスキャンにおいて, 固化と接地ガラスの不透明さをセグメント化するための3次元スタックベース深層学習手法を提案する。
また,この3D手法と従来の2D深層学習手法のセグメンテーション結果,文脈情報保持時間,および推論時間に基づいて比較を行った。
また、これらの深層学習モデルにより予測される病理領域のスライスワイズ領域で観察される特異なパターンを表す領域プロットを定義する。
総括評価では,CTスキャンのセグメンテーションにおいて,3次元法の方が2次元法より優れていた。
3D法と2D法では,それぞれ79%,73%のダイススコアが得られた。
3D法は2D法と比較して推論時間を5倍に短縮する。
また, 3次元モデルによって予測される領域プロットは, 2次元モデルで予測されるものよりも基底的真理に類似していることが示された。
また,トレーニング中に保持する文脈情報の量を増やすことで,3次元モデルの性能が向上することを示す。
関連論文リスト
- Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation [67.36775428466045]
2次元事前学習モデルから優れた3次元表現を学習するための幾何学ガイド自己蒸留(GGSD)を提案する。
3D表現の利点により、蒸留した3D学生モデルの性能は2D教師モデルよりも大幅に上回ることができる。
論文 参考訳(メタデータ) (2024-07-18T10:13:56Z) - 3D Arterial Segmentation via Single 2D Projections and Depth Supervision
in Contrast-Enhanced CT Images [9.324710035242397]
3D深層ネットワークのトレーニングには、専門家による大量の手動3Dアノテーションが必要である。
そこで本研究では,1つの注釈付き2Dプロジェクションのみから3次元膵動脈を分画する新しい手法を提案する。
トレーニングサンプル毎にランダムに選択された1つのプロジェクションをアノテートすることで、複数の2次元プロジェクションにアノテートするのに匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-15T15:41:40Z) - MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D
Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。
複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。
その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文 参考訳(メタデータ) (2022-08-18T00:48:15Z) - Super Images -- A New 2D Perspective on 3D Medical Imaging Analysis [0.0]
トレーニング中に3次元知識を効率的に埋め込んで3次元データを扱うための,シンプルで効果的な2次元手法を提案する。
本手法は3次元画像にスライスを並べて超高分解能画像を生成する。
2次元ネットワークのみを利用した3次元ネットワークを実現する一方で、モデルの複雑さはおよそ3倍に減少する。
論文 参考訳(メタデータ) (2022-05-05T09:59:03Z) - Data Efficient 3D Learner via Knowledge Transferred from 2D Model [30.077342050473515]
我々は、RGB-D画像を介して強力な2Dモデルから知識を伝達することで、3Dタスクのデータ不足に対処する。
擬似ラベルを用いたRGB-D画像の強化には,2次元画像の強いセマンティック・セマンティック・セマンティック・セマンティック・セマンティクス・モデルを用いる。
提案手法は,3次元ラベルの効率向上に適した既存の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2022-03-16T09:14:44Z) - 3D-to-2D Distillation for Indoor Scene Parsing [78.36781565047656]
大規模3次元データリポジトリから抽出した3次元特徴を有効活用し,RGB画像から抽出した2次元特徴を向上する手法を提案する。
まず,事前学習した3Dネットワークから3D知識を抽出して2Dネットワークを監督し,トレーニング中の2D特徴からシミュレーションされた3D特徴を学習する。
次に,2次元の正規化方式を設計し,2次元特徴と3次元特徴のキャリブレーションを行った。
第3に,非ペアの3dデータを用いたトレーニングのフレームワークを拡張するために,意味を意識した対向的トレーニングモデルを設計した。
論文 参考訳(メタデータ) (2021-04-06T02:22:24Z) - Spatial Context-Aware Self-Attention Model For Multi-Organ Segmentation [18.76436457395804]
マルチ組織セグメンテーションは、医学画像解析におけるディープラーニングの最も成功した応用の1つである。
深部畳み込みニューラルネット(CNN)は,CT画像やMRI画像上で臨床応用画像のセグメンテーション性能を達成する上で非常に有望である。
本研究では,高分解能2次元畳み込みによりセグメンテーションを実現する3次元モデルと2次元モデルを組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-16T21:39:53Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic
Segmentation [87.54570024320354]
大規模運転シーンのLiDARセマンティックセマンティックセグメンテーションのための最先端の手法は、しばしば2D空間の点雲を投影して処理する。
3D-to-2Dプロジェクションの問題に取り組むための簡単な解決策は、3D表現を保ち、3D空間の点を処理することである。
我々は3次元シリンダー分割と3次元シリンダー畳み込みに基づくフレームワークをCylinder3Dとして開発し,3次元トポロジの関係と運転シーンの点雲の構造を利用する。
論文 参考訳(メタデータ) (2020-08-04T13:56:19Z) - 3D Self-Supervised Methods for Medical Imaging [7.65168530693281]
本稿では,プロキシタスクの形式で,5種類の自己教師型手法の3次元バージョンを提案する。
提案手法は,未ラベルの3次元画像からニューラルネットワークの特徴学習を容易にし,専門家のアノテーションに必要なコストを削減することを目的としている。
開発したアルゴリズムは、3D Contrastive Predictive Coding, 3D Rotation Prediction, 3D Jigsaw puzzles, Relative 3D patch location, 3D Exemplar Networkである。
論文 参考訳(メタデータ) (2020-06-06T09:56:58Z) - 2.75D: Boosting learning by representing 3D Medical imaging to 2D
features for small data [54.223614679807994]
3D畳み込みニューラルネットワーク(CNN)は、多くのディープラーニングタスクにおいて、2D CNNよりも優れたパフォーマンスを示し始めている。
3D CNNにトランスファー学習を適用することは、パブリックにトレーニング済みの3Dモデルがないために困難である。
本研究では,ボリュームデータの2次元戦略的表現,すなわち2.75Dを提案する。
その結果,2次元CNNネットワークをボリューム情報学習に用いることが可能となった。
論文 参考訳(メタデータ) (2020-02-11T08:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。