論文の概要: When is 3D Worth It? A Resource-Performance Frontier for CNNs and Transformers in Lung CT
- arxiv url: http://arxiv.org/abs/2606.06950v1
- Date: Fri, 05 Jun 2026 06:24:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.592964
- Title: When is 3D Worth It? A Resource-Performance Frontier for CNNs and Transformers in Lung CT
- Title(参考訳): 肺CTにおけるCNNとトランスフォーマーのためのリソースパフォーマンスフロンティア
- Authors: Md Enamul Hoq, Sharafat Hossain, Imraul Emmaka, Linda Larson-Prior, Lawrence Tarbox, Jonathan Bona, Donald Johann Jr. and Fred Prior,
- Abstract要約: 我々は、入力次元が畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)のモデル行動にどう影響するかを研究する。
クラス不均衡な肺がんスクリーニング分類では、2Dと2.5Dの入力は、完全な3D表現よりもパフォーマンス、安定性、計算効率のトレードオフがより信頼できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Three-dimensional models are widely assumed preferable for volumetric medical imaging, yet their practical value depends on whether performance gains justify added computational cost and complexity. Rather than proposing a new architecture, we study how input dimensionality (2D, 2.5D, 3D) affects model behavior across convolutional neural networks (CNNs) and Vision Transformers (ViTs) under a fixed training protocol. Using a leakage-free NLST cohort (n = 1,977) with supporting LIDC-IDRI data, we find that the 2.5D CNN offers the most favorable discrimination-stability trade-off in our comparison (ROC-AUC 0.682, 95% CI [0.546, 0.799]) with a stable operating point. In contrast, 3D CNNs show threshold instability, and transformers exhibit degenerate predictions, such as all-positive predictions. Confidence intervals are wide and overlapping, so we present these results as a controlled resource-performance frontier and a failure-mode taxonomy rather than as definitive superiority claims. For class-imbalanced lung cancer screening classification, 2D and 2.5D inputs provide a more reliable trade-off between performance, stability, and computational efficiency than full 3D representations.
- Abstract(参考訳): 3次元モデルは、体積的医用画像に好適であると広く考えられているが、その実用的価値は、計算コストと複雑さの増大を正当化するかどうかにかかっている。
新しいアーキテクチャを提案するのではなく、入力次元(2D, 2.5D, 3D)が畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)のモデル動作にどう影響するかを、一定のトレーニングプロトコルの下で検討する。
LIDC-IDRIデータをサポートするリークフリーNLSTコホート(n = 1,977)を用いて, 2.5D CNNは, 安定動作点を有するROC-AUC 0.682, 95% CI [0.546, 0.799])において, 最も好ましい差別安定トレードオフを提供する。
対照的に、3D CNNは閾値不安定を示し、トランスフォーマーは全正の予測のような退化予測を示す。
信頼区間は広範かつ重複しているので、これらの結果は、決定的な優越性主張というよりも、制御された資源パフォーマンスフロンティアと失敗モードの分類として提示する。
クラス不均衡な肺がんスクリーニング分類では、2Dと2.5Dの入力は、完全な3D表現よりもパフォーマンス、安定性、計算効率のトレードオフがより信頼できる。
関連論文リスト
- Halfway to 3D: Ensembling 2.5D and 3D Models for Robust COVID-19 CT Diagnosis [5.645096759437525]
胸部CT画像から新型コロナウイルス検出・疾患分類を行うための深層学習フレームワークを提案する。
このフレームワークは2.5Dと3Dの両方の表現を統合し、補完的なスライスレベルとボリューム情報をキャプチャする。
PHAROS-AIF-MIHベンチマークの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2026-03-16T05:24:10Z) - Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models [0.0]
最先端の船体セグメンテーション手法は、通常、大規模な注釈付きデータセットを必要とし、ドメインシフト時に深刻なパフォーマンス劣化に悩まされる。
本稿では,ボリューム容器分割に適応した事前学習型ビジョンファウンデーションモデル(DINOv3)を活用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-27T08:24:44Z) - Rapid Salient Object Detection with Difference Convolutional Neural Networks [49.838283141381716]
本稿では,資源制約のあるデバイスにSODをリアルタイムに展開する上での課題について述べる。
SODにおける従来の知恵と現代のCNNの表現力を組み合わせたネットワーク設計を提案する。
論文 参考訳(メタデータ) (2025-07-01T20:41:05Z) - Factorized Implicit Global Convolution for Automotive Computational Fluid Dynamics Prediction [52.32698071488864]
非常に大きな3DメッシュのCFD問題を効率的に解く新しいアーキテクチャであるFactized Implicit Global Convolution (FIGConv)を提案する。
FIGConvは、既存の3DニューラルCFDモデルよりも大幅に改善された2次複雑性の$O(N2)$を達成する。
業界標準のAhmedボディデータセットと大規模DrivAerNetデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-02-06T18:57:57Z) - MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [15.514511820130474]
我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文 参考訳(メタデータ) (2024-09-12T02:19:19Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - 2.75D: Boosting learning by representing 3D Medical imaging to 2D
features for small data [54.223614679807994]
3D畳み込みニューラルネットワーク(CNN)は、多くのディープラーニングタスクにおいて、2D CNNよりも優れたパフォーマンスを示し始めている。
3D CNNにトランスファー学習を適用することは、パブリックにトレーニング済みの3Dモデルがないために困難である。
本研究では,ボリュームデータの2次元戦略的表現,すなわち2.75Dを提案する。
その結果,2次元CNNネットワークをボリューム情報学習に用いることが可能となった。
論文 参考訳(メタデータ) (2020-02-11T08:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。