論文の概要: Is Autoencoder Truly Applicable for 3D CT Super-Resolution?
- arxiv url: http://arxiv.org/abs/2302.10272v1
- Date: Mon, 23 Jan 2023 12:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 14:37:12.539856
- Title: Is Autoencoder Truly Applicable for 3D CT Super-Resolution?
- Title(参考訳): オートエンコーダは3次元CT超解像に真に適用可能か?
- Authors: Weixun Luo, Xiaodan Xing, Guang Yang
- Abstract要約: オートエンコーダ(AE)とその変種は、様々な医用画像解析タスクに広く応用されている。
AEモデルは3次元CTデータの単一画像超解像(SISR)には適用できない。
本研究は,3次元CT SISRタスクにおけるAEアーキテクチャの適合性に関する最初の比較研究である。
- 参考スコア(独自算出の注目度): 1.711876685506149
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Featured by a bottleneck structure, autoencoder (AE) and its variants have
been largely applied in various medical image analysis tasks, such as
segmentation, reconstruction and de-noising. Despite of their promising
performances in aforementioned tasks, in this paper, we claim that AE models
are not applicable to single image super-resolution (SISR) for 3D CT data. Our
hypothesis is that the bottleneck architecture that resizes feature maps in AE
models degrades the details of input images, thus can sabotage the performance
of super-resolution. Although U-Net proposed skip connections that merge
information from different levels, we claim that the degrading impact of
feature resizing operations could hardly be removed by skip connections. By
conducting large-scale ablation experiments and comparing the performance
between models with and without the bottleneck design on a public CT lung
dataset , we have discovered that AE models, including U-Net, have failed to
achieve a compatible SISR result ($p<0.05$ by Student's t-test) compared to the
baseline model. Our work is the first comparative study investigating the
suitability of AE architecture for 3D CT SISR tasks and brings a rationale for
researchers to re-think the choice of model architectures especially for 3D CT
SISR tasks. The full implementation and trained models can be found at:
https://github.com/Roldbach/Autoencoder-3D-CT-SISR
- Abstract(参考訳): ボトルネック構造を特徴とするオートエンコーダ(ae)とその変種は、セグメンテーション、再構築、ノイズ除去など、様々な医療画像解析タスクに広く適用されている。
上述した課題における有望な性能にもかかわらず、本論文では、AEモデルは3次元CTデータの単一画像超解像(SISR)には適用できないと主張している。
我々の仮説は、AEモデルの特徴マップを縮小するボトルネックアーキテクチャが入力画像の細部を劣化させ、超解像の性能を妨害できるというものである。
u-netは異なるレベルの情報をマージするスキップ接続を提案したが、機能再サイズ操作の劣化の影響はスキップ接続によって除去できないと主張している。
大規模アブレーション実験を行ない,一般のCT肺データセット上でボトルネック設計を伴わないモデルの性能を比較することにより,U-Netを含むAEモデルでは,ベースラインモデルと比較して相容れないSISR結果(p<0.05ドル)が得られた。
我々の研究は、3D CT SISRタスクにおけるAEアーキテクチャの適合性に関する最初の比較研究であり、特に3D CT SISRタスクにおけるモデルアーキテクチャの選択を再考する根拠となっている。
完全な実装とトレーニングされたモデルは、https://github.com/roldbach/autoencoder-3d-ct-sisrで見ることができる。
関連論文リスト
- Decoupled DETR For Few-shot Object Detection [4.520231308678286]
サンプル不均衡と弱い特徴伝搬の深刻な問題に対処するためにFSODモデルを改善した。
出力機能としてデコーダ層を動的に融合できる統一デコーダモジュールを構築しました。
提案するモジュールは,微調整とメタラーニングの両方のパラダイムにおいて,5%から10%の安定的な改善を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-20T07:10:39Z) - Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly
Detectors [117.61449210940955]
ビデオフレームレベルで適用された軽量マスク付きオートエンコーダ(AE)に基づく効率的な異常事象検出モデルを提案する。
動き勾配に基づく重みトークンへのアプローチを導入し、静的背景シーンから前景オブジェクトへ焦点を移す。
トレーニングビデオの強化のために合成異常事象を生成し,マスク付きAEモデルを用いてオリジナルのフレームを共同で再構築する。
論文 参考訳(メタデータ) (2023-06-21T06:18:05Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - HiMODE: A Hybrid Monocular Omnidirectional Depth Estimation Model [3.5290359800552946]
HiMODE は CNN+ Transformer アーキテクチャに基づく新しい単分子全方位深度推定モデルである。
360deg単分子深度推定において,HiMODEは最先端の性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-04-11T11:11:43Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Aug3D-RPN: Improving Monocular 3D Object Detection by Synthetic Images
with Virtual Depth [64.29043589521308]
仮想深度で画像を合成することでトレーニングデータを増強するレンダリングモジュールを提案する。
レンダリングモジュールは、RGB画像と対応するスパース深度画像とを入力として、さまざまなフォトリアリスティック合成画像を出力する。
さらに,深度推定タスクを通じて共同で最適化することで,検出モデルを改善する補助モジュールを導入する。
論文 参考訳(メタデータ) (2021-07-28T11:00:47Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - Segmentation of Macular Edema Datasets with Small Residual 3D U-Net
Architectures [5.881334886616738]
本稿では, 深部畳み込み型ニューラルネットワークの黄斑浮腫セグメンテーション問題への応用について検討する。
一般的な信念とは対照的に、このアプリケーション設定内のニューラルアーキテクチャは、大量のトレーニングサンプルを必要とせずに、目に見えないテストイメージ上での人間レベルのパフォーマンスに近いパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2020-05-10T15:34:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。