論文の概要: Adaptively Re-weighting Multi-Loss Untrained Transformer for Sparse-View
Cone-Beam CT Reconstruction
- arxiv url: http://arxiv.org/abs/2203.12476v1
- Date: Wed, 23 Mar 2022 15:16:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 15:20:31.586756
- Title: Adaptively Re-weighting Multi-Loss Untrained Transformer for Sparse-View
Cone-Beam CT Reconstruction
- Title(参考訳): Sparse-View Cone-Beam CT 再構成のための適応的再重み付け多損失無拘束変圧器
- Authors: Minghui Wu, Yangdi Xu, Yingying Xu, Guangwei Wu, Qingqing Chen,
Hongxiang Lin
- Abstract要約: 本研究では、CBCT逆解器をトレーニングデータなしで適合させる新しい非学習変換器を提案する。
主に、数十億のネットワーク重みのトレーニングされていない3次元変換器と、可変重みを持つ多層損失関数で構成されている。
その結果, 画像品質の指標に有意な改善がみられた。
- 参考スコア(独自算出の注目度): 2.6763887816682543
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cone-Beam Computed Tomography (CBCT) has been proven useful in diagnosis, but
how to shorten scanning time with lower radiation dosage and how to efficiently
reconstruct 3D image remain as the main issues for clinical practice. The
recent development of tomographic image reconstruction on sparse-view
measurements employs deep neural networks in a supervised way to tackle such
issues, whereas the success of model training requires quantity and quality of
the given paired measurements/images. We propose a novel untrained Transformer
to fit the CBCT inverse solver without training data. It is mainly comprised of
an untrained 3D Transformer of billions of network weights and a multi-level
loss function with variable weights. Unlike conventional deep neural networks
(DNNs), there is no requirement of training steps in our approach. Upon
observing the hardship of optimising Transformer, the variable weights within
the loss function are designed to automatically update together with the
iteration process, ultimately stabilising its optimisation. We evaluate the
proposed approach on two publicly available datasets: SPARE and Walnut. The
results show a significant performance improvement on image quality metrics
with streak artefact reduction in the visualisation. We also provide a clinical
report by an experienced radiologist to assess our reconstructed images in a
diagnosis point of view. The source code and the optimised models are available
from the corresponding author on request at the moment.
- Abstract(参考訳): コーンビームct(cbct)は診断に有用であることが証明されているが、低放射線量でスキャン時間を短縮し、3d画像を効率的に再構築する方法が臨床における主要な課題である。
近年のsparse-view計測による断層画像再構成の進展は, 深層ニューラルネットワークを用いてこのような課題に対処しているが, モデルトレーニングの成功には, 与えられた対の計測/画像の量と品質が必要となる。
本研究では、CBCT逆解器をトレーニングデータなしで適合させる新しい非学習変換器を提案する。
主に、数十億のネットワーク重みのトレーニングされていない3次元変換器と、可変重みを持つ多層損失関数で構成されている。
従来のディープニューラルネットワーク(DNN)とは異なり、我々のアプローチではトレーニングステップは必要ありません。
最適化トランスフォーマーの難しさを観察すると、損失関数内の変動重みは繰り返し処理とともに自動的に更新され、最終的に最適化が安定化される。
提案手法をSPAREとWalnutの2つの公開データセットで評価した。
その結果,画像の視認性が低下し,画像品質指標の性能が著しく向上した。
また, 診断の観点から, 再建画像の評価を行うため, 経験者による臨床報告も行った。
ソースコードと最適化されたモデルは現在、要求に応じて対応する著者から入手可能である。
関連論文リスト
- Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.197385954021456]
臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。
スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。
現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文 参考訳(メタデータ) (2024-06-10T02:20:26Z) - DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.88792390480343]
本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルだが効果的なアプローチであるDEEMを提案する。
DEEMは、トレーニング可能なパラメータが少なく、事前学習データが少なく、ベースモデルのサイズが小さいことを利用して、モデル幻覚を軽減するために、強化された堅牢性と優れた能力を示す。
論文 参考訳(メタデータ) (2024-05-24T05:46:04Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Deep Optimal Transport: A Practical Algorithm for Photo-realistic Image Restoration [31.58365182858562]
事前学習したモデルの知覚的品質および/または平均二乗誤差(MSE)を制御できる画像復元アルゴリズムを提案する。
モデルによって復元された約1ダースの画像を考えると、新たな画像に対するモデルの知覚的品質と/またはMSEを、それ以上の訓練をすることなく大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-06-04T12:21:53Z) - FastMIM: Expediting Masked Image Modeling Pre-training for Vision [65.47756720190155]
FastMIMは低解像度の入力画像で視覚バックボーンを事前訓練するためのフレームワークである。
入力画像のRGB値の代わりに、向き付け勾配のヒストグラム(Histograms of Oriented Gradients,HOG)機能を再構成する。
ViT-B/Swin-Bをバックボーンとし、ImageNet-1Kで83.8%/84.1%のトップ1の精度を達成できる。
論文 参考訳(メタデータ) (2022-12-13T14:09:32Z) - Deep Learning for Material Decomposition in Photon-Counting CT [0.5801044612920815]
そこで本研究では,PCCTにおける材料分解のための新たな深層学習ソリューションを提案する。
提案手法は,最大推定値,変分法,および完全学習ネットワークよりも優れる。
論文 参考訳(メタデータ) (2022-08-05T19:05:16Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - A Two-step-training Deep Learning Framework for Real-time Computational
Imaging without Physics Priors [0.0]
本稿では,物理を前提としないリアルタイムな計算画像作成のための2段階学習用DL(TST-DL)フレームワークを提案する。
まず、モデルを直接学習するために、単一の完全接続層(FCL)をトレーニングする。
そして、このFCLを未訓練のU-Netアーキテクチャで固定固定し、第2ステップのトレーニングを行い、出力画像の忠実性を改善する。
論文 参考訳(メタデータ) (2020-01-10T15:05:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。