論文の概要: OSNet & MNetO: Two Types of General Reconstruction Architectures for
Linear Computed Tomography in Multi-Scenarios
- arxiv url: http://arxiv.org/abs/2309.11858v2
- Date: Mon, 25 Sep 2023 14:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 10:48:13.366210
- Title: OSNet & MNetO: Two Types of General Reconstruction Architectures for
Linear Computed Tomography in Multi-Scenarios
- Title(参考訳): OSNet & MNetO:マルチシナリオにおける線形CTのための2種類の汎用再構成アーキテクチャ
- Authors: Zhisheng Wang, Zihan Deng, Fenglin Liu, Yixing Huang, Haijun Yu and
Junning Cui
- Abstract要約: 本稿では,リニアCT(リニア・コンピュート・トモグラフィ)画像に対する2種類の再構成アーキテクチャを提案する。
1つ目は、複数のDBP画像をオーバーレイして完全なDBP画像を取得し、次にネットワークを使ってオーバーレイするヒルベルトフィルタ関数を学習する。
2つ目は複数のネットワークを使用して、複数の線形走査のDBP画像に対して異なる方向のヒルベルトフィルタリングモデルを訓練する。
- 参考スコア(独自算出の注目度): 15.69509955931938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, linear computed tomography (LCT) systems have actively attracted
attention. To weaken projection truncation and image the region of interest
(ROI) for LCT, the backprojection filtration (BPF) algorithm is an effective
solution. However, in BPF for LCT, it is difficult to achieve stable interior
reconstruction, and for differentiated backprojection (DBP) images of LCT,
multiple rotation-finite inversion of Hilbert transform (Hilbert
filtering)-inverse rotation operations will blur the image. To satisfy multiple
reconstruction scenarios for LCT, including interior ROI, complete object, and
exterior region beyond field-of-view (FOV), and avoid the rotation operations
of Hilbert filtering, we propose two types of reconstruction architectures. The
first overlays multiple DBP images to obtain a complete DBP image, then uses a
network to learn the overlying Hilbert filtering function, referred to as the
Overlay-Single Network (OSNet). The second uses multiple networks to train
different directional Hilbert filtering models for DBP images of multiple
linear scannings, respectively, and then overlays the reconstructed results,
i.e., Multiple Networks Overlaying (MNetO). In two architectures, we introduce
a Swin Transformer (ST) block to the generator of pix2pixGAN to extract both
local and global features from DBP images at the same time. We investigate two
architectures from different networks, FOV sizes, pixel sizes, number of
projections, geometric magnification, and processing time. Experimental results
show that two architectures can both recover images. OSNet outperforms BPF in
various scenarios. For the different networks, ST-pix2pixGAN is superior to
pix2pixGAN and CycleGAN. MNetO exhibits a few artifacts due to the differences
among the multiple models, but any one of its models is suitable for imaging
the exterior edge in a certain direction.
- Abstract(参考訳): 近年,線形CTシステム(LCT)が注目されている。
LCTの投射トランケーションを弱め、関心領域(ROI)を画像化するためには、後方投射フィルタリング(BPF)アルゴリズムが有効な解である。
しかし, LCT のBPF では安定した内部再構成が困難であり, LCT の差分後方投影 (DBP) 画像では, ヒルベルト変換 (ヒルベルトフィルタ) 逆回転操作の多重回転有限反転が画像のぼかしとなる。
内部roi,完全物体,外部領域を含むlctの複数の再構成シナリオをfov(field-of-view)で満たし,ヒルベルトフィルタの回転操作を回避すべく,2種類の再構成アーキテクチャを提案する。
1つ目は、複数のDBP画像をオーバーレイして完全なDBP画像を取得し、次にネットワークを使用してオーバーレイ・シング・ネットワーク(OSNet)と呼ばれるオーバーレイヒルベルトフィルタリング関数を学習する。
2つ目は、複数の線形走査のDBP画像に対して異なる方向のヒルベルトフィルタリングモデルをトレーニングするために複数のネットワークを使用し、再構成された結果、すなわちMNetOをオーバーレイする。
2 つのアーキテクチャにおいて,DBP 画像から局所的特徴と大域的特徴を同時に抽出する pix2pixGAN の生成元に Swin Transformer (ST) ブロックを導入する。
本研究では,fovサイズ,画素サイズ,投影数,幾何倍化,処理時間という,ネットワークの異なる2つのアーキテクチャを調査した。
実験の結果,2つのアーキテクチャで画像の復元が可能であった。
OSNetは様々なシナリオでBPFを上回っている。
異なるネットワークでは、ST-pix2pixGANはPix2pixGANとCycleGANより優れている。
MNetOは複数のモデルの違いによっていくつかの人工物を示すが、そのモデルのいずれかが特定の方向に外縁を撮像するのに適している。
関連論文リスト
- CoCPF: Coordinate-based Continuous Projection Field for Ill-Posed Inverse Problem in Imaging [78.734927709231]
スパース・ビュー・コンピュート・トモグラフィー(SVCT)の再構成は,スパース・サンプリングによるCT画像の取得を目的としている。
暗黙的な神経表現(INR)技術は、不備のため、その分野に「かなりの穴」(すなわち、未モデル化空間)を残し、準最適結果をもたらす可能性がある。
SVCT再構成のためのホールフリー表現場を構築することを目的としたコーディネート型連続射影場(CoCPF)を提案する。
論文 参考訳(メタデータ) (2024-06-21T08:38:30Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - A Model-data-driven Network Embedding Multidimensional Features for
Tomographic SAR Imaging [5.489791364472879]
多次元特徴量に基づくトモSARイメージングを実現するためのモデルデータ駆動型ネットワークを提案する。
画像シーンの多次元的特徴を効果的に向上するために、2つの2次元処理モジュール(畳み込みエンコーダ-デコーダ構造)を追加します。
従来のCS-based FISTA法とDL-based gamma-Net法と比較して,提案手法は良好な画像精度を有しつつ,完全性を向上させる。
論文 参考訳(メタデータ) (2022-11-28T02:01:43Z) - Adaptive Local Implicit Image Function for Arbitrary-scale
Super-resolution [61.95533972380704]
局所暗黙画像関数(LIIF)は、対応する座標を入力として、画素値が拡張される連続関数として画像を表す。
LIIFは任意のスケールの超解像タスクに適用でき、その結果、様々なアップスケーリング要因に対して単一の効率的かつ効率的なモデルが得られる。
この問題を軽減するために,新しい適応型局所像関数(A-LIIF)を提案する。
論文 参考訳(メタデータ) (2022-08-07T11:23:23Z) - PC-GANs: Progressive Compensation Generative Adversarial Networks for
Pan-sharpening [50.943080184828524]
空間情報とスペクトル情報の漸進的補償によりMS画像のシャープ化を行うパンシャーピングの新しい2段階モデルを提案する。
モデル全体が三重GANで構成されており、特定のアーキテクチャに基づいて、三重GANを同時に訓練できるように、共同補償損失関数が設計されている。
論文 参考訳(メタデータ) (2022-07-29T03:09:21Z) - Detail-Preserving Transformer for Light Field Image Super-Resolution [15.53525700552796]
我々は,光場超解像をシーケンス・ツー・シーケンスの再構成タスクとして扱うことにより,トランスフォーマー上に構築された新しい定式化を行った。
本稿では,光場の勾配マップを利用してシーケンス学習のガイドを行うことにより,ディテール保存型変換器(DPT)を提案する。
DPTは2つのブランチで構成され、それぞれがトランスフォーマーに関連付けられ、オリジナルまたはグラデーション画像シーケンスから学習する。
論文 参考訳(メタデータ) (2022-01-02T12:33:23Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z) - Y-net: Multi-scale feature aggregation network with wavelet structure
similarity loss function for single image dehazing [18.479856828292935]
本稿では,その構造から命名されたY-netを提案する。
このネットワークは、マルチスケールの特徴マップを集約することで、鮮明な画像を再構成する。
また、トレーニングステップにおいてウェーブレット構造シミュラリティ(W-SSIM)損失関数を提案する。
論文 参考訳(メタデータ) (2020-03-31T02:07:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。