論文の概要: Frequency Domain Decomposition Translation for Enhanced Medical Image
Translation Using GANs
- arxiv url: http://arxiv.org/abs/2311.03175v1
- Date: Mon, 6 Nov 2023 15:09:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 14:00:04.690843
- Title: Frequency Domain Decomposition Translation for Enhanced Medical Image
Translation Using GANs
- Title(参考訳): GANを用いた医用画像翻訳のための周波数領域分解翻訳
- Authors: Zhuhui Wang, Jianwei Zuo, Xuliang Deng, Jiajia Luo
- Abstract要約: 周波数領域分解変換(FDDT)と呼ばれる新しい手法を提案する。
FDDTは元の画像を高周波成分と低周波成分に分解する。
我々はFDDTといくつかの主流ベースラインモデルを用いたMRI画像と自然画像の実験を行った。
- 参考スコア(独自算出の注目度): 1.695249173404529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical Image-to-image translation is a key task in computer vision and
generative artificial intelligence, and it is highly applicable to medical
image analysis. GAN-based methods are the mainstream image translation methods,
but they often ignore the variation and distribution of images in the frequency
domain, or only take simple measures to align high-frequency information, which
can lead to distortion and low quality of the generated images. To solve these
problems, we propose a novel method called frequency domain decomposition
translation (FDDT). This method decomposes the original image into a
high-frequency component and a low-frequency component, with the high-frequency
component containing the details and identity information, and the
low-frequency component containing the style information. Next, the
high-frequency and low-frequency components of the transformed image are
aligned with the transformed results of the high-frequency and low-frequency
components of the original image in the same frequency band in the spatial
domain, thus preserving the identity information of the image while destroying
as little stylistic information of the image as possible. We conduct extensive
experiments on MRI images and natural images with FDDT and several mainstream
baseline models, and we use four evaluation metrics to assess the quality of
the generated images. Compared with the baseline models, optimally, FDDT can
reduce Fr\'echet inception distance by up to 24.4%, structural similarity by up
to 4.4%, peak signal-to-noise ratio by up to 5.8%, and mean squared error by up
to 31%. Compared with the previous method, optimally, FDDT can reduce Fr\'echet
inception distance by up to 23.7%, structural similarity by up to 1.8%, peak
signal-to-noise ratio by up to 6.8%, and mean squared error by up to 31.6%.
- Abstract(参考訳): 医用画像変換はコンピュータビジョンと生成人工知能において重要な課題であり、医用画像解析に非常に適している。
GANベースの手法は主流の画像翻訳手法であるが、周波数領域における画像の変動や分布を無視することが多い。
これらの問題を解決するために、周波数領域分解変換(FDDT)と呼ばれる新しい手法を提案する。
原画像を高周波成分と低周波成分とに分解し、細部と同一性情報を含む高周波成分と、そのスタイル情報を含む低周波成分とを含む。
次に、変換された画像の高周波及び低周波成分は、空間領域内の同じ周波数帯域における原画像の高周波及び低周波成分の変換結果と一致し、画像の様式情報を極力破壊しつつ画像のアイデンティティ情報を保存する。
fddtと数種類のベースラインモデルを用いてmri画像と自然画像の広範な実験を行い,4つの評価指標を用いて画像の品質評価を行った。
基準モデルと比較して、fddtはfr\'echet開始距離を最大24.4%、構造的類似度を最大4.4%、ピーク信号対雑音比を最大5.8%、平均2乗誤差を最大31%削減できる。
従来の方法と比較して、fddtはfr\'echet開始距離を最大23.7%、構造的類似度を1.8%、ピーク信号対雑音比を最大6.8%、平均2乗誤差を最大31.6%削減できる。
関連論文リスト
- WaveFace: Authentic Face Restoration with Efficient Frequency Recovery [74.73492472409447]
拡散モデルは,1) 訓練の遅さと推論速度,2) アイデンティティの保存ときめ細かい顔の詳細の復元の失敗の2つの問題で批判されている。
本稿では,ウェーブレット変換によって分解される低周波・高周波成分を個別に考慮した周波数領域の問題を解決するためにWaveFaceを提案する。
本稿では、WaveFaceが、特にアイデンティティ保存の観点から、信頼性において最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-03-19T14:27:24Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Unpaired Optical Coherence Tomography Angiography Image Super-Resolution
via Frequency-Aware Inverse-Consistency GAN [6.717440708401628]
本稿では,GANに基づくOCTA画像の非ペア化超解像法を提案する。
また,再構成画像の正確なスペクトル化を容易にするため,識別器の周波数認識による逆方向の損失も提案する。
実験により,本手法は,他の最先端の未経験手法よりも定量的,視覚的に優れていることが示された。
論文 参考訳(メタデータ) (2023-09-29T14:19:51Z) - Cross-modulated Few-shot Image Generation for Colorectal Tissue
Classification [58.147396879490124]
XM-GANと名づけられた少数ショット生成法は,1塩基と1対の参照組織像を入力とし,高品質で多様な画像を生成する。
我々の知る限りでは、大腸組織像の少数ショット生成を最初に調査した人物である。
論文 参考訳(メタデータ) (2023-04-04T17:50:30Z) - fRegGAN with K-space Loss Regularization for Medical Image Translation [42.253647362909476]
GAN(Generative Adversarial Network)は、現実的な画像の生成において顕著な成功を収めている。
GANは低周波の周波数バイアスに悩まされる傾向にあり、それによって生成された画像の重要な構造が取り除かれる。
本稿では,fRegGANと呼ばれる教師付きRegGANアプローチに基づく新しい周波数対応画像画像変換フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-28T12:49:10Z) - Hierarchical Disentangled Representation for Invertible Image Denoising
and Beyond [14.432771193620702]
画像の高周波部分にノイズが現れる傾向にあるという潜在観測に着想を得て,完全可逆復調法を提案する。
ノイズ画像は、可逆変換により、清浄な低周波およびハイブリッドな高周波部品に分解する。
このように、ノイズのない低周波部品と高周波部品とを逆にマージして、デノナイジングをトラクタブルにする。
論文 参考訳(メタデータ) (2023-01-31T01:24:34Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Compressed Sensing for Photoacoustic Computed Tomography Using an
Untrained Neural Network [1.7237160821929758]
光音響(PA)CT(PACT)は様々な臨床応用において大きな可能性を秘めている。
測定されたチャンネルの数を減らしたり、検出されたビューを制限すると、アーティファクトやサイドローブが画像を汚染する可能性がある。
本稿では,未学習ニューラルネットワークを用いたPACTの圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2021-05-29T09:01:58Z) - Deep Unfolded Recovery of Sub-Nyquist Sampled Ultrasound Image [94.42139459221784]
本稿では,ISTAアルゴリズムの展開に基づく時空間領域におけるサブNyquistサンプルからの再構成手法を提案する。
本手法は,高品質な撮像性能を確保しつつ,配列要素数,サンプリングレート,計算時間を削減できる。
論文 参考訳(メタデータ) (2021-03-01T19:19:38Z) - Frequency Domain Image Translation: More Photo-realistic, Better
Identity-preserving [36.606114597585396]
本稿では,周波数情報を利用した新しい周波数領域画像翻訳フレームワークを提案する。
我々のキーとなる考え方は、画像を低周波および高周波の成分に分解することであり、そこでは、高周波の特徴がアイデンティティに似たオブジェクト構造をキャプチャする。
広汎な実験と改善により、FDITはソース画像のアイデンティティを効果的に保存し、フォトリアリスティック画像を生成する。
論文 参考訳(メタデータ) (2020-11-27T08:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。