論文の概要: RealDeal: Enhancing Realism and Details in Brain Image Generation via Image-to-Image Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.18830v1
- Date: Thu, 24 Jul 2025 22:04:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.771673
- Title: RealDeal: Enhancing Realism and Details in Brain Image Generation via Image-to-Image Diffusion Models
- Title(参考訳): RealDeal: 画像と画像の拡散モデルによる脳画像生成におけるリアリズムの強化と詳細化
- Authors: Shen Zhu, Yinzhu Jin, Tyler Spears, Ifrah Zawar, P. Thomas Fletcher,
- Abstract要約: この研究は、イメージ・ツー・イメージ拡散モデルとして、リアリズムの強化と詳細付加プロセスを定式化している。
本稿では,RealDealが生成した画像のノイズ分布,シャープさ,テクスチャの両面での現実性を示すための新しい指標を提案する。
- 参考スコア(独自算出の注目度): 1.456352735394398
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose image-to-image diffusion models that are designed to enhance the realism and details of generated brain images by introducing sharp edges, fine textures, subtle anatomical features, and imaging noise. Generative models have been widely adopted in the biomedical domain, especially in image generation applications. Latent diffusion models achieve state-of-the-art results in generating brain MRIs. However, due to latent compression, generated images from these models are overly smooth, lacking fine anatomical structures and scan acquisition noise that are typically seen in real images. This work formulates the realism enhancing and detail adding process as image-to-image diffusion models, which refines the quality of LDM-generated images. We employ commonly used metrics like FID and LPIPS for image realism assessment. Furthermore, we introduce new metrics to demonstrate the realism of images generated by RealDeal in terms of image noise distribution, sharpness, and texture.
- Abstract(参考訳): 本稿では、鋭いエッジ、きめ細かいテクスチャ、微妙な解剖学的特徴、画像ノイズを導入して、生成した脳画像の現実性と詳細性を高めるために設計された画像間拡散モデルを提案する。
生成モデルは、バイオメディカル領域、特に画像生成の分野で広く採用されている。
潜時拡散モデルでは、脳MRIを生成するための最先端の結果が得られる。
しかしながら、遅延圧縮のため、これらのモデルから生成された画像は過度に滑らかであり、微細な解剖学的構造が欠如し、実際の画像でよく見られるスキャン取得ノイズが欠けている。
本研究は,LDM生成画像の品質を向上するイメージ・ツー・イメージ拡散モデルとして,リアリズムの強化と詳細付加プロセスの定式化を行う。
画像リアリズム評価には、FIDやLPIPSなどの一般的なメトリクスを用いる。
さらに,RealDealが生成した画像のノイズ分布,シャープさ,テクスチャの両面での現実性を示すための新しい指標を提案する。
関連論文リスト
- Multi-focal Conditioned Latent Diffusion for Person Image Synthesis [59.113899155476005]
遅延拡散モデル(LDM)は高解像度画像生成において強力な機能を示した。
これらの制約に対処する多焦点条件付き潜時拡散法(MCLD)を提案する。
本手法では,顔の同一性やテクスチャ固有の情報を効果的に統合する多焦点条件アグリゲーションモジュールを利用する。
論文 参考訳(メタデータ) (2025-03-19T20:50:10Z) - FashionR2R: Texture-preserving Rendered-to-Real Image Translation with Diffusion Models [14.596090302381647]
本稿では,レンダリングの制御に基づく拡散モデルから生成するパワーを利用して,レンダリング画像のフォトリアリズム向上について検討する。
ドメイン知識注入(Domain Knowledge Injection, DKI)と現実画像生成(Realistic Image Generation, RIG)という2つの段階から構成される。
論文 参考訳(メタデータ) (2024-10-18T12:48:22Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - XReal: Realistic Anatomy and Pathology-Aware X-ray Generation via Controllable Diffusion Model [0.7381551917607596]
大規模な生成モデルは、視覚的に魅力的な画像を生成するという印象的な能力を示している。
しかし、彼らは幻覚障害や解剖学的に不正確なアウトプットの発生に悩まされ続けている。
胸部X線画像を生成するための新しい制御可能な拡散モデルであるXRealを提案する。
論文 参考訳(メタデータ) (2024-03-14T10:03:58Z) - RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models [42.20230095700904]
RealCompoは、新しいトレーニングフリーで、移行フレンドリーなテキスト・ツー・イメージ生成フレームワークである。
復調過程における2つのモデルの強みのバランスをとるために,直感的で斬新なバランサを提案する。
我々のRealCompoは、幅広い空間認識画像拡散モデルとスタイル化された拡散モデルでシームレスに拡張できる。
論文 参考訳(メタデータ) (2024-02-20T10:56:52Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Local Statistics for Generative Image Detection [1.565361244756411]
拡散モデル (DM) はガウスノイズから画像の合成を学ぶ生成モデルである。
本稿では,デジタルカメラ画像とDM生成画像とを区別するバイエルパターンと局所統計値の有効性を強調した。
論文 参考訳(メタデータ) (2023-10-25T14:47:32Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Generation of Structurally Realistic Retinal Fundus Images with
Diffusion Models [1.9346186297861747]
血管構造を創出するために動脈・静脈マスクを作製し,網膜底部像を作製する条件を定めている。
提案手法はよりリアルな血管構造を持つ高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2023-05-11T14:09:05Z) - Natural scene reconstruction from fMRI signals using generative latent
diffusion [1.90365714903665]
我々はBrain-Diffuserと呼ばれる2段階のシーン再構築フレームワークを提示する。
第1段階では、VDVAE(Very Deep Vari Autoencoder)モデルを用いて、低レベル特性と全体レイアウトをキャプチャする画像を再構成する。
第2段階では、予測されたマルチモーダル(テキストおよび視覚)特徴に基づいて、遅延拡散モデルのイメージ・ツー・イメージ・フレームワークを使用する。
論文 参考訳(メタデータ) (2023-03-09T15:24:26Z) - NeRFInvertor: High Fidelity NeRF-GAN Inversion for Single-shot Real
Image Animation [66.0838349951456]
Nerfベースの生成モデルは、一貫した3次元幾何で高品質な画像を生成する能力を示している。
本研究では,このNeRF-GANモデルを外科的に微調整し,実物体の高忠実度アニメーションを単一画像のみで実現するための普遍的手法を提案する。
論文 参考訳(メタデータ) (2022-11-30T18:36:45Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。