論文の概要: Super-Resolution Enhancement of Medical Images Based on Diffusion Model: An Optimization Scheme for Low-Resolution Gastric Images
- arxiv url: http://arxiv.org/abs/2512.22209v1
- Date: Mon, 22 Dec 2025 03:37:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:29.88997
- Title: Super-Resolution Enhancement of Medical Images Based on Diffusion Model: An Optimization Scheme for Low-Resolution Gastric Images
- Title(参考訳): 拡散モデルに基づく医用画像の高分解能化:低分解能胃画像の最適化手法
- Authors: Haozhe Jia,
- Abstract要約: カプセル内視鏡は最小侵襲の消化管画像撮影を可能にしているが、その臨床的有用性は、キャプチャー画像の本質的に低解像度化によって制限されている。
本研究では, カプセル内視鏡像をデータ駆動方式で高精細化するための拡散型超解像フレームワークについて検討する。
- 参考スコア(独自算出の注目度): 1.416562653124415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capsule endoscopy has enabled minimally invasive gastrointestinal imaging, but its clinical utility is limited by the inherently low resolution of captured images due to hardware, power, and transmission constraints. This limitation hampers the identification of fine-grained mucosal textures and subtle pathological features essential for early diagnosis. This work investigates a diffusion-based super-resolution framework to enhance capsule endoscopy images in a data-driven and anatomically consistent manner. We adopt the SR3 (Super-Resolution via Repeated Refinement) framework built upon Denoising Diffusion Probabilistic Models (DDPMs) to learn a probabilistic mapping from low-resolution to high-resolution images. Unlike GAN-based approaches that often suffer from training instability and hallucination artifacts, diffusion models provide stable likelihood-based training and improved structural fidelity. The HyperKvasir dataset, a large-scale publicly available gastrointestinal endoscopy dataset, is used for training and evaluation. Quantitative results demonstrate that the proposed method significantly outperforms bicubic interpolation and GAN-based super-resolution methods such as ESRGAN, achieving PSNR of 27.5 dB and SSIM of 0.65 for a baseline model, and improving to 29.3 dB and 0.71 with architectural enhancements including attention mechanisms. Qualitative results show improved preservation of anatomical boundaries, vascular patterns, and lesion structures. These findings indicate that diffusion-based super-resolution is a promising approach for enhancing non-invasive medical imaging, particularly in capsule endoscopy where image resolution is fundamentally constrained.
- Abstract(参考訳): カプセル内視鏡は、最小侵襲の消化管画像撮影を可能にしているが、その臨床的有用性は、ハードウェア、電力、透過性の制約による、本質的に低解像度の撮像画像によって制限されている。
この制限は、早期診断に欠かせないきめ細かい粘膜のテクスチャーと微妙な病理特徴の同定を妨げている。
本研究は, カプセル内視鏡像をデータ駆動型, 解剖学的に一貫した方法で高精細化するための拡散型超解像フレームワークについて検討する。
拡散確率モデル(DDPM)に基づいて構築されたSR3(Super-Resolution via Repeated Refinement)フレームワークを用いて,低分解能画像から高分解能画像への確率的マッピングを学習する。
GANベースのアプローチでは、不安定性や幻覚のアーチファクトのトレーニングに悩まされることが多いが、拡散モデルは安定した確率ベースのトレーニングを提供し、構造的忠実性を改善している。
HyperKvasirデータセットは、大規模な公開消化管内視鏡データセットで、トレーニングと評価に使用されている。
その結果,提案手法はバイコビック補間法やESRGANなどの超解像法,ベースラインモデルのPSNR27.5dB,SSIM0.65を達成し,アテンション機構を含むアーキテクチャ改善により29.3dB,0.71に改善した。
その結果, 解剖学的境界, 血管柄, 病変の保存性は改善した。
以上の結果から,拡散型超解像は非侵襲的医用画像,特に画像解像度が根本的に制約されたカプセル内視鏡において,望まれるアプローチであることが示唆された。
関連論文リスト
- DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation [17.396365010722423]
網膜血管形態は糖尿病、緑内障、高血圧などの疾患の診断に重要である。
従来のセグメンテーション手法は、トレーニングとテストのデータが同様の分布を共有していると仮定する。
本稿では,網膜血管画像分割のための新しいアプローチ DGSSA を提案する。
論文 参考訳(メタデータ) (2025-01-07T01:47:57Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - Super-resolution of biomedical volumes with 2D supervision [84.5255884646906]
超解像のための仮設スライス拡散は、生物学的標本のすべての空間次元にわたるデータ生成分布の固有同値性を利用する。
我々は,高解像度2次元画像の高速取得を特徴とするSliceRの組織学的刺激(SRH)への応用に着目する。
論文 参考訳(メタデータ) (2024-04-15T02:41:55Z) - LLCaps: Learning to Illuminate Low-Light Capsule Endoscopy with Curved
Wavelet Attention and Reverse Diffusion [24.560417980602928]
ワイヤレスカプセル内視鏡(Wireless capsule endoscopy, WCE)は、消化器疾患の無痛・非侵襲診断ツールである。
医学領域における深層学習に基づく低照度画像強調(LLIE)は徐々に研究者を惹きつける。
マルチスケール畳み込みニューラルネットワーク(CNN)と逆拡散プロセスに基づく WCE LLIE フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-05T17:23:42Z) - Does image resolution impact chest X-ray based fine-grained
Tuberculosis-consistent lesion segmentation? [3.3086274755158325]
ディープラーニングモデルは、計算資源の不足を理由に、画像解像度の低下を訓練していると伝えられている。
本研究では,インセプションV3ベースのUNetモデルを様々な画像/マスク解像度を用いて学習することで得られる性能向上について検討した。
論文 参考訳(メタデータ) (2023-01-10T15:34:39Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Modeling and Enhancing Low-quality Retinal Fundus Images [167.02325845822276]
低画質の眼底画像は臨床観察における不確実性を高め、誤診のリスクを引き起こす。
本稿では,グローバルな劣化要因を抑えるために,臨床指向の基盤拡張ネットワーク(cofe-Net)を提案する。
合成画像と実画像の両方の実験により、我々のアルゴリズムは網膜の細部を失うことなく、低品質の眼底画像を効果的に補正することを示した。
論文 参考訳(メタデータ) (2020-05-12T08:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。