論文の概要: A Unified Low-level Foundation Model for Enhancing Pathology Image Quality
- arxiv url: http://arxiv.org/abs/2509.01071v1
- Date: Mon, 01 Sep 2025 02:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.527017
- Title: A Unified Low-level Foundation Model for Enhancing Pathology Image Quality
- Title(参考訳): 画像品質向上のための統一低レベル基礎モデル
- Authors: Ziyi Liu, Zhe Xu, Jiabo Ma, Wenqaing Li, Junlin Hou, Fuxiang Huang, Xi Wang, Ronald Cheong Kin Chan, Terence Tsz Wai Wong, Hao Chen,
- Abstract要約: 現実の病理画像は、しばしばノイズ、ぼかし、低解像度などの劣化に悩まされる。
本稿では,修復作業における画像品質の向上が可能な低レベル病理基盤モデル(LPFM)を提案する。
我々は,34種類の組織と5種類の染色プロトコルにわたる87,810枚のスライド画像(WSI)をキュレートしたデータセットで訓練した。
- 参考スコア(独自算出の注目度): 19.911568152326275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models have revolutionized computational pathology by achieving remarkable success in high-level diagnostic tasks, yet the critical challenge of low-level image enhancement remains largely unaddressed. Real-world pathology images frequently suffer from degradations such as noise, blur, and low resolution due to slide preparation artifacts, staining variability, and imaging constraints, while the reliance on physical staining introduces significant costs, delays, and inconsistency. Although existing methods target individual problems like denoising or super-resolution, their task-specific designs lack the versatility to handle the diverse low-level vision challenges encountered in practice. To bridge this gap, we propose the first unified Low-level Pathology Foundation Model (LPFM), capable of enhancing image quality in restoration tasks, including super-resolution, deblurring, and denoising, as well as facilitating image translation tasks like virtual staining (H&E and special stains), all through a single adaptable architecture. Our approach introduces a contrastive pre-trained encoder that learns transferable, stain-invariant feature representations from 190 million unlabeled pathology images, enabling robust identification of degradation patterns. A unified conditional diffusion process dynamically adapts to specific tasks via textual prompts, ensuring precise control over output quality. Trained on a curated dataset of 87,810 whole slied images (WSIs) across 34 tissue types and 5 staining protocols, LPFM demonstrates statistically significant improvements (p<0.01) over state-of-the-art methods in most tasks (56/66), achieving Peak Signal-to-Noise Ratio (PSNR) gains of 10-15% for image restoration and Structural Similarity Index Measure (SSIM) improvements of 12-18% for virtual staining.
- Abstract(参考訳): 基礎モデルは、ハイレベルな診断タスクにおいて顕著な成功を収めることによって、計算病理学に革命をもたらしたが、低レベルな画像強調の重要な課題は、いまだほとんど未解決のままである。
現実の病理画像は、しばしばノイズ、ぼかし、低分解能などのノイズ、染色性、画像の制約による劣化に悩まされるが、物理的染色への依存は、かなりのコスト、遅延、不整合をもたらす。
既存の手法は、妄想や超解像といった個々の問題をターゲットにしているが、それらのタスク固有の設計は、実際に遭遇する様々な低レベルのビジョン課題に対処する汎用性に欠けていた。
このギャップを埋めるために、我々は、超解像、脱臭、脱臭を含む修復作業における画像品質を向上させるとともに、仮想染色(H&Eと特殊染色)のような画像翻訳作業を容易にし、単一の適応可能なアーキテクチャにより、最初の低レベル病理基盤モデル(LPFM)を提案する。
提案手法では,1億9000万枚の未ラベルの病理画像から,伝達可能な,染色不変な特徴表現を学習し,劣化パターンの堅牢な同定を可能にするコントラスト付き事前学習エンコーダを提案する。
統一された条件拡散プロセスは、テキストプロンプトを介して特定のタスクに動的に適応し、出力品質を正確に制御する。
34種類の組織タイプと5つの染色プロトコルにわたる87,810枚のスライド画像(WSI)のキュレートデータセットに基づいて、LPFMは、ほとんどのタスク(56/66)における最先端の手法よりも統計的に有意な改善(p<0.01)を示し、画像修復と構造的類似度指標(SSIM)の改善は10~15%向上した。
関連論文リスト
- Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification [0.0]
大腸癌の検出は、患者の生存率を高めるために重要である。
大腸内視鏡は、適切な高品質の内視鏡画像を取得することに依存する。
Few-Shot Learning アーキテクチャにより、我々のモデルは、目に見えないきめ細かな内視鏡画像パターンに迅速に適応できる。
精度は90.1%,精度は0.845,リコールは0.942,F1スコアは0.891であった。
論文 参考訳(メタデータ) (2025-05-30T16:54:51Z) - MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction [11.150364980770675]
本研究では、まず動きを特徴付ける動き認識画像合成法(MAISY)を提案する。
胸部CTおよび頭部CTを用いた実験では、我々のモデルは最先端のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-07T03:44:28Z) - Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。
生成画像内のDR重大度と視覚的特徴を包括的に制御する。
我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文 参考訳(メタデータ) (2024-09-11T17:08:28Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.6767681305851]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。