論文の概要: A Unified Low-level Foundation Model for Enhancing Pathology Image Quality
- arxiv url: http://arxiv.org/abs/2509.01071v1
- Date: Mon, 01 Sep 2025 02:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.527017
- Title: A Unified Low-level Foundation Model for Enhancing Pathology Image Quality
- Title(参考訳): 画像品質向上のための統一低レベル基礎モデル
- Authors: Ziyi Liu, Zhe Xu, Jiabo Ma, Wenqaing Li, Junlin Hou, Fuxiang Huang, Xi Wang, Ronald Cheong Kin Chan, Terence Tsz Wai Wong, Hao Chen,
- Abstract要約: 現実の病理画像は、しばしばノイズ、ぼかし、低解像度などの劣化に悩まされる。
本稿では,修復作業における画像品質の向上が可能な低レベル病理基盤モデル(LPFM)を提案する。
我々は,34種類の組織と5種類の染色プロトコルにわたる87,810枚のスライド画像(WSI)をキュレートしたデータセットで訓練した。
- 参考スコア(独自算出の注目度): 19.911568152326275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models have revolutionized computational pathology by achieving remarkable success in high-level diagnostic tasks, yet the critical challenge of low-level image enhancement remains largely unaddressed. Real-world pathology images frequently suffer from degradations such as noise, blur, and low resolution due to slide preparation artifacts, staining variability, and imaging constraints, while the reliance on physical staining introduces significant costs, delays, and inconsistency. Although existing methods target individual problems like denoising or super-resolution, their task-specific designs lack the versatility to handle the diverse low-level vision challenges encountered in practice. To bridge this gap, we propose the first unified Low-level Pathology Foundation Model (LPFM), capable of enhancing image quality in restoration tasks, including super-resolution, deblurring, and denoising, as well as facilitating image translation tasks like virtual staining (H&E and special stains), all through a single adaptable architecture. Our approach introduces a contrastive pre-trained encoder that learns transferable, stain-invariant feature representations from 190 million unlabeled pathology images, enabling robust identification of degradation patterns. A unified conditional diffusion process dynamically adapts to specific tasks via textual prompts, ensuring precise control over output quality. Trained on a curated dataset of 87,810 whole slied images (WSIs) across 34 tissue types and 5 staining protocols, LPFM demonstrates statistically significant improvements (p<0.01) over state-of-the-art methods in most tasks (56/66), achieving Peak Signal-to-Noise Ratio (PSNR) gains of 10-15% for image restoration and Structural Similarity Index Measure (SSIM) improvements of 12-18% for virtual staining.
- Abstract(参考訳): 基礎モデルは、ハイレベルな診断タスクにおいて顕著な成功を収めることによって、計算病理学に革命をもたらしたが、低レベルな画像強調の重要な課題は、いまだほとんど未解決のままである。
現実の病理画像は、しばしばノイズ、ぼかし、低分解能などのノイズ、染色性、画像の制約による劣化に悩まされるが、物理的染色への依存は、かなりのコスト、遅延、不整合をもたらす。
既存の手法は、妄想や超解像といった個々の問題をターゲットにしているが、それらのタスク固有の設計は、実際に遭遇する様々な低レベルのビジョン課題に対処する汎用性に欠けていた。
このギャップを埋めるために、我々は、超解像、脱臭、脱臭を含む修復作業における画像品質を向上させるとともに、仮想染色(H&Eと特殊染色)のような画像翻訳作業を容易にし、単一の適応可能なアーキテクチャにより、最初の低レベル病理基盤モデル(LPFM)を提案する。
提案手法では,1億9000万枚の未ラベルの病理画像から,伝達可能な,染色不変な特徴表現を学習し,劣化パターンの堅牢な同定を可能にするコントラスト付き事前学習エンコーダを提案する。
統一された条件拡散プロセスは、テキストプロンプトを介して特定のタスクに動的に適応し、出力品質を正確に制御する。
34種類の組織タイプと5つの染色プロトコルにわたる87,810枚のスライド画像(WSI)のキュレートデータセットに基づいて、LPFMは、ほとんどのタスク(56/66)における最先端の手法よりも統計的に有意な改善(p<0.01)を示し、画像修復と構造的類似度指標(SSIM)の改善は10~15%向上した。
関連論文リスト
- A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - GRASP-PsONet: Gradient-based Removal of Spurious Patterns for PsOriasis Severity Classification [0.0]
本稿では,突発的な相関を導入し,問題のあるトレーニングイメージを自動的にフラグするフレームワークを提案する。
フラグ付き画像の8.2%は、保持されたテストセットでモデルAUC-ROCを5%(85%から90%)改善する。
2人の皮膚科医によって評価された訓練データのサブセットに適用した場合、この方法は、レイター間不一致の90%以上を識別する。
論文 参考訳(メタデータ) (2025-06-27T03:42:09Z) - Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification [0.0]
大腸癌の検出は、患者の生存率を高めるために重要である。
大腸内視鏡は、適切な高品質の内視鏡画像を取得することに依存する。
Few-Shot Learning アーキテクチャにより、我々のモデルは、目に見えないきめ細かな内視鏡画像パターンに迅速に適応できる。
精度は90.1%,精度は0.845,リコールは0.942,F1スコアは0.891であった。
論文 参考訳(メタデータ) (2025-05-30T16:54:51Z) - MAISY: Motion-Aware Image SYnthesis for Medical Image Motion Correction [11.150364980770675]
本研究では、まず動きを特徴付ける動き認識画像合成法(MAISY)を提案する。
胸部CTおよび頭部CTを用いた実験では、我々のモデルは最先端のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-07T03:44:28Z) - Stain-Invariant Representation for Tissue Classification in Histology Images [1.1624569521079424]
染色摂動行列を用いたトレーニング画像の染色増分版を生成するフレームワークを提案する。
大腸癌画像のクロスドメイン多クラス組織型分類における提案モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-11-21T23:50:30Z) - Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。
生成画像内のDR重大度と視覚的特徴を包括的に制御する。
我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文 参考訳(メタデータ) (2024-09-11T17:08:28Z) - DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.6767681305851]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文 参考訳(メタデータ) (2024-05-30T12:32:35Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Texture Characterization of Histopathologic Images Using Ecological
Diversity Measures and Discrete Wavelet Transform [82.53597363161228]
本稿では,病理組織像間でテクスチャを特徴付ける手法を提案する。
2つのHIデータセットに有望な精度で、そのような画像の固有特性を定量化することが可能である。
論文 参考訳(メタデータ) (2022-02-27T02:19:09Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。