Fugu-MT 論文翻訳(概要): Leveraging Pre-trained Models for FF-to-FFPE Histopathological Image Translation

論文の概要: Leveraging Pre-trained Models for FF-to-FFPE Histopathological Image Translation

arxiv url: http://arxiv.org/abs/2406.18054v3
Date: Wed, 13 Nov 2024 06:25:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:34.152002
Title: Leveraging Pre-trained Models for FF-to-FFPE Histopathological Image Translation
Title（参考訳）: FF-to-FFPE画像翻訳のための事前学習モデルの活用
Authors: Qilai Zhang, Jiawen Li, Peiran Liao, Jiali Hu, Tian Guan, Anjia Han, Yonghong He,
Abstract要約: Hematoxylin and Eosin (H&E) slides in histopathology is Formalin-Fixed Paraffin-Embedded (FFPE) and Fresh Frozen (FF) FFPEスライドは高品質な病理像を提供するが、労働集約的な取得プロセスを必要とする。本研究の目的は,FFPE画像からFFPE画像へ変換することで,診断目的の画像品質を向上させることである。 TCGA-NSCLCデータセットを用いたFF-to-FFPE翻訳実験により,提案手法が既存の手法より優れていることを示す。
参考スコア（独自算出の注目度）: 6.108290302640328
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The two primary types of Hematoxylin and Eosin (H&E) slides in histopathology are Formalin-Fixed Paraffin-Embedded (FFPE) and Fresh Frozen (FF). FFPE slides offer high quality histopathological images but require a labor-intensive acquisition process. In contrast, FF slides can be prepared quickly, but the image quality is relatively poor. Our task is to translate FF images into FFPE style, thereby improving the image quality for diagnostic purposes. In this paper, we propose Diffusion-FFPE, a method for FF-to-FFPE histopathological image translation using a pre-trained diffusion model. Specifically, we utilize a one-step diffusion model as the generator, which we fine-tune using LoRA adapters within an adversarial learning framework. To enable the model to effectively capture both global structural patterns and local details, we introduce a multi-scale feature fusion module that leverages two VAE encoders to extract features at different image resolutions, performing feature fusion before inputting them into the UNet. Additionally, a pre-trained vision-language model for histopathology serves as the backbone for the discriminator, enhancing model performance. Our FF-to-FFPE translation experiments on the TCGA-NSCLC dataset demonstrate that the proposed approach outperforms existing methods. The code and models are released at https://github.com/QilaiZhang/Diffusion-FFPE.
Abstract（参考訳）: 病理組織学におけるヘマトキシリンとエオシン(H&E)スライドの2つの主要なタイプは、ホルマリン固定パラフィン埋め込み(FFPE)とフレッシュフロゼン(FF)である。 FFPEスライドは高品質な病理像を提供するが、労働集約的な取得プロセスを必要とする。対照的に、FFスライドは迅速に作成できるが、画質は比較的低い。本研究の目的は,FFPE画像からFFPE画像へ変換することで,診断目的の画像品質を向上させることである。本稿では,事前学習した拡散モデルを用いたFF-to-FFPE画像変換法であるDiffusion-FFPEを提案する。具体的には,1ステップの拡散モデルをジェネレータとして使用し,敵の学習フレームワーク内でLoRAアダプタを微調整する。モデルがグローバルな構造パターンと局所的な詳細の両方を効果的にキャプチャするために、2つのVAEエンコーダを利用して異なる画像解像度で特徴を抽出し、UNetに入力する前に特徴フュージョンを実行するマルチスケール機能融合モジュールを導入する。さらに、病理学のための事前訓練された視覚言語モデルは、判別器のバックボーンとして機能し、モデル性能を向上させる。 TCGA-NSCLCデータセットを用いたFF-to-FFPE翻訳実験により,提案手法が既存の手法より優れていることを示す。コードとモデルはhttps://github.com/QilaiZhang/Diffusion-FFPEで公開されている。

関連論文リスト

AdaFusion: Prompt-Guided Inference with Adaptive Fusion of Pathology Foundation Models [49.550545038402184]
本稿では,新しいプロンプト誘導推論フレームワークであるAdaFusionを提案する。本手法は,多様なモデルからタイルレベルの特徴を圧縮・整列する。 AdaFusionは、分類タスクと回帰タスクの両方にわたって、個々のPFMを一貫して上回っている。
論文参考訳（メタデータ） (2025-08-07T07:09:31Z)
LEAF: Latent Diffusion with Efficient Encoder Distillation for Aligned Features in Medical Image Segmentation [2.529281336118734]
本稿では,潜伏拡散モデルに基づく医療画像分割モデルLEAFを提案する。微調整の過程では,元のノイズ予測パターンをセグメントマップの直接予測に置き換える。また, コンボリューション層の隠れ状態と, 変圧器を用いた視覚エンコーダの特徴とを一致させるために, 特徴蒸留法を用いる。
論文参考訳（メタデータ） (2025-07-24T09:08:04Z)
PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文参考訳（メタデータ） (2025-04-09T14:58:21Z)
F2FLDM: Latent Diffusion Models with Histopathology Pre-Trained Embeddings for Unpaired Frozen Section to FFPE Translation [2.435021773579434]
凍結切片法(FS法)は急速かつ効率的な方法であり, 手術中の病理医の評価のためのスライド作成に15～30分しかかからない。 FSプロセスは、折り畳みや氷結晶効果のようなアーティファクトや歪みをしばしば導入する。これらのアーティファクトは、高品質なホルマリン固定パラフィン埋め込み(FFPE)スライドには欠落しており、準備には2～3日を要する。 FS画像の復元性を高めるために, LDMと病理組織学的プレトレーニングエンベディングを組み合わせた新しいアプローチを提案する。
論文参考訳（メタデータ） (2024-04-19T06:32:21Z)
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.71672127740099]
我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文参考訳（メタデータ） (2024-03-29T10:38:25Z)
Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [65.7968515029306]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文参考訳（メタデータ） (2024-02-28T06:07:07Z)
Exploring the Transferability of a Foundation Model for Fundus Images: Application to Hypertensive Retinopathy [15.643435527710817]
Imagenetで事前トレーニングされたディープラーニングモデルを使用することは、データの不足に対処する医療画像分類の従来のソリューションである。眼底画像上における高血圧性網膜症診断のためのCGI-HRDCチャレンジは、最近リリースされた網膜の視覚言語基盤モデルFLAIRの転写可能性を評価する魅力的な機会をもたらす。
論文参考訳（メタデータ） (2024-01-27T23:40:24Z)
DiffDis: Empowering Generative Diffusion Model with Cross-Modal Discrimination Capability [75.9781362556431]
本稿では,拡散過程下での1つのフレームワークに,モダクティブと差別的事前学習を統一するDiffDisを提案する。 DiffDisは画像生成タスクと画像テキスト識別タスクの両方において単一タスクモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2023-08-18T05:03:48Z)
Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文参考訳（メタデータ） (2023-04-02T10:25:09Z)
Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文参考訳（メタデータ） (2023-03-28T17:59:56Z)
Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文参考訳（メタデータ） (2023-03-18T04:06:18Z)
MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文参考訳（メタデータ） (2023-01-19T03:42:36Z)
Mutual Contrastive Learning to Disentangle Whole Slide Image Representations for Glioma Grading [10.65788461379405]
全スライド画像(WSI)は,腫瘍の組織学的悪性度評価とグレーディングに有用な表現型情報を提供する。最も一般的に使用されるWSIは、ホルマリン固定パラフィン埋め込み(FFPE)と凍結セクションに由来する。そこで本研究では,FFPEと凍結部を統合し,グリオーマグレーディングのためのモダリティ表現を歪曲する相互コントラスト学習手法を提案する。
論文参考訳（メタデータ） (2022-03-08T11:08:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。