Fugu-MT 論文翻訳(概要): A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis

論文の概要: A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis

arxiv url: http://arxiv.org/abs/2512.13164v2
Date: Tue, 16 Dec 2025 03:25:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-17 14:48:05.966009
Title: A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis
Title（参考訳）: 病的画像合成を改善したセマンティック・ジェネレーティブ・ファンデーション・モデル
Authors: Xianchao Guan, Zhiyuan Fan, Yifeng Wang, Fuqiang Chen, Yanjiang Zhou, Zengyang Che, Hongxue Meng, Xin Li, Yaowei Wang, Hongpeng Wang, Min Zhang, Heng Tao Shen, Zheng Zhang, Yongbing Zhang,
Abstract要約: 本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
参考スコア（独自算出の注目度）: 82.01597026329158
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The development of clinical-grade artificial intelligence in pathology is limited by the scarcity of diverse, high-quality annotated datasets. Generative models offer a potential solution but suffer from semantic instability and morphological hallucinations that compromise diagnostic reliability. To address this challenge, we introduce a Correlation-Regulated Alignment Framework for Tissue Synthesis (CRAFTS), the first generative foundation model for pathology-specific text-to-image synthesis. By leveraging a dual-stage training strategy on approximately 2.8 million image-caption pairs, CRAFTS incorporates a novel alignment mechanism that suppresses semantic drift to ensure biological accuracy. This model generates diverse pathological images spanning 30 cancer types, with quality rigorously validated by objective metrics and pathologist evaluations. Furthermore, CRAFTS-augmented datasets enhance the performance across various clinical tasks, including classification, cross-modal retrieval, self-supervised learning, and visual question answering. In addition, coupling CRAFTS with ControlNet enables precise control over tissue architecture from inputs such as nuclear segmentation masks and fluorescence images. By overcoming the critical barriers of data scarcity and privacy concerns, CRAFTS provides a limitless source of diverse, annotated histology data, effectively unlocking the creation of robust diagnostic tools for rare and complex cancer phenotypes.
Abstract（参考訳）: 病理学における臨床レベルの人工知能の開発は、多種多様な高品質な注釈付きデータセットの不足によって制限される。生成モデルは潜在的な解決策を提供するが、診断の信頼性を損なう意味的不安定性と形態的幻覚に悩まされる。この課題に対処するために,病理特異的テキスト・画像合成のための最初の生成基盤モデルであるCRAFTS(Relational-Regulated Alignment Framework for tissue Synthesis)を導入する。約280万のイメージキャプチャ対で2段階のトレーニング戦略を活用することで、CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメントメカニズムを組み込んだ。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。さらに、CRAFTSで強化されたデータセットは、分類、クロスモーダル検索、自己教師付き学習、視覚的質問応答など、様々な臨床タスクにおけるパフォーマンスを向上させる。さらに、CRAFTSとControlNetを結合することで、核セグメンテーションマスクや蛍光画像などの入力から組織構造を正確に制御できる。データ不足とプライバシに関する重要な障壁を克服することで、CRAFTSは多様な注釈付き組織データの無制限ソースを提供し、まれで複雑ながん表現型のための堅牢な診断ツールを効果的に作成する。

関連論文リスト

A WDLoRA-Based Multimodal Generative Framework for Clinically Guided Corneal Confocal Microscopy Image Synthesis in Diabetic Neuropathy [8.701084151107652]
糖尿病性末梢神経障害(DPN)における角膜共焦点顕微鏡による小線維損傷の評価強靭で自動的なディープラーニングに基づく診断モデルの開発は、角膜神経形態学におけるラベル付きデータの不足ときめ細かい変化によって制限される。臨床誘導CCM画像合成のためのWDLoRAに基づくマルチモーダル生成フレームワークを提案する。
論文参考訳（メタデータ） (2026-02-14T09:32:44Z)
Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文参考訳（メタデータ） (2025-04-20T01:54:18Z)
Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.268045905735818]
病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルであるCMSwinKANを提案する。マルチスケールの特徴を融合させ、対照的な学習戦略を活用することで、CMSwinKANは臨床医の包括的なアプローチを模倣する。その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文参考訳（メタデータ） (2025-04-18T15:39:46Z)
FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation [35.46876389599076]
FundusGANは、高忠実度ファンドス画像合成用に特別に設計された新しい階層的特徴認識生成フレームワークである。我々は、FundusGANが複数のメトリクスにわたって最先端のメソッドを一貫して上回っていることを示す。
論文参考訳（メタデータ） (2025-03-22T18:08:07Z)
HistoSPACE: Histology-Inspired Spatial Transcriptome Prediction And Characterization Engine [0.0]
HistoSPACEモデルは、STデータで利用可能な組織像の多様性を調べ、組織像から分子的洞察を抽出する。モデルは、現代のアルゴリズムと比較して大きな効率性を示し、残余のクロスバリデーションにおいて0.56の相関関係を示す。
論文参考訳（メタデータ） (2024-08-07T07:12:52Z)
PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。提案手法は画像とテキストデータを融合して生成プロセスを強化する。我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文参考訳（メタデータ） (2023-09-01T22:08:32Z)
Feature Representation Learning for Robust Retinal Disease Detection from Optical Coherence Tomography Images [0.0]
眼科画像は、異なる網膜変性疾患を区別する自動化技術で失敗する、同一の外観の病理を含んでいる可能性がある。本研究では,3つの学習ヘッドを持つ堅牢な疾患検出アーキテクチャを提案する。 2つのOCTデータセットによる実験結果から,提案モデルが既存の最先端モデルよりも精度,解釈可能性,堅牢性に優れ,網膜外網膜疾患の検出に有用であることが示唆された。
論文参考訳（メタデータ） (2022-06-24T07:59:36Z)
Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。 BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2022-03-29T08:41:17Z)
Data-driven generation of plausible tissue geometries for realistic photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文参考訳（メタデータ） (2021-03-29T11:30:18Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。