論文の概要: STREAM: Stochastic Riemannian Flow Matching with Anisotropic Decoder for Digital Histopathology Image Generation
- arxiv url: http://arxiv.org/abs/2606.07036v1
- Date: Fri, 05 Jun 2026 08:26:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.642482
- Title: STREAM: Stochastic Riemannian Flow Matching with Anisotropic Decoder for Digital Histopathology Image Generation
- Title(参考訳): STREAM:デジタル病理画像生成のための確率リーマン流と異方性デコーダとのマッチング
- Authors: Won June Cho, Daeky Jeong, Hyeongyeol Lim, Hongjun Yoon,
- Abstract要約: STREAMは、速度場ジャコビアンの低エネルギー方向を割り当てる異方性デコーダである。
大腸癌のデータセット上で、最先端の再構築と生成性能を達成する。
- 参考スコア(独自算出の注目度): 1.025551765545376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Synthetic histopathology image generation addresses critical challenges in computational pathology, including patient privacy and the growing need for large-scale training data for foundation models. Latent diffusion models have dominated the image generation domain, with recent works emphasizing that the choice of latent space is critical to the quality of generated images. Existing state-of-the-art generative models in histopathology use pretrained Vision Foundation Models (VFMs) as conditioning signals, and we observe that this leads to "conditioning collapse," where the conditioning signal dominates the latent space and lowers the quality and diversity of generated samples. Therefore, we instead use pretrained histopathology VFMs as the latent space itself, leveraging their patch-token features that encode rich semantic information. We empirically show that these features are $\ell_2$-normalized and lie on the unit hypersphere $\mathcal{S}^{d-1}$ with strong angular dominance and intrinsic curvature, making them naturally suited for a Riemannian formulation. We therefore present STREAM, the first framework to apply Riemannian flow matching in the pathology domain. STREAM consists of two stages: 1) a bridge-type stochastic perturbation that establishes per-token rectifiability on $\mathcal{S}^{d-1}$ for training a Diffusion Transformer (DiT) in latent space, and 2) a novel anisotropic decoder that allocates robustness to low-energy directions of the velocity-field Jacobian while preserving fidelity along its high-energy directions. Together, STREAM achieves state-of-the-art reconstruction and generation performance on breast and colorectal cancer datasets. The code will be publicly released upon acceptance.
- Abstract(参考訳): 合成病理画像生成は、患者のプライバシや基礎モデルの大規模トレーニングデータの必要性の増大など、計算病理学における重要な課題に対処する。
遅延拡散モデルは画像生成領域を支配しており、近年の研究では、遅延空間の選択は生成画像の品質に欠かせないことが強調されている。
既存の病理組織学における生成モデルでは、事前訓練されたビジョン基礎モデル(VFM)を条件付け信号として使用し、条件付け信号が潜時空間を支配し、生成されたサンプルの品質と多様性を低下させる「条件付け崩壊」につながることを観察する。
そこで,本研究では,有意な意味情報を符号化するパッチ・トーケン機能を利用して,事前学習した病理組織学VFMを潜伏空間として利用する。
これらの特徴が$\ell_2$-正規化され、強角支配と内在曲率を持つ単位超球面 $\mathcal{S}^{d-1}$ 上にあることを実証的に示し、リーマンの定式化に自然に適している。
そこで我々は、病理領域にリーマンフローマッチングを適用した最初のフレームワークであるSTREAMを提案する。
STREAMは2つのステージから構成される。
1) 潜時空間における拡散変圧器(DiT)の訓練のための$\mathcal{S}^{d-1}$上のトーケン毎の可逆性を確立するブリッジ型確率摂動
2) 速度場ジャコビアンの低エネルギー方向に対して高エネルギー方向に沿って忠実さを保ちながらロバスト性を割り当てる新しい異方性復号器。
STREAMはともに、乳がんおよび大腸癌のデータセットに対する最先端の再構築と生成性能を達成する。
コードは受理後、公開される。
関連論文リスト
- DUET: Dual-Paradigm Adaptive Expert Triage with Single-cell Inductive Prior for Spatial Transcriptomics Prediction [6.028508407069093]
組織像から空間的に解決された遺伝子発現を推定することは空間転写学に費用対効果をもたらす。
本稿では,パラメトリック予測とメモリベース検索を共役する新しいデュアルパラダイムフレームワークDUETを提案する。
論文 参考訳(メタデータ) (2026-05-13T20:43:29Z) - Layout-Guided Controllable Pathology Image Generation with In-Context Diffusion Transformers [57.54843029965778]
制御可能な病理画像合成には、空間配置、組織形態、意味的詳細の信頼できる規制が必要である。
In-Context Diffusion Transformer (IC-DiT) は,空間レイアウト,テキスト記述,視覚的埋め込みを統合拡散変換器に組み込んだレイアウト認識生成モデルである。
IC-DiTは既存の方法よりも忠実度が高く、空間制御性が強く、診断の整合性が良くなる。
論文 参考訳(メタデータ) (2026-03-11T06:14:11Z) - DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.409626500688866]
本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:25:34Z) - PathoSyn: Imaging-Pathology MRI Synthesis via Disentangled Deviation Diffusion [11.223559964746705]
磁気共鳴イメージング(MRI)画像合成のための統合生成フレームワークPathoSynを提案する。
PathoSynは、画像病理を安定な解剖学的多様体上の不整合加法偏差として再構成する。
PathoSynは、知覚現実主義と解剖学的忠実性の両方において、全体的拡散とマスク条件ベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-12-29T01:13:50Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens [80.75893450536577]
モデル生成能力を向上させる新しい2段階法であるD2Cを提案する。
第1段階では、小さな離散値発生器を用いて粗粒度画像特徴を表す離散値トークンをサンプリングする。
第2段階では、離散トークンシーケンスに基づいて、きめ細かい画像特徴を表す連続値トークンを学習する。
論文 参考訳(メタデータ) (2025-03-21T13:58:49Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Natural scene reconstruction from fMRI signals using generative latent
diffusion [1.90365714903665]
我々はBrain-Diffuserと呼ばれる2段階のシーン再構築フレームワークを提示する。
第1段階では、VDVAE(Very Deep Vari Autoencoder)モデルを用いて、低レベル特性と全体レイアウトをキャプチャする画像を再構成する。
第2段階では、予測されたマルチモーダル(テキストおよび視覚)特徴に基づいて、遅延拡散モデルのイメージ・ツー・イメージ・フレームワークを使用する。
論文 参考訳(メタデータ) (2023-03-09T15:24:26Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。