Fugu-MT 論文翻訳(概要): Beyond ViT Tokens: Masked-Diffusion Pretrained Convolutional Pathology Foundation Model for Cell-Level Dense Prediction

論文の概要: Beyond ViT Tokens: Masked-Diffusion Pretrained Convolutional Pathology Foundation Model for Cell-Level Dense Prediction

arxiv url: http://arxiv.org/abs/2605.08276v1
Date: Fri, 08 May 2026 04:34:56 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-12 23:28:49.52186
Title: Beyond ViT Tokens: Masked-Diffusion Pretrained Convolutional Pathology Foundation Model for Cell-Level Dense Prediction
Title（参考訳）: ViTトーケンスを超えて:細胞レベル密度予測のためのマズード拡散事前訓練畳み込み畳み込みモデル
Authors: Weiming Chen, Xitong Ling, Zhenyang Cai, Xidong Wang, Jiawen Li, Tian Guan, Benyou Wang, Yonghong He,
Abstract要約: Masked-Diffusion Convolutional Foundation Models (CMD) は、高密度病理表現学習のための自己教師型畳み込み生成事前学習フレームワークである。 CMDは、既存のViTベースの病理基盤モデルよりも一貫して優れており、最先端のエンドツーエンドセグメンテーション手法を超越している。以上の結果から,純粋な畳み込み型アーキテクチャは細胞レベルでの高密度予測のための競合する病理基盤モデルとして機能する可能性が示唆された。
参考スコア（独自算出の注目度）: 33.957729129082075
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Cell-level dense prediction is central to computational pathology, but remains challenging due to fine-grained histological structures, strong domain shifts, and costly dense annotations. Existing ViT-based pathology foundation models rely on patch tokenization, which can disrupt spatial continuity and weaken local morphological details needed for cell-level prediction. To address this, we propose Masked-Diffusion Convolutional Foundation Models, termed ConvNeXt Masked-Diffusion (CMD), a self-supervised convolutional generative pretraining framework for dense pathology representation learning. CMD uses a fully convolutional ConvNeXt-UNet backbone, performs masked-diffusion pretraining in pixel space, and incorporates frozen pathology foundation model features through adaptive normalization. Experimental results demonstrate that CMD consistently outperforms existing ViT-based pathology foundation models and even surpasses state-of-the-art end-to-end segmentation methods while fine-tuning only a small number of task-specific parameters across multiple pathology dense prediction tasks. The advantage is particularly pronounced under limited annotation settings, where CMD exhibits stronger robustness and generalization ability. Our findings suggest that purely convolutional architectures can also serve as competitive pathology foundation models for cell-level dense prediction, achieving leading performance within the current ViT-dominated paradigm and providing a scalable, high-performance solution that better preserves histological structural priors for fine-grained pathology understanding.
Abstract（参考訳）: 細胞レベルでの密度予測は、計算病理学の中心であるが、微細な組織構造、強いドメインシフト、高価な高密度アノテーションのために依然として困難である。既存のViTベースの病理基盤モデルはパッチトークン化に依存しており、これは空間的連続性を妨害し、細胞レベルでの予測に必要な局所的な形態的詳細を弱める。そこで本研究では,高密度病理表現学習のための自己教師型畳み込み生成事前学習フレームワークであるConvNeXt Masked-Diffusion (CMD)を提案する。 CMDは完全な畳み込みのConvNeXt-UNetバックボーンを使用し、ピクセル空間でマスク拡散前トレーニングを実行し、適応正規化を通じて凍結した病理基盤モデル機能を組み込む。実験の結果、CMDは既存のViTベースの病理基盤モデルより一貫して優れており、最先端のエンド・ツー・エンドセグメンテーション手法を超越している一方で、複数の病理組織密集予測タスクにまたがる少数のタスク固有パラメータのみを微調整していることがわかった。アドバンテージは特に限定的なアノテーション設定で発音され、CMDは強い堅牢性と一般化能力を示す。以上の結果から, 純粋な畳み込み型アーキテクチャは, 細胞レベルでの濃密な予測のための競合する病理基盤モデルとして機能し, 現状のViT支配パラダイム内での先進的な性能を実現し, 微細な病理理解のための組織学的構造的先行性をよりよく保存する, スケーラブルで高性能なソリューションを提供することが示唆された。

関連論文リスト

Learning to Synergize Semantic and Geometric Priors for Limited-Data Wheat Disease Segmentation [51.06355116973389]
本研究では,小麦病のセグメンテーションを病種特異的な意味認識と疾患境界の局所化の複合的課題として扱う枠組みを提案する。我々の中核的な洞察は、事前訓練されたDINOv2は、出現シフトを処理するために、堅牢なカテゴリ認識セマンティックスを提供します。 SGPer は,コムギ病と臓器分画のベンチマークにおいて,常に最先端のパフォーマンスを達成している。
論文参考訳（メタデータ） (2026-04-07T04:19:39Z)
Adapting a Pre-trained Single-Cell Foundation Model to Spatial Gene Expression Generation from Histology Images [5.072469295071516]
HINGE (HIstology-coNditioned GEneration) は、訓練済みの sc-FM を条件付き表現生成器に適合させる。 3つのSTデータセットに基づいて評価し、平均ピアソン相関に基づいて最先端のベースラインを上回ります。
論文参考訳（メタデータ） (2026-03-20T08:52:39Z)
Layout-Guided Controllable Pathology Image Generation with In-Context Diffusion Transformers [57.54843029965778]
制御可能な病理画像合成には、空間配置、組織形態、意味的詳細の信頼できる規制が必要である。 In-Context Diffusion Transformer (IC-DiT) は,空間レイアウト,テキスト記述,視覚的埋め込みを統合拡散変換器に組み込んだレイアウト認識生成モデルである。 IC-DiTは既存の方法よりも忠実度が高く、空間制御性が強く、診断の整合性が良くなる。
論文参考訳（メタデータ） (2026-03-11T06:14:11Z)
The Geometry of Transfer: Unlocking Medical Vision Manifolds for Training-Free Model Ranking [31.961181244685932]
本稿では, 統計重なりではなく, 多様体のトラクタビリティを評価するトポロジ駆動転送可能性推定フレームワークを提案する。本手法は,重み付きケンドールの相対的改善率約6031%により,最先端のベースラインを著しく上回る。
論文参考訳（メタデータ） (2026-02-27T11:04:15Z)
Towards Spatial Transcriptomics-driven Pathology Foundation Models [32.70436266943553]
本稿では、局所的な分子情報を病理視覚エンコーダに注入するビジョン・オミクス自己教師型学習フレームワークを提案する。腫瘍および14臓器の正常サンプルにまたがる70,000対の遺伝子の発現スポット-tissue領域のトレーニングによりSEALをインスタンス化する。 SEALエンコーダは、アウト・オブ・ディストリビューションに堅牢なドメイン一般化を示し、遺伝子対イメージ検索のような新しいクロスモーダル機能を実現する。
論文参考訳（メタデータ） (2026-02-15T15:06:45Z)
Physically-Grounded Manifold Projection Model for Generalizable Metal Artifact Reduction in Dental CBCT [20.637726557566793]
歯科用CBCTの金属遺物は極めて不明瞭な解剖学的構造である。現在のMAR(Metal Artifact Reduction)の深層学習は制限に直面している。 Denoising Diffusion Models (DDPM) はリアリズムを提供するが、遅い反復的なサンプリングに依存している。
論文参考訳（メタデータ） (2025-12-30T14:36:26Z)
A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文参考訳（メタデータ） (2025-12-15T10:22:43Z)
ADNF-Clustering: An Adaptive and Dynamic Neuro-Fuzzy Clustering for Leukemia Prediction [4.43233586255351]
本稿では、畳み込みニューラルネットワークに基づく特徴抽出とオンラインファジィクラスタリングエンジンを組み合わせた、新しいストリーミング対応フレームワークであるAdaptive and Dynamic Neuro-Fuzzy Clusteringを紹介する。 C-NMC 白血病顕微鏡データセットでは, シルエットスコア0.51を達成し, 静的塩基性よりも優れた凝集度と分離性を示した。
論文参考訳（メタデータ） (2025-06-23T08:30:17Z)
PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文参考訳（メタデータ） (2025-04-09T14:58:21Z)
Data-driven generation of plausible tissue geometries for realistic photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文参考訳（メタデータ） (2021-03-29T11:30:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。