Fugu-MT 論文翻訳(概要): Vision-Language Models as Zero-Annotation Oracles in Histopathology

論文の概要: Vision-Language Models as Zero-Annotation Oracles in Histopathology

arxiv url: http://arxiv.org/abs/2606.16658v1
Date: Mon, 15 Jun 2026 12:50:19 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-16 16:21:34.559875
Title: Vision-Language Models as Zero-Annotation Oracles in Histopathology
Title（参考訳）: 病理学におけるゼロアノテーションとしての視覚言語モデル
Authors: Vishal Jain, Giorgio Buzzanca, Sarah Cechnicka, Maarten Naesens, Priyanka Koshy, Tri Nguyen, Jesper Kers, Candice Roufosse, Bernhard Kainz,
Abstract要約: フォアグラウンドセグメンテーションは、全ての計算病理パイプラインの重要な第一歩である。本稿では,前景のセグメンテーションを視覚認知タスクとして再キャストする粗大なアプローチを提案する。私たちのフレームワークは、デジタル病理学における永続的なインフラストラクチャボトルネックに対して、原則的かつスケーラブルなソリューションを提供します。
参考スコア（独自算出の注目度）: 10.853300035340615
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Foreground segmentation is the critical first step of every computational pathology pipeline, yet existing methods rely on hand-tuned heuristics or supervised models that overfit to narrow stain and scanner distributions, failing silently on specialised stains such as Jones silver or Elastica van Gieson. We propose a coarse-to-fine approach that recasts foreground segmentation as a visual perception task and leverages general-purpose vision-language models (VLMs) as zero-annotation oracles. Our key insight is that tissue-versus-background discrimination is a natural-image recognition problem, not a histopathological one, so VLMs trained on internet-scale corpora generalise where domain-specific models cannot. We introduce Leica-75, a benchmark of 75 renal transplant whole-slide images spanning three stain families. On Leica-75, our method achieves the highest segmentation quality on out-of-distribution stains (Dice 0.858 +/- 0.027 on Jones, 0.853 +/- 0.041 on EVG) with 7x lower cross-stain variance than the best supervised baseline, while remaining competitive on in-distribution H&E. Few-shot prompting with automatically curated exemplars (Auto-context) rescues hard cases on Stress-32 (n=32), a curated stress-test subset (Dice 0.470 to 0.819 for the 2B model). VLM-based annotation review matches human expert consensus (kappa=0.989 for blur detection; mean precision/recall grading accuracy 0.708 vs. human 0.646 for segmentation mask review). The resulting pseudo-labels are used to distil lightweight student models that are as performant as the teacher model while running for a fraction of the cost. Our framework provides a principled, scalable solution to a persistent infrastructure bottleneck in digital pathology.
Abstract（参考訳）: フォアグラウンドセグメンテーションは全ての計算病理パイプラインの重要な第一歩であるが、既存の手法は手動のヒューリスティックや教師付きモデルに依存しており、狭い染色やスキャナーの分布に過度に適合し、ジョーンズ・シルバーやエラベラ・ヴァン・ギーソンのような特殊な染色では静かに失敗する。本稿では,前景のセグメンテーションを視覚的知覚タスクとして再キャストし,汎用視覚言語モデル(VLM)をゼロアノテーションとして活用する粗大なアプローチを提案する。我々の重要な洞察は、組織対背背景の識別は自然画像認識の問題であり、病理的な問題ではないということだ。 3つの染色系にまたがる75個の腎移植全スライディング画像のベンチマークであるLeica-75を紹介する。ライカ-75では, 配電性染料(ジョーンズのDice 0.858 +/- 0.027, EVGの0.853 +/- 0.041)において, 配電性H&Eの競争力を維持しながら, 配電性染料の最高セグメンテーション品質を達成する。オートコンテクスト (Auto-context) は、ストレステストサブセットであるScress-32 (n=32) のハードケースを回収する(Dice 0.470 - 0.819 for the 2B model)。 VLMベースのアノテーションレビューは、人間の専門家によるコンセンサスと一致している(ぼかし検出ではkappa=0.989、セグメンテーションマスクでは平均精度/リコールグレーディング精度0.708、セグメンテーションマスクでは0.646)。結果として得られた擬似ラベルは、わずかのコストで実行しながら、教師モデルと同じくらい高性能な軽量の学生モデルを排除するために使用される。私たちのフレームワークは、デジタル病理学における永続的なインフラストラクチャボトルネックに対して、原則的かつスケーラブルなソリューションを提供します。

関連論文リスト

From Pixels to Explanations: Interpretable Diabetic Retinopathy Grading with CNN-Transformer Ensembles, Visual Explainability and Vision-Language Models [7.782282985072339]
本研究では,強い識別モデルとマルチモーダルな説明を組み合わせた方法論を提案する。そこで我々はGrad-CAM++の視覚属性マップと短いテキスト論理式を作成した。説明の質のために、Grad-CAM++は可塑性だが粗いローカライゼーションを提供し、VLMの合理性は概してグレード一貫性がある。
論文参考訳（メタデータ） (2026-04-25T00:21:11Z)
Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks [6.923757075165361]
解剖学的脳解析は rs-fMRI に基づく自閉症スペクトラム障害 (ASD) の分類を支配している。 ABIDE Iデータセット上の解剖学的(AAL)と機能的(MSDL)パーセレーション戦略を比較したグラフベースのディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2026-03-03T02:05:20Z)
Predicting Diabetic Retinopathy Using a Two-Level Ensemble Model [0.6445605125467574]
糖尿病網膜症は、高齢者の視覚障害の主要な原因である。画像ベースのAIツールは、早期検出の限界を示している。実験結果を用いたDR予測のための非画像ベース2レベルアンサンブルモデルを提案する。
論文参考訳（メタデータ） (2025-10-01T16:19:57Z)
A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。 Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文参考訳（メタデータ） (2025-08-19T14:41:22Z)
GRASP-PsONet: Gradient-based Removal of Spurious Patterns for PsOriasis Severity Classification [0.0]
本稿では,突発的な相関を導入し,問題のあるトレーニングイメージを自動的にフラグするフレームワークを提案する。フラグ付き画像の8.2%は、保持されたテストセットでモデルAUC-ROCを5%(85%から90%)改善する。 2人の皮膚科医によって評価された訓練データのサブセットに適用した場合、この方法は、レイター間不一致の90%以上を識別する。
論文参考訳（メタデータ） (2025-06-27T03:42:09Z)
Uncertainty-inspired Open Set Learning for Retinal Anomaly Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。 UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文参考訳（メタデータ） (2023-04-08T10:47:41Z)
An Ensemble Method to Automatically Grade Diabetic Retinopathy with Optical Coherence Tomography Angiography Images [4.640835690336653]
糖尿病網膜症解析チャレンジ(DRAC)2022から得られる糖尿病網膜症(DR)画像を自動的に評価するアンサンブル法を提案する。まず、最先端の分類ネットワークを採用し、利用可能なデータセットの異なる分割でUW-OCTA画像のグレードをトレーニングする。最終的に、25のモデルを取得し、そのうち上位16のモデルを選択し、アンサンブルして最終的な予測を生成する。
論文参考訳（メタデータ） (2022-12-12T22:06:47Z)
Self-supervised contrastive learning of echocardiogram videos enables label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。 EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文参考訳（メタデータ） (2022-07-23T19:17:26Z)
(Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文参考訳（メタデータ） (2022-06-21T17:27:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。