論文の概要: Accurate and Scalable Multimodal Pathology Retrieval via Attentive Vision-Language Alignment
- arxiv url: http://arxiv.org/abs/2510.23224v1
- Date: Mon, 27 Oct 2025 11:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.533455
- Title: Accurate and Scalable Multimodal Pathology Retrieval via Attentive Vision-Language Alignment
- Title(参考訳): Attentive Vision-Languageアライメントによる高精度かつスケーラブルなマルチモーダルパス検索
- Authors: Hongyi Wang, Zhengjie Zhu, Jiabo Ma, Fang Wang, Yue Shi, Bo Luo, Jili Wang, Qiuyu Cai, Xiuming Zhang, Yen-Wei Chen, Lanfen Lin, Hao Chen,
- Abstract要約: PathSearchは、視覚言語によるコントラスト学習を通じて、細粒度の注意モザイク表現をグローバルなスライド埋め込みと統合する検索フレームワークである。
スライドレポートペア6,926のコーパスでトレーニングされたPathSearchは、きめ細かい形態的手がかりと高いレベルのセマンティックパターンの両方をキャプチャして、正確で柔軟な検索を可能にする。
PathSearchは、4つの公開病理データセットと3つの社内コホートで厳格に評価され、解剖学的部位の検索、腫瘍のサブタイプ、腫瘍対非腫瘍の識別、乳がん、肺、腎臓、肝臓、胃などの様々な臓器のグレーティングを含むタスクをカバーした。
- 参考スコア(独自算出の注目度): 25.320017572772553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid digitization of histopathology slides has opened up new possibilities for computational tools in clinical and research workflows. Among these, content-based slide retrieval stands out, enabling pathologists to identify morphologically and semantically similar cases, thereby supporting precise diagnoses, enhancing consistency across observers, and assisting example-based education. However, effective retrieval of whole slide images (WSIs) remains challenging due to their gigapixel scale and the difficulty of capturing subtle semantic differences amid abundant irrelevant content. To overcome these challenges, we present PathSearch, a retrieval framework that unifies fine-grained attentive mosaic representations with global-wise slide embeddings aligned through vision-language contrastive learning. Trained on a corpus of 6,926 slide-report pairs, PathSearch captures both fine-grained morphological cues and high-level semantic patterns to enable accurate and flexible retrieval. The framework supports two key functionalities: (1) mosaic-based image-to-image retrieval, ensuring accurate and efficient slide research; and (2) multi-modal retrieval, where text queries can directly retrieve relevant slides. PathSearch was rigorously evaluated on four public pathology datasets and three in-house cohorts, covering tasks including anatomical site retrieval, tumor subtyping, tumor vs. non-tumor discrimination, and grading across diverse organs such as breast, lung, kidney, liver, and stomach. External results show that PathSearch outperforms traditional image-to-image retrieval frameworks. A multi-center reader study further demonstrates that PathSearch improves diagnostic accuracy, boosts confidence, and enhances inter-observer agreement among pathologists in real clinical scenarios. These results establish PathSearch as a scalable and generalizable retrieval solution for digital pathology.
- Abstract(参考訳): 病理組織学スライドの急速なデジタル化は、臨床および研究ワークフローにおける計算ツールの新たな可能性を開いた。
これらのうち、コンテンツベースのスライド検索は、病理学者が形態学的および意味論的に類似した事例を識別し、正確な診断を支援し、観察者間の一貫性を高め、サンプルベースの教育を支援する。
しかし, スライド画像全体 (WSI) の有効検索は, ギガピクセルのスケールや, 無関係コンテンツが豊富にある中で意味的差異の微妙な把握が困難であることから, 依然として困難である。
これらの課題を克服するために,我々は,視覚言語によるコントラスト学習を通したグローバルなスライド埋め込みと,微細な注意モザイク表現を統一する検索フレームワークPathSearchを提案する。
スライドレポートペア6,926のコーパスでトレーニングされたPathSearchは、きめ細かい形態的手がかりと高いレベルのセマンティックパターンの両方をキャプチャして、正確で柔軟な検索を可能にする。
本フレームワークは,(1)モザイクに基づく画像画像検索と,(2)テキストクエリが関連するスライドを直接検索するマルチモーダル検索という2つの重要な機能をサポートしている。
PathSearchは、4つの公開病理データセットと3つの社内コホートで厳格に評価され、解剖学的部位の検索、腫瘍のサブタイプ、腫瘍対非腫瘍の識別、乳がん、肺、腎臓、肝臓、胃などの様々な臓器のグレーティングを含むタスクをカバーした。
外部の結果は、PathSearchが従来の画像と画像の検索フレームワークより優れていることを示している。
マルチセンターの読者による研究は、PathSearchが診断精度を改善し、信頼性を高め、実際の臨床シナリオにおける病理医間の合意を向上することを示した。
これらの結果は、スケーラブルで一般化可能なデジタル病理検索ソリューションとしてPathSearchを確立している。
関連論文リスト
- A Graph-Based Framework for Interpretable Whole Slide Image Analysis [86.37618055724441]
我々は,全スライディング画像を生物学的にインフォームドされたグラフ表現に変換するフレームワークを開発した。
我々のアプローチは、任意の格子ではなく、自然構造を尊重する組織領域からグラフノードを構築する。
がんのステージングと生存予測の課題に強いパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-03-14T20:15:04Z) - RadIR: A Scalable Framework for Multi-Grained Medical Image Retrieval via Radiology Report Mining [64.66825253356869]
本稿では,複数の粒度で画像の類似度を決定するために,高密度ラジオロジーレポートを利用した新しい手法を提案する。
我々は、胸部X線用MIMIC-IRとCTスキャン用CTRATE-IRの2つの総合的な医用画像検索データセットを構築した。
RadIR-CXR と Model-ChestCT という2つの検索システムを開発し,従来の画像画像検索と画像レポート検索に優れた性能を示す。
論文 参考訳(メタデータ) (2025-03-06T17:43:03Z) - On Image Search in Histopathology [0.0]
病理組織学における画像検索技術の最近の展開について概説する。
本研究は, 画像検索の効率, 高速, 効率的な手法を求める計算病理研究者向けに, 簡潔な概要を提示する。
論文 参考訳(メタデータ) (2024-01-14T12:38:49Z) - Region-based Contrastive Pretraining for Medical Image Retrieval with
Anatomic Query [56.54255735943497]
医用画像検索のための地域別コントラスト事前トレーニング(RegionMIR)
医用画像検索のための領域ベースコントラスト事前トレーニング(RegionMIR)について紹介する。
論文 参考訳(メタデータ) (2023-05-09T16:46:33Z) - Multimorbidity Content-Based Medical Image Retrieval Using Proxies [37.47987844057842]
本稿では、分類とコンテンツに基づく画像検索の両方に使用できる新しい多ラベルメトリック学習法を提案する。
本モデルは,疾患の存在を予測し,これらの予測の証拠を提供することによって診断を支援することができる。
分類とコンテンツに基づく画像検索へのアプローチの有効性を2つのマルチモービディティー・ラジオロジー・データセットで実証した。
論文 参考訳(メタデータ) (2022-11-22T11:23:53Z) - A Deep Reinforcement Learning Framework for Rapid Diagnosis of Whole
Slide Pathological Images [4.501311544043762]
本稿では,ネットワーク推論に要する時間を大幅に削減できる,弱教師付き深層強化学習フレームワークを提案する。
ニューラルネットワークを用いて,強化学習エージェントの探索モデルと決定モデルを構築する。
実験結果から,提案手法は画素レベルのアノテーションを使わずに,スライド画像全体の高速な推測と精度の予測が可能であることが示唆された。
論文 参考訳(メタデータ) (2022-05-05T14:20:29Z) - Semantic segmentation of multispectral photoacoustic images using deep
learning [53.65837038435433]
光音響イメージングは医療に革命をもたらす可能性がある。
この技術の臨床的翻訳には、高次元取得したデータを臨床的に関連性があり解釈可能な情報に変換する必要がある。
本稿では,多スペクトル光音響画像のセマンティックセグメンテーションに対する深層学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-20T09:33:55Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。