論文の概要: SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models
- arxiv url: http://arxiv.org/abs/2503.02876v1
- Date: Tue, 04 Mar 2025 18:57:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:15:00.420543
- Title: SPIDER: A Comprehensive Multi-Organ Supervised Pathology Dataset and Baseline Models
- Title(参考訳): SPIDER: 包括的マルチオーガン監視病理データセットとベースラインモデル
- Authors: Dmitry Nechaev, Alexey Pchelnikov, Ekaterina Ivanova,
- Abstract要約: SPIDERは、Skin、Colorectal、Toraxなど、複数の臓器タイプをカバーする、公開可能なパッチレベルデータセットとしては最大である。
注目型分類ヘッドと組み合わせた特徴抽出器として,Hibou-Lファンデーションモデルを用いてSPIDERでトレーニングしたベースラインモデルを提案する。
これらのモデルは、複数の組織カテゴリにわたる最先端のパフォーマンスを達成し、将来のデジタル病理研究の強力なベンチマークとなる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Advancing AI in computational pathology requires large, high-quality, and diverse datasets, yet existing public datasets are often limited in organ diversity, class coverage, or annotation quality. To bridge this gap, we introduce SPIDER (Supervised Pathology Image-DEscription Repository), the largest publicly available patch-level dataset covering multiple organ types, including Skin, Colorectal, and Thorax, with comprehensive class coverage for each organ. SPIDER provides high-quality annotations verified by expert pathologists and includes surrounding context patches, which enhance classification performance by providing spatial context. Alongside the dataset, we present baseline models trained on SPIDER using the Hibou-L foundation model as a feature extractor combined with an attention-based classification head. The models achieve state-of-the-art performance across multiple tissue categories and serve as strong benchmarks for future digital pathology research. Beyond patch classification, the model enables rapid identification of significant areas, quantitative tissue metrics, and establishes a foundation for multimodal approaches. Both the dataset and trained models are publicly available to advance research, reproducibility, and AI-driven pathology development. Access them at: https://github.com/HistAI/SPIDER
- Abstract(参考訳): 計算病理学におけるAIの活用には、大きくて高品質で多様なデータセットを必要とするが、既存の公開データセットは、臓器の多様性、クラスカバレッジ、アノテーションの品質に制限されることが多い。
このギャップを埋めるために、私たちはSPIDER(Supervised Pathology Image-Description Repository)を紹介します。
SPIDERは、専門家の病理学者によって検証された高品質なアノテーションを提供し、周囲のコンテキストパッチを含み、空間コンテキストを提供することで分類性能を向上させる。
データセットの他に,Hibou-Lファンデーションモデルを用いてSPIDERでトレーニングしたベースラインモデルを特徴抽出器として,注目に基づく分類ヘッドと組み合わせて提示する。
これらのモデルは、複数の組織カテゴリにわたる最先端のパフォーマンスを達成し、将来のデジタル病理研究の強力なベンチマークとなる。
パッチ分類以外にも、このモデルは重要な領域の迅速同定、定量的組織計測を可能にし、マルチモーダルアプローチの基礎を確立する。
データセットとトレーニングされたモデルの両方が公開されており、研究、再現性、AI駆動の病理開発が進められている。
https://github.com/HistAI/SPIDER
関連論文リスト
- PathInsight: Instruction Tuning of Multimodal Datasets and Models for Intelligence Assisted Diagnosis in Histopathology [7.87900104748629]
6つの異なるタスクをカバーする約45,000のケースのデータセットを慎重にコンパイルしました。
特にLLaVA, Qwen-VL, InternLMを微調整したマルチモーダル大規模モデルで, このデータセットを用いて命令ベースの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-13T17:05:06Z) - Synthetic Data for Robust Stroke Segmentation [0.0]
ニューロイメージングにおける病変のセグメンテーションに対する現在のディープラーニングベースのアプローチは、高解像度の画像と広範囲な注釈付きデータに依存することが多い。
本稿では,脳卒中病変のセグメンテーションに適した新しい合成データフレームワークを提案する。
我々のアプローチは、正常組織と病理組織の両方にまたがるセグメンテーションを促進するために、健康なデータセットと脳卒中データセットからラベルマップでモデルを訓練する。
論文 参考訳(メタデータ) (2024-04-02T13:42:29Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Data and Knowledge Co-driving for Cancer Subtype Classification on
Multi-Scale Histopathological Slides [4.22412600279685]
病理学者のような組織学的スライド上で癌サブタイプ分類の過程を再現するデータ・知識共同運転(D&K)モデルを提案する。
具体的には、データ駆動モジュールにおいて、アンサンブル学習におけるバッグング機構を利用して、埋め込み表現ユニットによって抽出された様々なバッグの組織学的特徴を統合する。
論文 参考訳(メタデータ) (2023-04-18T21:57:37Z) - Domain Adaptive Nuclei Instance Segmentation and Classification via
Category-aware Feature Alignment and Pseudo-labelling [65.40672505658213]
本稿では, UDA 核インスタンス分割と分類のための新しいディープニューラルネットワークである Category-Aware 機能アライメントと Pseudo-Labelling Network (CAPL-Net) を提案する。
我々のアプローチは、最先端のUDA手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2022-07-04T07:05:06Z) - PDBL: Improving Histopathological Tissue Classification with
Plug-and-Play Pyramidal Deep-Broad Learning [20.940530194934972]
Pyramidal Deep-Broad Learning (PDBL) は、よく訓練された分類バックボーンのための軽量なプラグイン・アンド・プレイモジュールである。
PDBLは、任意のCNNバックボーンの組織レベルの分類性能を着実に改善することができる。
論文 参考訳(メタデータ) (2021-11-04T09:35:12Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。