論文の概要: ADPv2: A Hierarchical Histological Tissue Type-Annotated Dataset for Potential Biomarker Discovery of Colorectal Disease
- arxiv url: http://arxiv.org/abs/2507.05656v1
- Date: Tue, 08 Jul 2025 04:19:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.559561
- Title: ADPv2: A Hierarchical Histological Tissue Type-Annotated Dataset for Potential Biomarker Discovery of Colorectal Disease
- Title(参考訳): ADPv2: 大腸疾患のバイオマーカー発見のための階層的組織型アノテーションデータセット
- Authors: Zhiyuan Yang, Kai Li, Sophia Ghamoshi Ramandi, Patricia Brassard, Hakim Khellaf, Vincent Quoc-Huy Trinh, Jennifer Zhang, Lina Chen, Corwyn Rowsell, Sonal Varma, Kostas Plataniotis, Mahdi S. Hosseini,
- Abstract要約: ADPv2は消化管病理に焦点をあてた新しいデータセットである。
本データセットは,正常な大腸生検スライドから得られた20,004枚の画像パッチを,32種類のHTT3レベルの階層分類で注釈した。
我々のデータセットは、臓器特異的な詳細な研究により、潜在的なバイオマーカーの発見が可能であることを示しています。
- 参考スコア(独自算出の注目度): 9.518786316441718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational pathology (CoPath) leverages histopathology images to enhance diagnostic precision and reproducibility in clinical pathology. However, publicly available datasets for CoPath that are annotated with extensive histological tissue type (HTT) taxonomies at a granular level remain scarce due to the significant expertise and high annotation costs required. Existing datasets, such as the Atlas of Digital Pathology (ADP), address this by offering diverse HTT annotations generalized to multiple organs, but limit the capability for in-depth studies on specific organ diseases. Building upon this foundation, we introduce ADPv2, a novel dataset focused on gastrointestinal histopathology. Our dataset comprises 20,004 image patches derived from healthy colon biopsy slides, annotated according to a hierarchical taxonomy of 32 distinct HTTs of 3 levels. Furthermore, we train a multilabel representation learning model following a two-stage training procedure on our ADPv2 dataset. We leverage the VMamba architecture and achieving a mean average precision (mAP) of 0.88 in multilabel classification of colon HTTs. Finally, we show that our dataset is capable of an organ-specific in-depth study for potential biomarker discovery by analyzing the model's prediction behavior on tissues affected by different colon diseases, which reveals statistical patterns that confirm the two pathological pathways of colon cancer development. Our dataset is publicly available here: Part 1 at https://zenodo.org/records/15307021, Part 2 at https://zenodo.org/records/15312384 and Part 3 at https://zenodo.org/records/15312792
- Abstract(参考訳): コンピュータ病理学(CoPath)は病理組織像を利用して診断精度と再現性を高める。
しかし, 広範囲の組織組織型(HTT)分類を付加したCoPath用データセットは, 重要な専門知識と高いアノテーションコストが要求されるため, 未だ不足している。
既存のデータセットであるAtlas of Digital Pathology (ADP)は、複数の臓器に一般化された多様なHTTアノテーションを提供することによって、この問題に対処するが、特定の臓器疾患に関する詳細な研究の能力を制限する。
この基盤の上に構築されたADPv2は,消化管病理に焦点をあてた新しいデータセットである。
本データセットは,正常な大腸生検スライドから得られた20,004枚の画像パッチを,32種類のHTT3レベルの階層分類で注釈した。
さらに、ADPv2データセット上での2段階のトレーニング手順に従って、マルチラベル表現学習モデルを訓練する。
我々はVMambaアーキテクチャを活用し,大腸HTTのマルチラベル分類において平均平均精度0.88を達成する。
最後に, 大腸癌発生の2つの病態経路を裏付ける統計的パターンを明らかにするため, 大腸疾患の組織に対するモデルによる予測挙動を解析することにより, 臓器特異的なバイオマーカー発見の詳細な研究が可能であることを示す。
データセットはこちらで公開されています。 Part 1 at https://zenodo.org/records/15307021, Part 2 at https://zenodo.org/records/15312384, Part 3 at https://zenodo.org/records/15312792
関連論文リスト
- PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Data and Knowledge Co-driving for Cancer Subtype Classification on
Multi-Scale Histopathological Slides [4.22412600279685]
病理学者のような組織学的スライド上で癌サブタイプ分類の過程を再現するデータ・知識共同運転(D&K)モデルを提案する。
具体的には、データ駆動モジュールにおいて、アンサンブル学習におけるバッグング機構を利用して、埋め込み表現ユニットによって抽出された様々なバッグの組織学的特徴を統合する。
論文 参考訳(メタデータ) (2023-04-18T21:57:37Z) - Meta-information-aware Dual-path Transformer for Differential Diagnosis
of Multi-type Pancreatic Lesions in Multi-phase CT [41.199716328468895]
膵病変の分類と分節の可能性を活用するために, デュアルパストランスフォーマーを開発した。
提案手法は, CNN-based segmentation path (S-path) と Transformer-based classification path (C-path) から構成される。
以上の結果から,膵病変の完全分類の正確な分類と分類が可能であることが示唆された。
論文 参考訳(メタデータ) (2023-03-02T03:34:28Z) - Deeply supervised UNet for semantic segmentation to assist
dermatopathological assessment of Basal Cell Carcinoma (BCC) [2.031570465477242]
unetアーキテクチャに基づく複数のモデルを用いた意味セグメンテーションによる基底細胞癌(bcc)の検出に焦点を当てた。
unetネットワークの最初の2つの異なるエンコーダと2つの追加のトレーニング戦略を分析した。
最高のモデルは、テストセット上の96%、精度、感度、および特異性を達成します。
論文 参考訳(メタデータ) (2021-03-05T15:39:55Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - A Benchmark for Studying Diabetic Retinopathy: Segmentation, Grading,
and Transferability [76.64661091980531]
糖尿病患者は糖尿病網膜症(DR)を発症するリスクがある
コンピュータ支援型DR診断は、DRの早期検出と重度評価のための有望なツールである。
このデータセットは、ピクセルレベルのDR関連病変アノテーションを持つ1,842枚の画像と、6人の眼科医によって評価された画像レベルのラベルを持つ1,000枚の画像を有する。
論文 参考訳(メタデータ) (2020-08-22T07:48:04Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。