論文の概要: Publicly available datasets of breast histopathology H&E whole-slide
images: A scoping review
- arxiv url: http://arxiv.org/abs/2306.01546v2
- Date: Wed, 6 Dec 2023 09:43:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 18:46:51.194680
- Title: Publicly available datasets of breast histopathology H&E whole-slide
images: A scoping review
- Title(参考訳): 乳腺病理組織学的H&E全スライディング画像の公開データセット:スコーピングレビュー
- Authors: Masoud Tafavvoghi (1), Lars Ailo Bongo (2), Nikita Shvetsov (2),
Lill-Tove Rasmussen Busund (3), Kajsa M{\o}llersen (1) ((1) Department of
Community Medicine, UiT The Arctic University of Norway, Troms{\o}, Norway,
(2) Department of Computer Science, UiT The Arctic University of Norway,
Troms{\o}, Norway, (3) Department of Medical Biology, UiT The Arctic
University of Norway, Troms{\o}, Norway)
- Abstract要約: 深層学習アルゴリズムの開発に使用できる胸部H&E染色スライディング画像(WSI)の公開データセットを特定した。
このデータセットには、トレーニングされたアルゴリズムの堅牢性と一般化性に影響を与える、かなりの選択バイアスがある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advancements in digital pathology and computing resources have made a
significant impact in the field of computational pathology for breast cancer
diagnosis and treatment. However, access to high-quality labeled
histopathological images of breast cancer is a big challenge that limits the
development of accurate and robust deep learning models. In this scoping
review, we identified the publicly available datasets of breast H&E stained
whole-slide images (WSI) that can be used to develop deep learning algorithms.
We systematically searched nine scientific literature databases and nine
research data repositories and found 17 publicly available datasets containing
10385 H&E WSIs of breast cancer. Moreover, we reported image metadata and
characteristics for each dataset to assist researchers in selecting proper
datasets for specific tasks in breast cancer computational pathology. In
addition, we compiled two lists of breast H&E patches and private datasets as
supplementary resources for researchers. Notably, only 28% of the included
articles utilized multiple datasets, and only 14% used an external validation
set, suggesting that the performance of other developed models may be
susceptible to overestimation. The TCGA-BRCA was used in 52% of the selected
studies. This dataset has a considerable selection bias that can impact the
robustness and generalizability of the trained algorithms. There is also a lack
of consistent metadata reporting of breast WSI datasets that can be an issue in
developing accurate deep learning models, indicating the necessity of
establishing explicit guidelines for documenting breast WSI dataset
characteristics and metadata.
- Abstract(参考訳): デジタル病理学と計算資源の進歩は、乳がんの診断と治療のための計算病理学の分野に大きな影響を与えた。
しかし、乳がんの良質なラベル付き病理像へのアクセスは、正確で堅牢なディープラーニングモデルの開発を制限する大きな課題である。
このスコーピングレビューでは、深層学習アルゴリズムの開発に使用できる胸部H&E染色スライディング画像(WSI)の公開データセットを特定した。
9つの学術文献データベースと9つの研究データリポジトリを体系的に検索し,乳癌のh&e wsis10385を含む17の公開データセットを発見した。
さらに,各データセットの画像メタデータと特徴を報告し,乳癌の計算病理における特定のタスクに適したデータセットの選択を支援する。
さらに,胸部H&Eパッチと個人データセットの2つのリストを,研究者の補助資料としてまとめた。
注目すべきなのは,複数のデータセットを使用した記事の28%に過ぎず,外部検証セットを使用したのは14%に過ぎなかったことだ。
TCGA-BRCAは選択された研究の52%で使用された。
このデータセットには、トレーニングされたアルゴリズムの堅牢性と一般化性に影響を与える、かなりの選択バイアスがある。
また、正確なディープラーニングモデルを開発する際に問題となる、胸部wsiデータセットの一貫したメタデータレポートが欠如しており、胸部wsiデータセットの特徴とメタデータを文書化する明確なガイドラインを確立する必要性を示している。
関連論文リスト
- Breast Histopathology Image Retrieval by Attention-based Adversarially Regularized Variational Graph Autoencoder with Contrastive Learning-Based Feature Extraction [1.48419209885019]
本研究は,乳房組織像検索のための新しいアテンションベース逆正則変分グラフオートエンコーダモデルを提案する。
乳がん組織像の2つの公開データセットを用いて,提案モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-05-07T11:24:37Z) - ACROBAT -- a multi-stain breast cancer histological whole-slide-image
data set from routine diagnostics for computational pathology [1.6619031082709266]
ハエマトキシリンおよびエオシン (H&E) を染色したFFPE組織分画の解析は, 外科切除乳癌検体における病理学的評価に欠かせない部分である。
このデータセットは、計算病理学研究の様々な方法を可能にする可能性を秘めている。
論文 参考訳(メタデータ) (2022-11-24T14:16:36Z) - BRACS: A Dataset for BReAst Carcinoma Subtyping in H&E Histology Images [4.974822167947921]
BReAst Carcinoma Subtyping dataset, a large cohort of annotated Hematoxylin & Eosin (H&E)-stained image to help the characterized of breast lesions。
BRACSには、WSIsから抽出された547個の全スライド画像(WSI)と4539個の関心領域(ROI)が含まれている。
論文 参考訳(メタデータ) (2021-11-08T15:04:16Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - BCNet: A Deep Convolutional Neural Network for Breast Cancer Grading [0.0]
近年、深層学習は科学の様々な分野、特に医学で広く採用されている。
乳がん検出問題では、異なるデータセット上で様々なディープラーニング技術が開発され、精度が向上した。
論文 参考訳(メタデータ) (2021-07-11T12:55:33Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Detection of masses and architectural distortions in digital breast
tomosynthesis: a publicly available dataset of 5,060 patients and a deep
learning model [4.3359550072619255]
乳房トモシンセシス画像の大規模データセットをキュレートし,公開している。
5,060人の患者から5,610人を対象にした22,032冊の復元版がある。
我々は単相深層学習検出モデルを開発し、将来の研究のベースラインとしてデータセットを用いてテストした。
論文 参考訳(メタデータ) (2020-11-13T18:33:31Z) - Creation and Validation of a Chest X-Ray Dataset with Eye-tracking and
Report Dictation for AI Development [47.1152650685625]
我々は、人工知能の研究者を支援するために、チェストX線(CXR)画像の豊富なデータセットを開発した。
データはアイトラッキングシステムを用いて収集され、放射線学者は1,083 CXR画像でレビューし報告した。
論文 参考訳(メタデータ) (2020-09-15T23:12:49Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。