論文の概要: HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis
- arxiv url: http://arxiv.org/abs/2406.16192v2
- Date: Sat, 02 Nov 2024 19:16:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:40:39.923780
- Title: HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis
- Title(参考訳): HEST-1k:空間転写学と組織像解析のためのデータセット
- Authors: Guillaume Jaume, Paul Doucet, Andrew H. Song, Ming Y. Lu, Cristina Almagro-Pérez, Sophia J. Wagner, Anurag J. Vaidya, Richard J. Chen, Drew F. K. Williamson, Ahrong Kim, Faisal Mahmood,
- Abstract要約: 1,229個の空間転写プロファイルの集合であるHEST-1kを紹介する。
HEST-1kは、26の臓器、2つの種(Homo SapiensとMus Musculus)、25のがんタイプから367のがんサンプルを含む153の公立および内部コホートから組み立てられた。
HEST-Libraryは、HESTサンプルでさまざまなアクションを実行するように設計されたPythonパッケージである。
- 参考スコア(独自算出の注目度): 8.228626764137234
- License:
- Abstract: Spatial transcriptomics enables interrogating the molecular composition of tissue with ever-increasing resolution and sensitivity. However, costs, rapidly evolving technology, and lack of standards have constrained computational methods in ST to narrow tasks and small cohorts. In addition, the underlying tissue morphology, as reflected by H&E-stained whole slide images (WSIs), encodes rich information often overlooked in ST studies. Here, we introduce HEST-1k, a collection of 1,229 spatial transcriptomic profiles, each linked to a WSI and extensive metadata. HEST-1k was assembled from 153 public and internal cohorts encompassing 26 organs, two species (Homo Sapiens and Mus Musculus), and 367 cancer samples from 25 cancer types. HEST-1k processing enabled the identification of 2.1 million expression--morphology pairs and over 76 million nuclei. To support its development, we additionally introduce the HEST-Library, a Python package designed to perform a range of actions with HEST samples. We test HEST-1k and Library on three use cases: (1) benchmarking foundation models for pathology (HEST-Benchmark), (2) biomarker exploration, and (3) multimodal representation learning. HEST-1k, HEST-Library, and HEST-Benchmark can be freely accessed at https://github.com/mahmoodlab/hest.
- Abstract(参考訳): 空間転写学は、分解能と感受性が増すにつれて、組織の分子組成を問うことができる。
しかし、コスト、急速に進化する技術、標準の欠如は、狭いタスクや小さなコホートに対してSTの計算方法に制約を与えている。
さらに、基盤となる組織形態は、H&E-stained whole slide image (WSIs)によって反映され、ST研究でしばしば見落とされた豊富な情報をエンコードする。
本稿では, 1,229個の空間転写プロファイルの集合であるHEST-1kについて紹介する。
HEST-1kは、26の臓器、2つの種(Homo SapiensとMus Musculus)、25のがんタイプから367のがんサンプルを含む153の公立および内部コホートから組み立てられた。
HEST-1k処理により、2100万の表現-形態対と76万以上の核の同定が可能となった。
HEST-Libraryは、HESTサンプルでさまざまなアクションを実行するように設計されたPythonパッケージである。
HEST-1k と Library の3つのユースケースについて,(1) 病理モデル(HEST-Benchmark)のベンチマーク,(2) バイオマーカー探索,(3) マルチモーダル表現学習について検討した。
HEST-1k、HEST-Library、HEST-Benchmarkはhttps://github.com/mahmoodlab/hestで自由にアクセスできる。
関連論文リスト
- Towards a Comprehensive Benchmark for Pathological Lymph Node Metastasis in Breast Cancer Sections [21.75452517154339]
我々は1,399枚のスライド画像(WSI)と、Camelyon-16とCamelyon-17データセットのラベルを再処理した。
再発腫瘍領域の大きさから,2重複癌検診を4段階に改善した。
論文 参考訳(メタデータ) (2024-11-16T09:19:24Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - ACROBAT -- a multi-stain breast cancer histological whole-slide-image
data set from routine diagnostics for computational pathology [1.6619031082709266]
ハエマトキシリンおよびエオシン (H&E) を染色したFFPE組織分画の解析は, 外科切除乳癌検体における病理学的評価に欠かせない部分である。
このデータセットは、計算病理学研究の様々な方法を可能にする可能性を秘めている。
論文 参考訳(メタデータ) (2022-11-24T14:16:36Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - CT-based COVID-19 Triage: Deep Multitask Learning Improves Joint
Identification and Severity Quantification [45.86448200141968]
感染リスクのある患者をできるだけ早期に分離する研究を優先するための新型コロナウイルスの同定、重度定量化、重篤な患者の研究の強調、病院への誘導、救急医療の提供の2つの基本的な設定について述べる。
両トリアージアプローチを統合するマルチタスクアプローチを提案し、利用可能なラベルを1つのモデルにまとめる畳み込みニューラルネットワークを提案する。
我々は約2000件の公開CT研究をトレーニングし、32件のCOVID-19研究、30件の細菌性肺炎、31件の健常患者、および30件の肺病理患者からなる慎重に設計したセットを用いて、典型的な患者の血流をエミュレートする。
論文 参考訳(メタデータ) (2020-06-02T08:05:06Z) - A Generalized Deep Learning Framework for Whole-Slide Image Segmentation
and Analysis [0.20065923589074736]
病理組織分析は癌診断と予後における金の基準と考えられている。
深層学習に基づく技術は、さまざまな画像解析タスクにおいて、最先端の成果を提供している。
本稿では,病理組織像解析のためのディープラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-01T18:05:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。