Fugu-MT 論文翻訳(概要): GOLDMARK: Governed Outcome-Linked Diagnostic Model Assessment Reference Kit

論文の概要: GOLDMARK: Governed Outcome-Linked Diagnostic Model Assessment Reference Kit

arxiv url: http://arxiv.org/abs/2603.20848v1
Date: Sat, 21 Mar 2026 15:09:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.115563
Title: GOLDMARK: Governed Outcome-Linked Diagnostic Model Assessment Reference Kit
Title（参考訳）: GOLDMARK:Governed Outcome-Linked Diagnostic Model Assessment Reference Kit
Authors: Chad Vanderbilt, Gabriele Campanella, Siddharth Singi, Swaraj Nanda, Jie-Fu Chen, Ali Kamali, Amir Momeni Boroujeni, David Kim, Mohamed Yakoub, Jamal Benhamida, Meera Hameed, Neeraj Kumar, Gregory Goldgof,
Abstract要約: CB(Computational Biomarker)は、ヘマトキシリン・エオシン(H&E)全スライディング画像(WSI)から抽出した組織由来のパターンで、治療効果や予後を予測する。臨床応用可能な OncoKB レベル1-3 バイオマーカーラベルを持つTCGAコーホート上に構築された標準化されたベンチマークフレームワークである GOLDMARK を紹介する。
参考スコア（独自算出の注目度）: 7.891604152731754
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Computational biomarkers (CBs) are histopathology-derived patterns extracted from hematoxylin-eosin (H&E) whole-slide images (WSIs) using artificial intelligence (AI) to predict therapeutic response or prognosis. Recently, slide-level multiple-instance learning (MIL) with pathology foundation models (PFMs) has become the standard baseline for CB development. While these methods have improved predictive performance, computational pathology lacks standardized intermediate data formats, provenance tracking, checkpointing conventions, and reproducible evaluation metrics required for clinical-grade deployment. We introduce GOLDMARK (https://artificialintelligencepathology.org), a standardized benchmarking framework built on a curated TCGA cohort with clinically actionable OncoKB level 1-3 biomarker labels. GOLDMARK releases structured intermediate representations, including tile coordinate maps, per-slide feature embeddings from canonical PFMs, quality-control metadata, predefined patient-level splits, trained slide-level models, and evaluation outputs. Models are trained on TCGA and evaluated on an independent MSKCC cohort with reciprocal testing. Across 33 tumor-biomarker tasks, mean AUROC was 0.689 (TCGA) and 0.630 (MSKCC). Restricting to the eight highest-performing tasks yielded mean AUROCs of 0.831 and 0.801, respectively. These tasks correspond to established morphologic-genomic associations (e.g., LGG IDH1, COAD MSI/BRAF, THCA BRAF/NRAS, BLCA FGFR3, UCEC PTEN) and showed the most stable cross-site performance. Differences between canonical encoders were modest relative to task-specific variability. GOLDMARK establishes a shared experimental substrate for computational pathology, enabling reproducible benchmarking and direct comparison of methods across datasets and models.
Abstract（参考訳）: 計算バイオマーカー(英: Computational Biomarkers, CBs)は、人工知能(AI)を用いたヘマトキシリン・エオシン(H&E)全スライディング画像(WSI)から抽出した病理組織由来のパターンで、治療反応や予後を予測する。近年,病理基盤モデル (PFM) を用いたスライドレベル多重インスタンス学習 (MIL) がCB開発における標準ベースラインとなっている。これらの手法は予測性能を改善したが、計算病理学には標準化された中間データ形式、前立腺追跡、チェックポイント規則、臨床レベルの展開に必要な再現可能な評価基準が欠如している。 GOLDMARK (https://artificialintelligencepathology.org) は,臨床応用可能なOncoKBレベル1-3バイオマーカーラベルを備えたTCGAコホート上に構築された標準化されたベンチマークフレームワークである。 GOLDMARKは、タイル座標マップ、標準PFMからのスライディングごとの機能埋め込み、品質制御メタデータ、事前に定義された患者レベルの分割、トレーニングされたスライドレベルのモデル、評価出力など、構造化された中間表現をリリースしている。モデルはTCGAで訓練され、相互テストを伴う独立したMSKCCコホートで評価される。 33の腫瘍バイオマーカータスクのうち、AUROCは0.689(TCGA)と0.630(MSKCC)であった。 8つの最高性能タスクに制限された場合、平均AUROCは0.831と0.801であった。これらの課題は、確立された形態学的・ゲノム関連(LGG IDH1, COAD MSI/BRAF, THCA BRAF/NRAS, BLCA FGFR3, UCEC PTEN)に対応し、最も安定したクロスサイト性能を示した。標準エンコーダの違いは,タスク固有の可変性に対して軽度であった。 GOLDMARKは、計算病理学のための共有実験基板を確立し、再現可能なベンチマークとデータセットとモデル間のメソッドの直接比較を可能にする。

関連論文リスト

PathMoE: Interpretable Multimodal Interaction Experts for Pediatric Brain Tumor Classification [30.58342408480846]
PathMoEは、H&Eスライド、病理報告、核レベルセルグラフを統合する、解釈可能なマルチモーダルフレームワークである。内科的脳腫瘍データセットと外部TGAデータセットの2つのデータセット固有の分類タスクについて,本フレームワークの評価を行った。
論文参考訳（メタデータ） (2026-03-02T07:17:44Z)
DOGMA: Weaving Structural Information into Data-centric Single-cell Transcriptomics Analysis [43.565183518761984]
生データの構造的再構成と意味的拡張を目的としたデータ中心型フレームワークであるDOGMAを提案する。複雑な多種多様なベンチマークにおいて、DOGMA SOTA性能は優れたゼロショットロバスト性とサンプル効率を示す。
論文参考訳（メタデータ） (2026-02-02T09:10:09Z)
Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning [30.979270201588236]
PDACの基底型および古典型TCGへの分子置換は予後および予測値を確立している。本稿では,標準的なH&E染色WSIから直接治療関連分子サブタイプを予測する,解釈可能なディープラーニングフレームワークであるPanSubNetを紹介する。 PanSubNetは2つの多施設コホートにまたがる1,055人のデータを用いて開発された。
論文参考訳（メタデータ） (2026-01-06T20:52:12Z)
Benchmarking Deep Learning and Vision Foundation Models for Atypical vs. Normal Mitosis Classification with Cross-Dataset Evaluation [0.31571255367331746]
乳癌の非定型的ミトーシスデータセット(AMi-Br)を構築した。本研究では,自動非定型ミトティックフィギュア(AMF)分類における深層学習手法の比較を行った。ドメイン内AMi-Brとドメイン外AtNorm-BrとAtNorM-MDでは,それぞれ0.8135,0.7788,0.7723のバランス精度が得られた。
論文参考訳（メタデータ） (2025-06-26T16:30:42Z)
A multimodal ensemble approach for clear cell renal cell carcinoma treatment outcome prediction [6.199310532720352]
臨床データ,マルチオミクスデータ,および病理組織学的全スライド画像(WSI)データを統合するマルチモーダルアンサンブルモデル(MMEM)を開発した。 MMEMはccRCC患者の全身生存率(OS)と無病生存率(DFS)を予測した。
論文参考訳（メタデータ） (2024-12-10T02:51:14Z)
CIMIL-CRC: a clinically-informed multiple instance learning framework for patient-level colorectal cancer molecular subtypes classification from H\&E stained images [42.771819949806655]
CIMIL-CRCは、事前学習した特徴抽出モデルと主成分分析(PCA)を効率よく組み合わせ、全てのパッチから情報を集約することで、MSI/MSS MIL問題を解決するフレームワークである。我々は,TCGA-CRC-DXコホートを用いたモデル開発のための5倍のクロスバリデーション実験装置を用いて,曲線下平均面積(AUC)を用いてCIMIL-CRC法の評価を行った。
論文参考訳（メタデータ） (2024-01-29T12:56:11Z)
Improving Classification Model Performance on Chest X-Rays through Lung Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文参考訳（メタデータ） (2022-02-22T15:24:06Z)
A multi-stage machine learning model on diagnosis of esophageal manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文参考訳（メタデータ） (2021-06-25T20:09:23Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。