論文の概要: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- arxiv url: http://arxiv.org/abs/2303.09354v1
- Date: Thu, 16 Mar 2023 14:32:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:13:11.400271
- Title: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- Title(参考訳): 計算病理学における再現性研究のためのプラットフォームとしてのNCI Imaging Data Commons
- Authors: Daniela P. Schacherer, Markus D. Herrmann, David A. Clunie, Henning
H\"ofener, William Clifford, William J.R. Longabaugh, Steve Pieper, Ron
Kikinis, Andrey Fedorov, Andr\'e Homeyer
- Abstract要約: 再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実践に翻訳するために重要である。
NCI Imaging Data Commons (IDC) は >120 のがん画像コレクションの公開リポジトリである。
本稿では,コンパス研究を促進するためのIDCの可能性を探る。
- 参考スコア(独自算出の注目度): 0.16252563723817934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Reproducibility is critical for translating machine learning-based
(ML) solutions in computational pathology (CompPath) into practice. However, an
increasing number of studies report difficulties in reproducing ML results. The
NCI Imaging Data Commons (IDC) is a public repository of >120 cancer image
collections, including >38,000 whole-slide images (WSIs), that is designed to
be used with cloud-based ML services. Here, we explore the potential of the IDC
to facilitate reproducibility of CompPath research.
Materials and Methods: The IDC realizes the FAIR principles: All images are
encoded according to the DICOM standard, persistently identified, discoverable
via rich metadata, and accessible via open tools. Taking advantage of this, we
implemented two experiments in which a representative ML-based method for
classifying lung tumor tissue was trained and/or evaluated on different
datasets from the IDC. To assess reproducibility, the experiments were run
multiple times with independent but identically configured sessions of common
ML services.
Results: The AUC values of different runs of the same experiment were
generally consistent and in the same order of magnitude as a similar,
previously published study. However, there were occasional small variations in
AUC values of up to 0.044, indicating a practical limit to reproducibility.
Discussion and conclusion: By realizing the FAIR principles, the IDC enables
other researchers to reuse exactly the same datasets. Cloud-based ML services
enable others to run CompPath experiments in an identically configured
computing environment without having to own high-performance hardware. The
combination of both makes it possible to approach the reproducibility limit.
- Abstract(参考訳): 目的:再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実際に翻訳するために重要である。
しかし、ML結果の再現に困難を訴える研究が増えている。
NCI Imaging Data Commons (IDC) は、クラウドベースのMLサービスで使用されるように設計された、 >38,000全体スライディングイメージ(WSI)を含む、120以上のがんイメージコレクションのパブリックリポジトリである。
本稿では,CompPath 研究の再現性を高めるための IDC の可能性を探る。
すべてのイメージはDICOM標準に従ってエンコードされ、永続的に識別され、豊富なメタデータを介して発見可能で、オープンツールを介してアクセスできます。
そこで本研究では,肺腫瘍組織を分類する代表的なml法をトレーニングし,idcと異なるデータセットを用いて評価する実験を行った。
再現性を評価するために、実験は独立しているが同じ構成のMLサービスのセッションで複数回行われた。
結果: 同じ実験の異なるランのAUC値は概ね一貫したものであり、以前公表された同様の研究と同じ桁である。
しかし、auc値のばらつきは0.044までで、再現性に実用的限界があることを示している。
議論と結論: FAIR原則を実現することで、IDCは他の研究者がまったく同じデータセットを再利用できるようになる。
クラウドベースのMLサービスは、他の人が高性能ハードウェアを所有することなく、同じ構成のコンピューティング環境でCompPath実験を実行できる。
両方の組み合わせにより再現性限界に近づくことができる。
関連論文リスト
- MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Multi-Study R-Learner for Estimating Heterogeneous Treatment Effects Across Studies Using Statistical Machine Learning [1.1045045527359925]
ヘテロジニアス治療効果(HTEs)の推定は、精密医療に不可欠である。
既存のアプローチはしばしば研究全体で同じHTEを仮定する。
マルチスタディHTE推定のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-01T18:56:58Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Enabling Reproducibility and Meta-learning Through a Lifelong Database
of Experiments (LDE) [0.43012765978447565]
本稿では,実験成果物から関連メタデータを自動的に抽出し,保存するライフロング・データベース・オブ・エクスペリメント(LDE)を提案する。
AI開発ライフサイクルの複数のステージから、データセットやパイプライン、各設定方法、トレーニングはランタイム環境に関する情報とともに実行される。
このメタデータに対して,1)パフォーマンス指標の変動性を調べること,2)データ上に複数のメタ学習アルゴリズムを実装すること,の2つの実験を行った。
論文 参考訳(メタデータ) (2022-02-22T15:35:16Z) - Learning Robust Hierarchical Patterns of Human Brain across Many fMRI
Studies [2.451910407959205]
安静時fMRIは、様々な疾患の分析にサロゲートバイオマーカーを提供することが示されている。
バイオマーカーの統計力と脳の理解メカニズムを改善するために、マルチセンター研究のプールがますます普及しています。
しかし、複数のサイトからデータをプールすることは、ハードウェア、ソフトウェア、環境によるバリエーションをもたらす。
論文 参考訳(メタデータ) (2021-05-13T20:10:00Z) - LCS-DIVE: An Automated Rule-based Machine Learning Visualization
Pipeline for Characterizing Complex Associations in Classification [0.7226144684379191]
本研究では、複雑な生物医学分類のための自動LCS解釈パイプラインであるLCS Discovery Visualization Environment(LCS-DIVE)を紹介する。
LCS-DIVEは、バイオメディカルデータマイニングにおけるノイズとスケーラビリティを克服するために設計されたLCSであるExSTraCSの新しいシキット学習実装を使用してモデリングを行います。
特徴追跡スコアおよび/またはルールを利用して、(1)特徴の重要性(2)基礎となる付加、エピスタティック、および/または異種関係のパターン、(3)クラスタリング、視覚化生成、およびクラスタ尋問を介してモデル駆動の異種サブグループを自動的に評価する。
論文 参考訳(メタデータ) (2021-04-26T19:47:03Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Knowledge transfer across cell lines using Hybrid Gaussian Process
models with entity embedding vectors [62.997667081978825]
生物化学的プロセスを開発するために、多数の実験が実施されている。
既に開発されたプロセスのデータを利用して、新しいプロセスの予測を行い、必要な実験の数を大幅に削減できるだろうか。
論文 参考訳(メタデータ) (2020-11-27T17:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。