論文の概要: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- arxiv url: http://arxiv.org/abs/2303.09354v1
- Date: Thu, 16 Mar 2023 14:32:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:13:11.400271
- Title: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- Title(参考訳): 計算病理学における再現性研究のためのプラットフォームとしてのNCI Imaging Data Commons
- Authors: Daniela P. Schacherer, Markus D. Herrmann, David A. Clunie, Henning
H\"ofener, William Clifford, William J.R. Longabaugh, Steve Pieper, Ron
Kikinis, Andrey Fedorov, Andr\'e Homeyer
- Abstract要約: 再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実践に翻訳するために重要である。
NCI Imaging Data Commons (IDC) は >120 のがん画像コレクションの公開リポジトリである。
本稿では,コンパス研究を促進するためのIDCの可能性を探る。
- 参考スコア(独自算出の注目度): 0.16252563723817934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Reproducibility is critical for translating machine learning-based
(ML) solutions in computational pathology (CompPath) into practice. However, an
increasing number of studies report difficulties in reproducing ML results. The
NCI Imaging Data Commons (IDC) is a public repository of >120 cancer image
collections, including >38,000 whole-slide images (WSIs), that is designed to
be used with cloud-based ML services. Here, we explore the potential of the IDC
to facilitate reproducibility of CompPath research.
Materials and Methods: The IDC realizes the FAIR principles: All images are
encoded according to the DICOM standard, persistently identified, discoverable
via rich metadata, and accessible via open tools. Taking advantage of this, we
implemented two experiments in which a representative ML-based method for
classifying lung tumor tissue was trained and/or evaluated on different
datasets from the IDC. To assess reproducibility, the experiments were run
multiple times with independent but identically configured sessions of common
ML services.
Results: The AUC values of different runs of the same experiment were
generally consistent and in the same order of magnitude as a similar,
previously published study. However, there were occasional small variations in
AUC values of up to 0.044, indicating a practical limit to reproducibility.
Discussion and conclusion: By realizing the FAIR principles, the IDC enables
other researchers to reuse exactly the same datasets. Cloud-based ML services
enable others to run CompPath experiments in an identically configured
computing environment without having to own high-performance hardware. The
combination of both makes it possible to approach the reproducibility limit.
- Abstract(参考訳): 目的:再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実際に翻訳するために重要である。
しかし、ML結果の再現に困難を訴える研究が増えている。
NCI Imaging Data Commons (IDC) は、クラウドベースのMLサービスで使用されるように設計された、 >38,000全体スライディングイメージ(WSI)を含む、120以上のがんイメージコレクションのパブリックリポジトリである。
本稿では,CompPath 研究の再現性を高めるための IDC の可能性を探る。
すべてのイメージはDICOM標準に従ってエンコードされ、永続的に識別され、豊富なメタデータを介して発見可能で、オープンツールを介してアクセスできます。
そこで本研究では,肺腫瘍組織を分類する代表的なml法をトレーニングし,idcと異なるデータセットを用いて評価する実験を行った。
再現性を評価するために、実験は独立しているが同じ構成のMLサービスのセッションで複数回行われた。
結果: 同じ実験の異なるランのAUC値は概ね一貫したものであり、以前公表された同様の研究と同じ桁である。
しかし、auc値のばらつきは0.044までで、再現性に実用的限界があることを示している。
議論と結論: FAIR原則を実現することで、IDCは他の研究者がまったく同じデータセットを再利用できるようになる。
クラウドベースのMLサービスは、他の人が高性能ハードウェアを所有することなく、同じ構成のコンピューティング環境でCompPath実験を実行できる。
両方の組み合わせにより再現性限界に近づくことができる。
関連論文リスト
- COCOA: Cross Modality Contrastive Learning for Sensor Data [9.440900386313213]
COCOA(Cross mOdality Contrastive leArning)は、マルチセンサーデータから品質表現を学習するために、新しい目的関数を利用する自己教師型モデルである。
我々はCOCOAが他のすべてのアプローチよりも優れた分類性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-07-31T16:36:13Z) - FedNorm: Modality-Based Normalization in Federated Learning for
Multi-Modal Liver Segmentation [9.203390025029883]
肝セグメンテーションは、診断および経過観察のために、CTおよびMRI画像を分析する最も一般的な方法の1つである。
近年のディープラーニングの進歩は, 自動肝セグメンテーションの促進効果を示している。
分散クライアント上で共有グローバルモデルをトレーニングすることで、課題を軽減するソリューションとして、フェデレートラーニング(Federated Learning)が提案されている。
モーダリティに基づく正規化手法を用いた2つのフェデレート学習アルゴリズムであるFednormとその拡張フェデノープを提案する。
論文 参考訳(メタデータ) (2022-05-23T07:34:34Z) - Enabling Reproducibility and Meta-learning Through a Lifelong Database
of Experiments (LDE) [0.43012765978447565]
本稿では,実験成果物から関連メタデータを自動的に抽出し,保存するライフロング・データベース・オブ・エクスペリメント(LDE)を提案する。
AI開発ライフサイクルの複数のステージから、データセットやパイプライン、各設定方法、トレーニングはランタイム環境に関する情報とともに実行される。
このメタデータに対して,1)パフォーマンス指標の変動性を調べること,2)データ上に複数のメタ学習アルゴリズムを実装すること,の2つの実験を行った。
論文 参考訳(メタデータ) (2022-02-22T15:35:16Z) - Shared Independent Component Analysis for Multi-Subject Neuroimaging [107.29179765643042]
本稿では,ShICA (Shared Independent Component Analysis) を導入し,各ビューを加法ガウス雑音によって汚染された共有独立成分の線形変換としてモデル化する。
このモデルは、成分がガウス的でないか、あるいはノイズ分散に十分な多様性がある場合、同定可能であることを示す。
我々は,fMRIおよびMEGデータセットの実証的証拠として,ShICAが代替品よりも正確な成分推定を行うことを示す。
論文 参考訳(メタデータ) (2021-10-26T08:54:41Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z) - Machine Learning Pipelines: Provenance, Reproducibility and FAIR Data
Principles [0.0]
マシンラーニングパイプラインのエンドツーエンドをサポートするための、私たちの目標と最初のステップについて説明します。
ソースコードとデータセットの可用性を超えて、どの要因がML実験に影響を与えるかを検討する。
ML実験にFAIRデータプラクティスを適用する方法を提案する。
論文 参考訳(メタデータ) (2020-06-22T10:17:34Z) - DiVA: Diverse Visual Feature Aggregation for Deep Metric Learning [83.48587570246231]
視覚的類似性は多くのコンピュータビジョンアプリケーションにおいて重要な役割を果たす。
ディープ・メトリック・ラーニング(DML)は、そのような類似性を学ぶための強力なフレームワークである。
我々は,概念的に異なるデータ関係を対象とする複数の補完学習タスクを提案し,研究する。
我々は、訓練信号を集約する単一モデルを学び、その結果、強力な一般化と最先端のパフォーマンスが得られる。
論文 参考訳(メタデータ) (2020-04-28T12:26:50Z) - A DICOM Framework for Machine Learning Pipelines against Real-Time
Radiology Images [50.222197963803644]
Nifflerは、研究クラスタでの機械学習パイプラインの実行を可能にする統合フレームワークである。
ニフラーはDigital Imaging and Communications in Medicine (DICOM)プロトコルを使用して画像データの取得と保存を行っている。
我々は,そのアーキテクチャと3つのユースケースを提示する: リアルタイムに画像から下大静脈フィルターを検出すること,スキャナ利用の同定,およびスキャナクロックの校正。
論文 参考訳(メタデータ) (2020-04-16T21:06:49Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。