論文の概要: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- arxiv url: http://arxiv.org/abs/2303.09354v2
- Date: Tue, 18 Apr 2023 07:23:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 17:26:24.571703
- Title: The NCI Imaging Data Commons as a platform for reproducible research in
computational pathology
- Title(参考訳): 計算病理学における再現性研究のためのプラットフォームとしてのNCI Imaging Data Commons
- Authors: Daniela P. Schacherer, Markus D. Herrmann, David A. Clunie, Henning
H\"ofener, William Clifford, William J.R. Longabaugh, Steve Pieper, Ron
Kikinis, Andrey Fedorov, Andr\'e Homeyer
- Abstract要約: 再現性は、計算病理学(CompPath)における機械学習(ML)ベースのソリューション開発における大きな課題である
NCI Imaging Data Commons (IDC)は、FAIR原則に従って120以上のがんイメージコレクションを提供し、クラウドMLサービスで使用するように設計されている。
肺腫瘍組織を分類する代表的ML法を訓練し,異なるデータセットで評価する2つの実験を行った。
- 参考スコア(独自算出の注目度): 0.16252563723817934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background and Objectives: Reproducibility is a major challenge in developing
machine learning (ML)-based solutions in computational pathology (CompPath).
The NCI Imaging Data Commons (IDC) provides >120 cancer image collections
according to the FAIR principles and is designed to be used with cloud ML
services. Here, we explore its potential to facilitate reproducibility in
CompPath research.
Methods: Using the IDC, we implemented two experiments in which a
representative ML-based method for classifying lung tumor tissue was trained
and/or evaluated on different datasets. To assess reproducibility, the
experiments were run multiple times with separate but identically configured
instances of common ML services.
Results: The AUC values of different runs of the same experiment were
generally consistent. However, we observed small variations in AUC values of up
to 0.045, indicating a practical limit to reproducibility.
Conclusions: We conclude that the IDC facilitates approaching the
reproducibility limit of CompPath research (i) by enabling researchers to reuse
exactly the same datasets and (ii) by integrating with cloud ML services so
that experiments can be run in identically configured computing environments.
- Abstract(参考訳): 背景と目的: 再現性は、計算病理学(CompPath)における機械学習(ML)ベースのソリューションを開発する上で大きな課題である。
NCI Imaging Data Commons (IDC)は、FAIR原則に従って120以上のがんイメージコレクションを提供し、クラウドMLサービスで使用するように設計されている。
ここでは,CompPath研究における再現性向上の可能性を探る。
方法: IDCを用いて, 肺腫瘍組織を分類する代表的ML法を訓練し, 異なるデータセットで評価する2つの実験を行った。
再現性を評価するために、実験は、同じ構成の共通mlサービスのインスタンスで複数回実行された。
結果: 同じ実験の異なる実行のAUC値は概ね一致していた。
しかし,AUC値の0.045までの変動は小さく,再現性に限界があることが示唆された。
結論:IDCはCompPath研究の再現性限界に近づきやすいと結論づける。
(i)研究者が全く同じデータセットを再利用できるようにすること
(ii) クラウドMLサービスとの統合により、同じ構成のコンピューティング環境で実験を実行できる。
関連論文リスト
- MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Multi-Study R-Learner for Estimating Heterogeneous Treatment Effects Across Studies Using Statistical Machine Learning [1.1045045527359925]
ヘテロジニアス治療効果(HTEs)の推定は、精密医療に不可欠である。
既存のアプローチはしばしば研究全体で同じHTEを仮定する。
マルチスタディHTE推定のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-01T18:56:58Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Enabling Reproducibility and Meta-learning Through a Lifelong Database
of Experiments (LDE) [0.43012765978447565]
本稿では,実験成果物から関連メタデータを自動的に抽出し,保存するライフロング・データベース・オブ・エクスペリメント(LDE)を提案する。
AI開発ライフサイクルの複数のステージから、データセットやパイプライン、各設定方法、トレーニングはランタイム環境に関する情報とともに実行される。
このメタデータに対して,1)パフォーマンス指標の変動性を調べること,2)データ上に複数のメタ学習アルゴリズムを実装すること,の2つの実験を行った。
論文 参考訳(メタデータ) (2022-02-22T15:35:16Z) - Learning Robust Hierarchical Patterns of Human Brain across Many fMRI
Studies [2.451910407959205]
安静時fMRIは、様々な疾患の分析にサロゲートバイオマーカーを提供することが示されている。
バイオマーカーの統計力と脳の理解メカニズムを改善するために、マルチセンター研究のプールがますます普及しています。
しかし、複数のサイトからデータをプールすることは、ハードウェア、ソフトウェア、環境によるバリエーションをもたらす。
論文 参考訳(メタデータ) (2021-05-13T20:10:00Z) - LCS-DIVE: An Automated Rule-based Machine Learning Visualization
Pipeline for Characterizing Complex Associations in Classification [0.7226144684379191]
本研究では、複雑な生物医学分類のための自動LCS解釈パイプラインであるLCS Discovery Visualization Environment(LCS-DIVE)を紹介する。
LCS-DIVEは、バイオメディカルデータマイニングにおけるノイズとスケーラビリティを克服するために設計されたLCSであるExSTraCSの新しいシキット学習実装を使用してモデリングを行います。
特徴追跡スコアおよび/またはルールを利用して、(1)特徴の重要性(2)基礎となる付加、エピスタティック、および/または異種関係のパターン、(3)クラスタリング、視覚化生成、およびクラスタ尋問を介してモデル駆動の異種サブグループを自動的に評価する。
論文 参考訳(メタデータ) (2021-04-26T19:47:03Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Knowledge transfer across cell lines using Hybrid Gaussian Process
models with entity embedding vectors [62.997667081978825]
生物化学的プロセスを開発するために、多数の実験が実施されている。
既に開発されたプロセスのデータを利用して、新しいプロセスの予測を行い、必要な実験の数を大幅に削減できるだろうか。
論文 参考訳(メタデータ) (2020-11-27T17:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。