Fugu-MT 論文翻訳(概要): The NCI Imaging Data Commons as a platform for reproducible research in computational pathology

論文の概要: The NCI Imaging Data Commons as a platform for reproducible research in computational pathology

arxiv url: http://arxiv.org/abs/2303.09354v1
Date: Thu, 16 Mar 2023 14:32:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-17 15:13:11.400271
Title: The NCI Imaging Data Commons as a platform for reproducible research in computational pathology
Title（参考訳）: 計算病理学における再現性研究のためのプラットフォームとしてのNCI Imaging Data Commons
Authors: Daniela P. Schacherer, Markus D. Herrmann, David A. Clunie, Henning H\"ofener, William Clifford, William J.R. Longabaugh, Steve Pieper, Ron Kikinis, Andrey Fedorov, Andr\'e Homeyer
Abstract要約: 再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実践に翻訳するために重要である。 NCI Imaging Data Commons (IDC) は >120 のがん画像コレクションの公開リポジトリである。本稿では,コンパス研究を促進するためのIDCの可能性を探る。
参考スコア（独自算出の注目度）: 0.16252563723817934
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Objective: Reproducibility is critical for translating machine learning-based (ML) solutions in computational pathology (CompPath) into practice. However, an increasing number of studies report difficulties in reproducing ML results. The NCI Imaging Data Commons (IDC) is a public repository of >120 cancer image collections, including >38,000 whole-slide images (WSIs), that is designed to be used with cloud-based ML services. Here, we explore the potential of the IDC to facilitate reproducibility of CompPath research. Materials and Methods: The IDC realizes the FAIR principles: All images are encoded according to the DICOM standard, persistently identified, discoverable via rich metadata, and accessible via open tools. Taking advantage of this, we implemented two experiments in which a representative ML-based method for classifying lung tumor tissue was trained and/or evaluated on different datasets from the IDC. To assess reproducibility, the experiments were run multiple times with independent but identically configured sessions of common ML services. Results: The AUC values of different runs of the same experiment were generally consistent and in the same order of magnitude as a similar, previously published study. However, there were occasional small variations in AUC values of up to 0.044, indicating a practical limit to reproducibility. Discussion and conclusion: By realizing the FAIR principles, the IDC enables other researchers to reuse exactly the same datasets. Cloud-based ML services enable others to run CompPath experiments in an identically configured computing environment without having to own high-performance hardware. The combination of both makes it possible to approach the reproducibility limit.
Abstract（参考訳）: 目的:再現性は、計算病理学(CompPath)における機械学習(ML)ソリューションを実際に翻訳するために重要である。しかし、ML結果の再現に困難を訴える研究が増えている。 NCI Imaging Data Commons (IDC) は、クラウドベースのMLサービスで使用されるように設計された、 >38,000全体スライディングイメージ(WSI)を含む、120以上のがんイメージコレクションのパブリックリポジトリである。本稿では,CompPath 研究の再現性を高めるための IDC の可能性を探る。すべてのイメージはDICOM標準に従ってエンコードされ、永続的に識別され、豊富なメタデータを介して発見可能で、オープンツールを介してアクセスできます。そこで本研究では,肺腫瘍組織を分類する代表的なml法をトレーニングし,idcと異なるデータセットを用いて評価する実験を行った。再現性を評価するために、実験は独立しているが同じ構成のMLサービスのセッションで複数回行われた。結果: 同じ実験の異なるランのAUC値は概ね一貫したものであり、以前公表された同様の研究と同じ桁である。しかし、auc値のばらつきは0.044までで、再現性に実用的限界があることを示している。議論と結論: FAIR原則を実現することで、IDCは他の研究者がまったく同じデータセットを再利用できるようになる。クラウドベースのMLサービスは、他の人が高性能ハードウェアを所有することなく、同じ構成のコンピューティング環境でCompPath実験を実行できる。両方の組み合わせにより再現性限界に近づくことができる。

関連論文リスト

Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文参考訳（メタデータ） (2025-10-05T12:35:01Z)
From Data to Decision: Data-Centric Infrastructure for Reproducible ML in Collaborative eScience [1.136688282190268]
機械学習(ML)における再現性は依然として中心的な課題である現在のMLは、しばしば断片化され、非公式なデータ共有、アドホックスクリプト、ゆるく接続されたツールに依存している。本稿では,ライフサイクルを意識したアーティファクトのためのデータ中心フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-19T06:09:01Z)
Is Limited Participant Diversity Impeding EEG-based Machine Learning? [12.258707843214946]
脳波記録を小さなセグメントに分割してサンプル数を増やすのが一般的である。我々はこれをマルチレベルデータ生成プロセスとして概念化し、モデル性能のスケーリング挙動について検討する。次に、同じフレームワークを使用して、限られたデータ問題に対処するために設計されたさまざまなML戦略の有効性を調査します。
論文参考訳（メタデータ） (2025-03-11T12:04:59Z)
MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文参考訳（メタデータ） (2024-02-21T14:22:20Z)
Source-Free Collaborative Domain Adaptation via Multi-Perspective Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文参考訳（メタデータ） (2023-08-24T01:30:18Z)
DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文参考訳（メタデータ） (2023-06-27T16:59:06Z)
Multi-Study R-Learner for Estimating Heterogeneous Treatment Effects Across Studies Using Statistical Machine Learning [1.1045045527359925]
ヘテロジニアス治療効果(HTEs)の推定は、精密医療に不可欠である。既存のアプローチはしばしば研究全体で同じHTEを仮定する。マルチスタディHTE推定のためのフレームワークを提案する。
論文参考訳（メタデータ） (2023-06-01T18:56:58Z)
Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。 GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文参考訳（メタデータ） (2022-07-20T07:32:02Z)
Enabling Reproducibility and Meta-learning Through a Lifelong Database of Experiments (LDE) [0.43012765978447565]
本稿では,実験成果物から関連メタデータを自動的に抽出し,保存するライフロング・データベース・オブ・エクスペリメント(LDE)を提案する。 AI開発ライフサイクルの複数のステージから、データセットやパイプライン、各設定方法、トレーニングはランタイム環境に関する情報とともに実行される。このメタデータに対して,1)パフォーマンス指標の変動性を調べること,2)データ上に複数のメタ学習アルゴリズムを実装すること,の2つの実験を行った。
論文参考訳（メタデータ） (2022-02-22T15:35:16Z)
Learning Robust Hierarchical Patterns of Human Brain across Many fMRI Studies [2.451910407959205]
安静時fMRIは、様々な疾患の分析にサロゲートバイオマーカーを提供することが示されている。バイオマーカーの統計力と脳の理解メカニズムを改善するために、マルチセンター研究のプールがますます普及しています。しかし、複数のサイトからデータをプールすることは、ハードウェア、ソフトウェア、環境によるバリエーションをもたらす。
論文参考訳（メタデータ） (2021-05-13T20:10:00Z)
LCS-DIVE: An Automated Rule-based Machine Learning Visualization Pipeline for Characterizing Complex Associations in Classification [0.7226144684379191]
本研究では、複雑な生物医学分類のための自動LCS解釈パイプラインであるLCS Discovery Visualization Environment(LCS-DIVE)を紹介する。 LCS-DIVEは、バイオメディカルデータマイニングにおけるノイズとスケーラビリティを克服するために設計されたLCSであるExSTraCSの新しいシキット学習実装を使用してモデリングを行います。特徴追跡スコアおよび/またはルールを利用して、(1)特徴の重要性(2)基礎となる付加、エピスタティック、および/または異種関係のパターン、(3)クラスタリング、視覚化生成、およびクラスタ尋問を介してモデル駆動の異種サブグループを自動的に評価する。
論文参考訳（メタデータ） (2021-04-26T19:47:03Z)
Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2021-04-19T12:26:26Z)
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文参考訳（メタデータ） (2020-12-16T17:21:13Z)
Knowledge transfer across cell lines using Hybrid Gaussian Process models with entity embedding vectors [62.997667081978825]
生物化学的プロセスを開発するために、多数の実験が実施されている。既に開発されたプロセスのデータを利用して、新しいプロセスの予測を行い、必要な実験の数を大幅に削減できるだろうか。
論文参考訳（メタデータ） (2020-11-27T17:38:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。