論文の概要: Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets
- arxiv url: http://arxiv.org/abs/2310.01438v2
- Date: Fri, 22 Dec 2023 15:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 18:07:57.029470
- Title: Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets
- Title(参考訳): フレキシブル、スケーラブル、マシンラーニング対応のマルチモーダルoncologyデータセットの構築
- Authors: Aakash Tripathi, Asim Waqas, Kavya Venkatesan, Yasin Yilmaz, Ghulam
Rasool
- Abstract要約: 本研究は、オンコロジーデータシステム(MINDS)のマルチモーダル統合を提案する。
MINDSはフレキシブルでスケーラブルで費用対効果の高いメタデータフレームワークで、公開ソースから異なるデータを効率的に分離する。
MINDSは、マルチモーダルデータを調和させることで、より分析能力の高い研究者を力づけることを目指している。
- 参考スコア(独自算出の注目度): 17.774341783844026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advancements in data acquisition, storage, and processing techniques have
resulted in the rapid growth of heterogeneous medical data. Integrating
radiological scans, histopathology images, and molecular information with
clinical data is essential for developing a holistic understanding of the
disease and optimizing treatment. The need for integrating data from multiple
sources is further pronounced in complex diseases such as cancer for enabling
precision medicine and personalized treatments. This work proposes Multimodal
Integration of Oncology Data System (MINDS) - a flexible, scalable, and
cost-effective metadata framework for efficiently fusing disparate data from
public sources such as the Cancer Research Data Commons (CRDC) into an
interconnected, patient-centric framework. MINDS offers an interface for
exploring relationships across data types and building cohorts for developing
large-scale multimodal machine learning models. By harmonizing multimodal data,
MINDS aims to potentially empower researchers with greater analytical ability
to uncover diagnostic and prognostic insights and enable evidence-based
personalized care. MINDS tracks granular end-to-end data provenance, ensuring
reproducibility and transparency. The cloud-native architecture of MINDS can
handle exponential data growth in a secure, cost-optimized manner while
ensuring substantial storage optimization, replication avoidance, and dynamic
access capabilities. Auto-scaling, access controls, and other mechanisms
guarantee pipelines' scalability and security. MINDS overcomes the limitations
of existing biomedical data silos via an interoperable metadata-driven approach
that represents a pivotal step toward the future of oncology data integration.
- Abstract(参考訳): データ取得、ストレージ、処理技術の進歩は、異種医療データの急速な成長をもたらした。
放射線スキャン,病理像,分子情報を臨床データと統合することは,疾患の総合的理解と治療の最適化に不可欠である。
複数のソースからのデータを統合する必要性はさらに、精密医療やパーソナライズされた治療を可能にするために、がんなどの複雑な疾患で顕著である。
本研究は,がん研究データコモンズ (CRDC) などの公開ソースからの異種データを相互接続型で患者中心のフレームワークに効率的に融合するための,柔軟でスケーラブルで費用対効果の高いメタデータフレームワークであるマルチモーダル・インテグレーション・オブ・オンコロジー・データ・システム (MINDS) を提案する。
MINDSはデータ型間の関係を探索し、大規模マルチモーダル機械学習モデルを開発するためのコホートを構築するためのインターフェースを提供する。
MINDSはマルチモーダルデータを調和させることで、研究者に診断と予後の洞察を明らかにし、エビデンスベースのパーソナライズされたケアを可能にする分析能力を高めることを目指している。
MINDSは詳細なエンドツーエンドのデータプロファイランスを追跡し、再現性と透明性を確保する。
MINDSのクラウドネイティブアーキテクチャは、大幅なストレージ最適化、レプリケーション回避、動的アクセス機能を確保しながら、安全でコスト最適化された方法で指数関数的なデータ成長を処理することができる。
自動スケーリング、アクセス制御、その他のメカニズムは、パイプラインのスケーラビリティとセキュリティを保証する。
MINDSは、オンコロジーデータ統合の将来に向けた重要なステップである相互運用可能なメタデータ駆動アプローチを通じて、既存のバイオメディカルデータサイロの限界を克服する。
関連論文リスト
- Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets
with Unbalanced Modalities [10.352288752713413]
本研究では,データサンプルの不均一性に対応する新しいFLアーキテクチャを提案する。
FLシステム内の様々なデータモダリティにまたがる様々な収束速度に関する課題に光を当てた。
本手法の優位性を示すために,The Cancer Genome Atlas program (TCGA) datalake を用いて実験を行った。
論文 参考訳(メタデータ) (2024-01-07T23:45:01Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - HEALNet -- Hybrid Multi-Modal Fusion for Heterogeneous Biomedical Data [12.109041184519281]
本稿では, フレキシブルなマルチモーダル融合アーキテクチャであるHybrid Early-fusion Attention Learning Network (HEALNet)を提案する。
The Cancer Genome Atlas (TCGA) の4つの癌コホートにおける全スライド画像と多モードデータの多モード生存解析を行った。
HEALNetは最先端のパフォーマンスを実現し、ユニモーダルベースラインと最近のマルチモーダルベースラインの両方を大幅に改善した。
論文 参考訳(メタデータ) (2023-11-15T17:06:26Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Patchwork Learning: A Paradigm Towards Integrative Analysis across
Diverse Biomedical Data Sources [40.32772510980854]
パッチワーク学習(PL)とは、異なるデータモダリティからなる異なるデータセットからの情報を統合するパラダイムである。
PLはデータのプライバシを保持しながら、補完的なデータソースの同時利用を可能にする。
本稿では、パッチワーク学習の概念とその医療における実装について紹介し、潜在的な機会と適用可能なデータソースを探求する。
論文 参考訳(メタデータ) (2023-05-10T14:50:33Z) - Multimodal Data Integration for Oncology in the Era of Deep Neural
Networks: A Review [0.0]
多様なデータ型を統合することで、がんの診断と治療の精度と信頼性が向上する。
ディープニューラルネットワークは、洗練されたマルチモーダルデータ融合アプローチの開発を促進する。
グラフニューラルネットワーク(GNN)やトランスフォーマーといった最近のディープラーニングフレームワークは、マルチモーダル学習において顕著な成功を収めている。
論文 参考訳(メタデータ) (2023-03-11T17:52:03Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。