論文の概要: Graph Neural Networks for Breast Cancer Data Integration
- arxiv url: http://arxiv.org/abs/2211.15561v1
- Date: Mon, 28 Nov 2022 17:10:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 20:44:11.512051
- Title: Graph Neural Networks for Breast Cancer Data Integration
- Title(参考訳): 乳癌データ統合のためのグラフニューラルネットワーク
- Authors: Teodora Reu
- Abstract要約: 本稿では,ガンデータモダリティをグラフとして統合し,次にグラフニューラルネットワークを適用する3つのステップからなる新しい学習パイプラインを提案する。
このプロジェクトは、がんデータ理解を改善する可能性があり、正規データセットからグラフ型データへの移行を促進する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: International initiatives such as METABRIC (Molecular Taxonomy of Breast
Cancer International Consortium) have collected several multigenomic and
clinical data sets to identify the undergoing molecular processes taking place
throughout the evolution of various cancers. Numerous Machine Learning and
statistical models have been designed and trained to analyze these types of
data independently, however, the integration of such differently shaped and
sourced information streams has not been extensively studied. To better
integrate these data sets and generate meaningful representations that can
ultimately be leveraged for cancer detection tasks could lead to giving
well-suited treatments to patients. Hence, we propose a novel learning pipeline
comprising three steps - the integration of cancer data modalities as graphs,
followed by the application of Graph Neural Networks in an unsupervised setting
to generate lower-dimensional embeddings from the combined data, and finally
feeding the new representations on a cancer sub-type classification model for
evaluation. The graph construction algorithms are described in-depth as
METABRIC does not store relationships between the patient modalities, with a
discussion of their influence over the quality of the generated embeddings. We
also present the models used to generate the lower-latent space
representations: Graph Neural Networks, Variational Graph Autoencoders and Deep
Graph Infomax. In parallel, the pipeline is tested on a synthetic dataset to
demonstrate that the characteristics of the underlying data, such as homophily
levels, greatly influence the performance of the pipeline, which ranges between
51\% to 98\% accuracy on artificial data, and 13\% and 80\% on METABRIC. This
project has the potential to improve cancer data understanding and encourages
the transition of regular data sets to graph-shaped data.
- Abstract(参考訳): METABRIC (Molecular Taxonomy of Breast Cancer International Consortium) などの国際イニシアチブは、様々ながんの進化を通じて進行中の分子過程を特定するために、複数の多ゲノミクスおよび臨床データセットを収集している。
多くの機械学習と統計モデルは、これらのタイプのデータを独立して分析するために設計、訓練されてきたが、そのような異なる形状のソース情報ストリームの統合は、広く研究されていない。
これらのデータセットをよりうまく統合し、最終的にがん検出タスクに活用できる有意義な表現を生成することで、患者に適切な治療を与えることができる。
そこで我々は,ガンデータモダリティをグラフとして統合し,次いでグラフニューラルネットワークを教師なし環境で適用して,組み合わせたデータから低次元の埋め込みを生成し,最終的に癌サブタイプの分類モデルに新しい表現を与えて評価する,という3つのステップからなる新しい学習パイプラインを提案する。
グラフ構築アルゴリズムは、METABRICは患者のモダリティ間の関係を記憶していないため、それらが生成した埋め込みの品質に与える影響について議論している。
また、グラフニューラルネットワーク、変分グラフオートエンコーダ、ディープグラフ情報マックスといった低遅延空間表現を生成するために使用されるモデルも提示する。
並列に、パイプラインを合成データセット上でテストし、ホモフィリーレベルなどの基礎となるデータの特徴が、人工データにおける51\%から98\%の精度、METABRICにおける13\%と80\%の精度に大きく影響を与えることを示した。
このプロジェクトは、がんデータ理解を改善する可能性があり、正規データセットからグラフ型データへの移行を促進する。
関連論文リスト
- Comparative Analysis of Multi-Omics Integration Using Advanced Graph Neural Networks for Cancer Classification [40.45049709820343]
マルチオミクスデータ統合は、高次元性、データ複雑さ、および様々なオミクスタイプの異なる特徴により、大きな課題を生じさせる。
本研究では、グラフ畳み込みネットワーク(GCN)、グラフアテンションネットワーク(GAT)、グラフトランスフォーマーネットワーク(GTN)に基づくマルチオミクス(MO)統合のための3つのグラフニューラルネットワークアーキテクチャを評価する。
論文 参考訳(メタデータ) (2024-10-05T16:17:44Z) - Embedding-based Multimodal Learning on Pan-Squamous Cell Carcinomas for Improved Survival Outcomes [0.0]
PARADIGMは、マルチモーダルで異質なデータセットから学習し、臨床結果の予測を改善するフレームワークである。
膵扁平上皮癌においてGNNを訓練し,Moffitt Cancer Center肺SCCデータに対するアプローチを検証した。
我々のソリューションは、患者の状況を包括的に理解することを目的としており、異種データ統合と最大データビューの収束の利点についての洞察を提供する。
論文 参考訳(メタデータ) (2024-06-11T22:19:14Z) - SELECTOR: Heterogeneous graph network with convolutional masked autoencoder for multimodal robust prediction of cancer survival [8.403756148610269]
がん患者生存のマルチモーダル予測は、より包括的で正確なアプローチを提供する。
本稿では、畳み込みマスクエンコーダに基づく異種グラフ認識ネットワークであるSELECTORを紹介する。
本手法は,モダリティ欠落とモダリティ内情報確認の両事例において,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-14T11:23:39Z) - An end-to-end framework for gene expression classification by
integrating a background knowledge graph: application to cancer prognosis
prediction [1.5484595752241122]
我々は、一次データの分類モデルを構築するために、二次データを扱うエンドツーエンドフレームワークを提案した。
我々はこの枠組みを,遺伝子発現データと生物学的ネットワークを用いた癌予後予測に応用した。
論文 参考訳(メタデータ) (2023-06-29T11:20:47Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - A Pipeline for Integrated Theory and Data-Driven Modeling of Genomic and
Clinical Data [5.921993992338802]
統合ゲノムおよび臨床データからの知識発見のためのパイプラインを提案する。
このパイプラインが乳がんの予後予測モデルをどのように改善するかを実証し、生物学的に解釈可能なシークエンシングデータのビューを提供する。
論文 参考訳(メタデータ) (2020-05-05T22:23:27Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。