論文の概要: Scalable Knowledge Graph Construction and Inference on Human Genome
Variants
- arxiv url: http://arxiv.org/abs/2312.04423v1
- Date: Thu, 7 Dec 2023 16:48:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 14:07:15.862688
- Title: Scalable Knowledge Graph Construction and Inference on Human Genome
Variants
- Title(参考訳): スケーラブルなナレッジグラフの構築とヒトゲノム変異の推論
- Authors: Shivika Prasanna, Deepthi Rao, Eduardo Simoes, Praveen Rao
- Abstract要約: 現実世界の知識は、実体とそれらの間の関係からなるグラフとして表すことができる。
本研究は, ワクチン陰性COVID-19患者のRNA配列から抽出した変異レベル情報を, 統合された大規模知識グラフとして表現したものである。
- 参考スコア(独自算出の注目度): 2.8523023316864413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world knowledge can be represented as a graph consisting of entities and
relationships between the entities. The need for efficient and scalable
solutions arises when dealing with vast genomic data, like RNA-sequencing.
Knowledge graphs offer a powerful approach for various tasks in such
large-scale genomic data, such as analysis and inference. In this work,
variant-level information extracted from the RNA-sequences of vaccine-na\"ive
COVID-19 patients have been represented as a unified, large knowledge graph.
Variant call format (VCF) files containing the variant-level information were
annotated to include further information for each variant. The data records in
the annotated files were then converted to Resource Description Framework (RDF)
triples. Each VCF file obtained had an associated CADD scores file that
contained the raw and Phred-scaled scores for each variant. An ontology was
defined for the VCF and CADD scores files. Using this ontology and the
extracted information, a large, scalable knowledge graph was created. Available
graph storage was then leveraged to query and create datasets for further
downstream tasks. We also present a case study using the knowledge graph and
perform a classification task using graph machine learning. We also draw
comparisons between different Graph Neural Networks (GNNs) for the case study.
- Abstract(参考訳): 実世界の知識は、エンティティとエンティティ間の関係からなるグラフとして表現できる。
RNAシークエンシングのような巨大なゲノムデータを扱う際に、効率的でスケーラブルなソリューションの必要性が生じる。
ナレッジグラフは、解析や推論のような大規模ゲノムデータにおける様々なタスクに対して強力なアプローチを提供する。
本研究は、ワクチン・ナシブウイルス患者のRNA配列から抽出された変異レベル情報を、統合された大きな知識グラフとして表現したものである。
変種コールフォーマット(vcf) 変種レベルの情報を含むファイルは、各変種について追加情報を含むようアノテートされた。
アノテーション付きファイルのデータレコードは、Resource Description Framework(RDF)のトリプルに変換される。
得られた各VCFファイルにはCADDスコアファイルがあり、各変数の生スコアとPhredスケールスコアが含まれている。
VCFおよびCADDスコアファイルに対してオントロジーを定義した。
このオントロジーと抽出された情報を用いて、大規模でスケーラブルな知識グラフが作成された。
利用可能なグラフストレージはクエリに利用され、下流タスク用のデータセットを生成する。
また、知識グラフを用いたケーススタディを行い、グラフ機械学習を用いた分類タスクを実行する。
また,本研究では,異なるグラフニューラルネットワーク(gnns)の比較を行った。
関連論文リスト
- Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees [50.78679002846741]
グラフにおけるクロスタスクの一般性を学習するための新しいアプローチを提案する。
グラフ上のタスク空間を整列させるための基本的な学習インスタンスとしてタスクツリーを提案する。
その結果,グラフニューラルネットワークが多種多様なタスクツリーで事前訓練された場合,伝達可能な知識を取得することが示唆された。
論文 参考訳(メタデータ) (2024-12-21T02:07:43Z) - A Scalable Tool For Analyzing Genomic Variants Of Humans Using Knowledge Graphs and Machine Learning [7.928994572633366]
知識グラフとグラフ機械学習を利用したゲノム変異解析のための総合的なアプローチを提案する。
提案手法は、変異レベルの遺伝情報を抽出し、SnpEffを使用して付加メタデータでアノテートし、リッチなVariant Call FormatファイルをResource Description Frameworkのトリプルに変換する。
結果として得られる知識グラフは、患者のメタデータによってさらに強化され、グラフデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-30T14:56:10Z) - TGNN: A Joint Semi-supervised Framework for Graph-level Classification [34.300070497510276]
我々は、ツイングラフニューラルネットワーク(TGNN)と呼ばれる新しい半教師付きフレームワークを提案する。
グラフ構造情報を補完的なビューから探索するために、TGNNにはメッセージパッシングモジュールとグラフカーネルモジュールがあります。
我々は,TGNNを様々な公開データセットで評価し,高い性能が得られることを示す。
論文 参考訳(メタデータ) (2023-04-23T15:42:11Z) - Graph Mixture of Experts: Learning on Large-Scale Graphs with Explicit
Diversity Modeling [60.0185734837814]
グラフニューラルネットワーク(GNN)は、グラフデータからの学習に広く応用されている。
GNNの一般化能力を強化するため、グラフ強化のような技術を用いて、トレーニンググラフ構造を増強することが慣例となっている。
本研究では,GNNにMixture-of-Experts(MoE)の概念を導入する。
論文 参考訳(メタデータ) (2023-04-06T01:09:36Z) - Learnable Graph Matching: A Practical Paradigm for Data Association [74.28753343714858]
これらの問題に対処するための一般的な学習可能なグラフマッチング法を提案する。
提案手法は,複数のMOTデータセット上での最先端性能を実現する。
画像マッチングでは,一般的な屋内データセットであるScanNetで最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-03-27T17:39:00Z) - Graph-based Knowledge Distillation: A survey and experimental evaluation [4.713436329217004]
既存のグラフニューラルネットワーク(GNN)を強化するために知識蒸留(KD)が導入されている。
KDは、予測性能を維持しながら、大きな教師モデルのソフトレーベルの監督を小学生モデルに移行することを含む。
本稿ではまず,グラフとKDの背景について紹介し,その上で3種類の知識蒸留法について概説する。
論文 参考訳(メタデータ) (2023-02-27T11:39:23Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - Scalable Graph Neural Networks for Heterogeneous Graphs [12.44278942365518]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを学習するためのパラメトリックモデルの一般的なクラスである。
最近の研究は、GNNが主に機能をスムースにするためにグラフを使用しており、ベンチマークタスクで競合する結果を示していると主張している。
本研究では、これらの結果が異種グラフに拡張可能かどうかを問うとともに、異なるエンティティ間の複数のタイプの関係を符号化する。
論文 参考訳(メタデータ) (2020-11-19T06:03:35Z) - Graph Contrastive Learning with Augmentations [109.23158429991298]
グラフデータの教師なし表現を学習するためのグラフコントラスト学習(GraphCL)フレームワークを提案する。
我々のフレームワークは、最先端の手法と比較して、類似またはより良い一般化可能性、転送可能性、堅牢性のグラフ表現を作成できることを示す。
論文 参考訳(メタデータ) (2020-10-22T20:13:43Z) - Graph Representation Learning Network via Adaptive Sampling [4.996520403438455]
Graph Attention Network(GAT)とGraphSAGEは、グラフ構造化データを操作するニューラルネットワークアーキテクチャである。
GraphSAGEが提起した課題のひとつは、グラフ構造に基づいた隣の機能をスマートに組み合わせる方法だ。
より効率的で,異なるエッジ型情報を組み込むことが可能な,これらの問題に対処する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-06-08T14:36:20Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。