論文の概要: RNA-KG: An ontology-based knowledge graph for representing interactions
involving RNA molecules
- arxiv url: http://arxiv.org/abs/2312.00183v1
- Date: Thu, 30 Nov 2023 20:46:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 16:23:42.716273
- Title: RNA-KG: An ontology-based knowledge graph for representing interactions
involving RNA molecules
- Title(参考訳): RNA-KG:RNA分子間の相互作用を表現するオントロジーに基づく知識グラフ
- Authors: Emanuele Cavalleri, Alberto Cabri, Mauricio Soto-Gomez, Sara Bonfitto,
Paolo Perlasca, Jessica Gliozzo, Tiffany J. Callahan, Justin Reese, Peter N
Robinson, Elena Casiraghi, Giorgio Valentini, and Marco Mesiti
- Abstract要約: RNA-KGは、50以上の公開データベースから集められたRNAに関する生物学的知識を含む知識グラフである。
RNA-KGは異なるフォーマットでダウンロードでき、SPARQLエンドポイントでクエリすることもできる。
- 参考スコア(独自算出の注目度): 1.047257304057996
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The "RNA world" represents a novel frontier for the study of fundamental
biological processes and human diseases and is paving the way for the
development of new drugs tailored to the patient's biomolecular
characteristics. Although scientific data about coding and non-coding RNA
molecules are continuously produced and available from public repositories,
they are scattered across different databases and a centralized, uniform, and
semantically consistent representation of the "RNA world" is still lacking. We
propose RNA-KG, a knowledge graph encompassing biological knowledge about RNAs
gathered from more than 50 public databases, integrating functional
relationships with genes, proteins, and chemicals and ontologically grounded
biomedical concepts. To develop RNA-KG, we first identified, pre-processed, and
characterized each data source; next, we built a meta-graph that provides an
ontological description of the KG by representing all the bio-molecular
entities and medical concepts of interest in this domain, as well as the types
of interactions connecting them. Finally, we leveraged an instance-based
semantically abstracted knowledge model to specify the ontological alignment
according to which RNA-KG was generated. RNA-KG can be downloaded in different
formats and also queried by a SPARQL endpoint. A thorough topological analysis
of the resulting heterogeneous graph provides further insights into the
characteristics of the "RNA world". RNA-KG can be both directly explored and
visualized, and/or analyzed by applying computational methods to infer
bio-medical knowledge from its heterogeneous nodes and edges. The resource can
be easily updated with new experimental data, and specific views of the overall
KG can be extracted according to the bio-medical problem to be studied.
- Abstract(参考訳): RNAワールド」は、基本的な生物学的プロセスとヒトの疾患の研究のための新しいフロンティアであり、患者の生体分子特性に合わせた新しい薬物の開発の道を開いた。
コーディングおよび非コーディングRNA分子に関する科学的データは、公開リポジトリから継続的に作成され、利用可能であるが、それらは異なるデータベースに分散し、「RNA世界」の中央集権的で一貫した表現がまだ欠けている。
RNA-KGは、50以上の公開データベースから集められたRNAに関する生物学的知識を包含する知識グラフであり、遺伝子、タンパク質、化学物質と機能的関係と、オントロジ的に基盤付けられた生物医学的概念を統合する。
RNA-KGの開発にあたり、まず各データソースを特定し、前処理し、特徴づけた。次に、この領域におけるすべての生体分子の実体と医学的概念を表現し、それらを結合する相互作用のタイプを表現して、KGのオントロジ的記述を提供するメタグラフを構築した。
最後に,インスタンスベースの意味論的抽象化知識モデルを用いて,rna-kg生成のオントロジアライメントを同定した。
RNA-KGは異なるフォーマットでダウンロードでき、SPARQLエンドポイントでクエリすることもできる。
結果のヘテロジニアスグラフの完全なトポロジカル解析は、「RNA世界」の特性に関するさらなる洞察を与える。
RNA-KGは、その不均一なノードやエッジから生体医学的知識を推測するために計算手法を適用することにより、直接探索および可視化および/または解析することができる。
資源を新しい実験データで容易に更新することができ、研究対象の生体医学的問題に応じて全体KGの具体的なビューを抽出することができる。
関連論文リスト
- BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - RNA Secondary Structure Prediction Using Transformer-Based Deep Learning Models [13.781096813376145]
ヒトゲノムプロジェクト(Human Genome Project)は、生体分子の配列、構造、機能に関連するデータの指数関数的な増加につながった。
本稿では、RNAの基本概念、RNA二次構造、その予測について論じる。
生体高分子の構造予測における機械学習技術の応用について検討した。
論文 参考訳(メタデータ) (2024-04-14T08:36:14Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - From Large Language Models to Knowledge Graphs for Biomarker Discovery
in Cancer [0.9437165725355702]
人工知能(AI)の難しいシナリオは、バイオメディカルデータを使用して、がんの病態の診断と治療のレコメンデーションを提供することである。
大規模知識グラフ(KG)は、意味的相互関連エンティティや関係に関する事実の統合と抽出によって構築することができる。
本稿では,癌特異的バイオマーカー発見と対話型QAを活用するドメインKGを開発する。
論文 参考訳(メタデータ) (2023-10-12T14:36:13Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Knowledge from Large-Scale Protein Contact Prediction Models Can Be
Transferred to the Data-Scarce RNA Contact Prediction Task [40.051834115537474]
タンパク質共進化トランスフォーマーに基づくディープニューラルネットワークはRNA接触予測タスクに転送可能である。
実験により、転写学習によるRNA接触予測が大幅に改善されることが確認された。
以上の結果から, タンパク質の構造パターンはRNAに転移し, 新たな研究の道を開く可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-13T06:00:56Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - BASiNETEntropy: an alignment-free method for classification of
biological sequences through complex networks and entropy maximization [0.0]
本研究は, 複雑なネットワークとエントロピーによる生物配列の分類法を提案する。
最大エントロピー原理は、RNAクラスに関する最も情報性の高いエッジを同定し、フィルターされた複雑なネットワークを生成するために提案される。
提案手法は13種の異なるRNAクラスの分類において評価された。
論文 参考訳(メタデータ) (2022-03-24T14:19:43Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Neural representation and generation for RNA secondary structures [14.583976833366384]
我々の研究は、遺伝子マクロ分子の一種であるRNAの生成とターゲット設計に関するものである。
大規模で複雑な生物学的構造の設計は、専用のグラフベースの深層生成モデリング技術を刺激する。
本稿では,異なるRNA構造を結合して生成するフレキシブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-01T15:49:25Z) - Uncovering the Folding Landscape of RNA Secondary Structure with Deep
Graph Embeddings [71.20283285671461]
このようなグラフ埋め込みを学習するための幾何散乱オートエンコーダ(GSAE)ネットワークを提案する。
我々の埋め込みネットワークは、最近提案された幾何散乱変換を用いて、まずリッチグラフ特徴を抽出する。
GSAEは、構造とエネルギーの両方でRNAグラフを整理し、ビスタブルRNA構造を正確に反映していることを示す。
論文 参考訳(メタデータ) (2020-06-12T00:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。