論文の概要: Bio-JOIE: Joint Representation Learning of Biological Knowledge Bases
- arxiv url: http://arxiv.org/abs/2103.04283v1
- Date: Sun, 7 Mar 2021 07:06:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:07:51.760236
- Title: Bio-JOIE: Joint Representation Learning of Biological Knowledge Bases
- Title(参考訳): Bio-JOIE:生物知識基盤の共同表現学習
- Authors: Junheng Hao, Chelsea Ju, Muhao Chen, Yizhou Sun, Carlo Zaniolo, Wei
Wang
- Abstract要約: バイオジョイは、sars-cov-2タンパク質とヒトタンパク質のppisを正確に同定できる。
構造化知識のみを活用することにより、Bio-JOIEはPPI型予測において、既存の最先端の手法よりも著しく優れている。
- 参考スコア(独自算出の注目度): 38.9571812880758
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The widespread of Coronavirus has led to a worldwide pandemic with a high
mortality rate. Currently, the knowledge accumulated from different studies
about this virus is very limited. Leveraging a wide-range of biological
knowledge, such as gene ontology and protein-protein interaction (PPI) networks
from other closely related species presents a vital approach to infer the
molecular impact of a new species. In this paper, we propose the transferred
multi-relational embedding model Bio-JOIE to capture the knowledge of gene
ontology and PPI networks, which demonstrates superb capability in modeling the
SARS-CoV-2-human protein interactions. Bio-JOIE jointly trains two model
components. The knowledge model encodes the relational facts from the protein
and GO domains into separated embedding spaces, using a hierarchy-aware
encoding technique employed for the GO terms. On top of that, the transfer
model learns a non-linear transformation to transfer the knowledge of PPIs and
gene ontology annotations across their embedding spaces. By leveraging only
structured knowledge, Bio-JOIE significantly outperforms existing
state-of-the-art methods in PPI type prediction on multiple species.
Furthermore, we also demonstrate the potential of leveraging the learned
representations on clustering proteins with enzymatic function into enzyme
commission families. Finally, we show that Bio-JOIE can accurately identify
PPIs between the SARS-CoV-2 proteins and human proteins, providing valuable
insights for advancing research on this new disease.
- Abstract(参考訳): コロナウイルスの流行は世界的なパンデミックを引き起こし、死亡率は高い。
現在、このウイルスに関するさまざまな研究から得られた知識は非常に限られている。
他の近縁種の遺伝子オントロジーやタンパク質-タンパク質相互作用(PPI)ネットワークなどの幅広い生物学的知識を活用して、新しい種の分子影響を推定する重要なアプローチを提示します。
本稿では,遺伝子オントロジーとppiネットワークの知識を捉え,sars-cov-2-ヒトタンパク質相互作用のモデル化における超能力を示す,トランスファーマルチリレーショナル組込みモデルbio-joieを提案する。
Bio-JOIEは2つのモデルコンポーネントを共同でトレーニングする。
知識モデルは、GO用語に用いられる階層認識符号化技術を用いて、タンパク質とGOドメインの関連事実を分離埋め込み空間にエンコードする。
さらに、トランスファーモデルは、PPIの知識と遺伝子オントロジーアノテーションを埋め込み空間全体に転送するための非線形変換を学習する。
構造化知識のみを活用することにより、Bio-JOIEはPPI型予測において、既存の最先端の手法よりも著しく優れている。
さらに,酵素活性を有するタンパク質群における学習表現を酵素系に活用する可能性を実証した。
最後に,Bio-JOIEはSARS-CoV-2タンパク質とヒトタンパク質のPPIを正確に同定し,本疾患の研究を進める上で貴重な知見を提供する。
関連論文リスト
- BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [116.43369600518163]
我々は,新たな実験を設計し,その成果の理由を判断し,仮説空間を効率的にナビゲートし,望ましい解を得るエージェントであるBioDiscoveryAgentを開発した。
BioDiscoveryAgentは、機械学習モデルをトレーニングしたり、取得関数を明示的に設計することなく、新しい実験を独自に設計することができる。
5つのデータセットで所望の表現型を検出することで平均18%の改善を実現している。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Bridging Phylogeny and Taxonomy with Protein-protein Interaction
Networks [0.0]
タンパク質-タンパク質相互作用(PPI)ネットワークは、生物の代謝と生存に不可欠な複雑な生物学的反応の概要を提供する。
我々は,PPIネットワークから情報を収集することで,生命樹・分類学の理解を深めることを目指している。
論文 参考訳(メタデータ) (2023-10-26T05:32:33Z) - Two Novel Approaches to Detect Community: A Case Study of Omicron
Lineage Variants PPI Network [0.5156484100374058]
我々は,2つの新しいアルゴリズムと4つの広く認識されているアルゴリズムを用いて,変異型B.1.1.529(Omicron virus)のコミュニティを明らかにすることを目指している。
また,ネットワークをグローバルな特性,統計概要,グラフ数,グラフレット,モジュール性による検証などによって比較する。
論文 参考訳(メタデータ) (2023-08-09T03:51:20Z) - Knowledge Graph Completion based on Tensor Decomposition for Disease
Gene Prediction [2.838553480267889]
疾患や遺伝子を中心とした生物学的知識グラフを構築し,疾患発生予測のためのエンドツーエンドの知識グラフ補完モデルを構築した。
KDGeneは、実体の埋め込みとテンソル分解との関係の間の相互作用モジュールを導入し、生物学的知識における情報相互作用を効果的に強化する。
論文 参考訳(メタデータ) (2023-02-18T13:57:44Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Heterogeneous Graph based Deep Learning for Biomedical Network Link
Prediction [7.628651624423363]
バイオメディカルネットワークリンクを予測するためのグラフペアベースのリンク予測モデル(GPLP)を提案する。
InPでは、既知のネットワーク相互作用行列から抽出された1ホップのサブグラフを学習し、欠落リンクを予測する。
本手法は他のバイオメディカルネットワークにおける潜在的な応用を実証する。
論文 参考訳(メタデータ) (2021-01-28T07:35:29Z) - A Cross-Level Information Transmission Network for Predicting Phenotype
from New Genotype: Application to Cancer Precision Medicine [37.442717660492384]
本稿では,CLEIT(Cross-Level Information Transmission Network)フレームワークを提案する。
ドメイン適応にインスパイアされたCLEITは、まずハイレベルドメインの潜在表現を学び、その後、接地木埋め込みとして利用する。
体細胞突然変異による抗がん剤感受性の予測におけるCLEITの有効性と性能の向上を示す。
論文 参考訳(メタデータ) (2020-10-09T22:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。