論文の概要: A multitask transfer learning framework for the prediction of
virus-human protein-protein interactions
- arxiv url: http://arxiv.org/abs/2111.13346v1
- Date: Fri, 26 Nov 2021 07:53:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 23:19:12.904754
- Title: A multitask transfer learning framework for the prediction of
virus-human protein-protein interactions
- Title(参考訳): ウイルス-ヒト蛋白質間相互作用の予測のためのマルチタスク伝達学習フレームワーク
- Authors: Thi Ngan Dong, Graham Brogden, Gisa Gerold, Megha Khosla
- Abstract要約: 我々は、約2400万のタンパク質配列の情報と、ヒトの相互作用系からの相互作用パターンを利用する転写学習手法を開発した。
我々は、ヒトタンパク質とタンパク質の相互作用を観測する確率を最大化することを目的とした追加の目的を用いる。
実験結果から,本モデルがウイルス-ヒト-ヒト-ヒト-タンパク質相互作用予測タスクに有効であることが示された。
- 参考スコア(独自算出の注目度): 0.30586855806896046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Viral infections are causing significant morbidity and mortality worldwide.
Understanding the interaction patterns between a particular virus and human
proteins plays a crucial role in unveiling the underlying mechanism of viral
infection and pathogenesis. This could further help in the prevention and
treatment of virus-related diseases. However, the task of predicting
protein-protein interactions between a new virus and human cells is extremely
challenging due to scarce data on virus-human interactions and fast mutation
rates of most viruses.
We developed a multitask transfer learning approach that exploits the
information of around 24 million protein sequences and the interaction patterns
from the human interactome to counter the problem of small training datasets.
Instead of using hand-crafted protein features, we utilize statistically rich
protein representations learned by a deep language modeling approach from a
massive source of protein sequences. Additionally, we employ an additional
objective which aims to maximize the probability of observing human
protein-protein interactions. This additional task objective acts as a
regularizer and also allows to incorporate domain knowledge to inform the
virus-human protein-protein interaction prediction model.
Our approach achieved competitive results on 13 benchmark datasets and the
case study for the SAR-CoV-2 virus receptor. Experimental results show that our
proposed model works effectively for both virus-human and bacteria-human
protein-protein interaction prediction tasks. We share our code for
reproducibility and future research at
https://git.l3s.uni-hannover.de/dong/multitask-transfer.
- Abstract(参考訳): ウイルス感染は世界中で重大な死亡と死亡を引き起こしている。
特定のウイルスとヒトのタンパク質の相互作用パターンを理解することは、ウイルス感染と病原性のメカニズムを明らかにする上で重要な役割を果たす。
これはウイルス関連疾患の予防と治療にさらに役立つ可能性がある。
しかし、ウイルスとヒトの細胞の間のタンパク質とタンパク質の相互作用を予測することは、ウイルスとヒトの相互作用に関するデータが少なく、ほとんどのウイルスの変異率も速いため、非常に困難である。
本研究では,約2400万のタンパク質配列情報と,ヒトのインタラクションームからのインタラクションパターンを活用し,小規模のトレーニングデータセットの問題を解決するマルチタスク転送学習手法を開発した。
手作りのタンパク質の特徴を使う代わりに、タンパク質配列の膨大な源から深層言語モデリングアプローチで学習した統計的に豊かなタンパク質表現を利用する。
また,ヒトタンパク質とタンパク質の相互作用を観察する確率を最大化するための新たな目的も採用している。
この追加のタスク目標は、レギュレータとして機能し、ウイルス-ヒトタンパク質-タンパク質相互作用予測モデルにドメイン知識を組み込むことができる。
提案手法は,13のベンチマークデータセットとSAR-CoV-2ウイルス受容体のケーススタディで競合した結果を得た。
実験の結果,提案モデルは,ウイルス-ヒト-細菌-ヒト-タンパク質相互作用予測タスクにおいて効果的に機能することが示された。
再現性と今後の研究のコードはhttps://git.l3s.uni-hannover.de/dong/multitask-transfer.comで公開しています。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - Multi-channel neural networks for predicting influenza A virus hosts and
antigenic types [3.1981440103815717]
インフルエンザウイルスの宿主とサブタイプを予測するための高速で正確で低コストな手法は、ウイルスの感染を減らし、資源の乏しい地域に利益をもたらす。
本稿では,A型インフルエンザウイルスの抗原型と宿主を完全かつ部分的なタンパク質配列で予測するマルチチャネルニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T11:47:31Z) - Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks [8.397189036839956]
本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
本稿では, タンパク質配列を疎水性指数を用いて数値信号に符号化し, その後, 畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
論文 参考訳(メタデータ) (2021-08-09T10:42:26Z) - Deep Contextual Learners for Protein Networks [16.599890339599586]
本稿では,タンパク質の埋め込みに細胞および組織コンテキストを注入するグラフニューラルメッセージパッシングアプローチであるAWAREを紹介する。
AWAREは、タンパク質、細胞型、組織埋め込みを学習し、細胞型と組織階層を保持する。
AWAREは、遺伝子が疾患に関連付けられているか、そして人体に最も出現する可能性が最も高いかを予測するための新しい課題について実証する。
論文 参考訳(メタデータ) (2021-06-04T04:26:27Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z) - Computational modeling of Human-nCoV protein-protein interaction network [17.875102234550305]
新型コロナウイルスは、2020年に死亡率と死亡率の高い世界的なパンデミックを生み出した。
ICTVは、nCoVは2003年のSARS-CoV流行と非常によく似ていると宣言している。
論文 参考訳(メタデータ) (2020-05-05T04:16:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。