論文の概要: A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction
- arxiv url: http://arxiv.org/abs/2203.12659v1
- Date: Wed, 23 Mar 2022 18:27:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 15:28:57.586705
- Title: A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction
- Title(参考訳): シーケンスベースタンパク質間相互作用(PPI)予測のための機械学習手法
- Authors: Soumyadeep Debnath and Ayatullah Faruk Mollah
- Abstract要約: 計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
- 参考スコア(独自算出の注目度): 4.916874464940376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computational protein-protein interaction (PPI) prediction techniques can
contribute greatly in reducing time, cost and false-positive interactions
compared to experimental approaches. Sequence is one of the key and primary
information of proteins that plays a crucial role in PPI prediction. Several
machine learning approaches have been applied to exploit the characteristics of
PPI datasets. However, these datasets greatly influence the performance of
predicting models. So, care should be taken on both dataset curation as well as
design of predictive models. Here, we have described our submitted solution
with the results of the SeqPIP competition whose objective was to develop
comprehensive PPI predictive models from sequence information with high-quality
bias-free interaction datasets. A training set of 2000 positive and 2000
negative interactions with sequences was given to us. Our method was evaluated
with three independent high-quality interaction test datasets and with other
competitors solutions.
- Abstract(参考訳): 計算タンパク質間相互作用(PPI)予測技術は, 実験手法と比較して時間, コスト, 偽陽性相互作用の低減に大きく寄与する。
配列は、PPI予測において重要な役割を果たすタンパク質の鍵および一次情報の一つである。
PPIデータセットの特徴を利用するために、いくつかの機械学習アプローチが適用されている。
しかし、これらのデータセットは予測モデルの性能に大きな影響を及ぼす。
したがって、データセットのキュレーションと予測モデルの設計の両方に注意する必要がある。
そこで本研究では,高品質なバイアスフリーインタラクションデータセットを用いたシーケンス情報に基づく包括的ppi予測モデルの開発を目的としたseqpipコンペティションの結果について述べる。
2000の正と負の相互作用のトレーニングセットを我々に与えた。
本手法は,3つの独立した高品質インタラクションテストデータセットと,他の競合ソリューションを用いて評価した。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Measuring and Improving Attentiveness to Partial Inputs with
Counterfactuals [95.5442607785241]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - SemiGNN-PPI: Self-Ensembling Multi-Graph Neural Network for Efficient
and Generalizable Protein-Protein Interaction Prediction [16.203794286288815]
タンパク質とタンパク質の相互作用(PPI)は様々な生物学的プロセスにおいて重要であり、その研究は薬物開発や疾患の診断に重要な意味を持つ。
既存のディープラーニング手法は、複雑な実世界のシナリオ下での大幅なパフォーマンス劣化に悩まされる。
本稿では,PPIの効率と一般化性を両立させつつ,PPIを効果的に予測できる自己認識型マルチグラフニューラルネットワーク(SemiGNN-PPI)を提案する。
論文 参考訳(メタデータ) (2023-05-15T03:06:44Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Insights into performance evaluation of com-pound-protein interaction
prediction methods [0.0]
複合タンパク質相互作用(CPI)の機械学習による予測は、薬物設計、スクリーニング、再資源化研究において重要である。
我々は、モデル性能の楽観的な推定に繋がる実験設計において、多くの基本的な問題を観察してきた。
論文 参考訳(メタデータ) (2022-01-28T20:07:19Z) - Learning Unknown from Correlations: Graph Neural Network for
Inter-novel-protein Interaction Prediction [7.860159889216291]
既存のメソッドは、見えないデータセットでテストすると、パフォーマンスが大幅に低下します。
本稿では,タンパク質間相互作用予測のためのグラフニューラルネットワーク(GNN-PPI)を提案する。
論文 参考訳(メタデータ) (2021-05-14T08:42:55Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - HINT: Hierarchical Interaction Network for Trial Outcome Prediction
Leveraging Web Data [56.53715632642495]
臨床試験は、有効性、安全性、または患者採用の問題により、不確実な結果に直面する。
本稿では,より一般的な臨床試験結果予測のための階層型Interaction Network(HINT)を提案する。
論文 参考訳(メタデータ) (2021-02-08T15:09:07Z) - Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction [3.499870393443268]
ディープラーニングのアプローチは、人間による試行錯誤なしに薬物とタンパク質の相互作用を予測できる。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
論文 参考訳(メタデータ) (2020-12-15T10:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。