論文の概要: Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction
- arxiv url: http://arxiv.org/abs/2012.08194v2
- Date: Mon, 21 Dec 2020 14:47:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 07:38:43.451006
- Title: Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction
- Title(参考訳): プリトレーニングタンパク質埋め込みを用いたベイジアンニューラルネットワークは、薬物-タンパク質相互作用の予測精度を高める
- Authors: QHwan Kim, Joon-Hyuk Ko, Sunghoon Kim, Nojun Park, Wonho Jhe
- Abstract要約: ディープラーニングのアプローチは、人間による試行錯誤なしに薬物とタンパク質の相互作用を予測できる。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
- 参考スコア(独自算出の注目度): 3.499870393443268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The characterization of drug-protein interactions is crucial in the
high-throughput screening for drug discovery. The deep learning-based
approaches have attracted attention because they can predict drug-protein
interactions without trial-and-error by humans. However, because data labeling
requires significant resources, the available protein data size is relatively
small, which consequently decreases model performance. Here we propose two
methods to construct a deep learning framework that exhibits superior
performance with a small labeled dataset. At first, we use transfer learning in
encoding protein sequences with a pretrained model, which trains general
sequence representations in an unsupervised manner. Second, we use a Bayesian
neural network to make a robust model by estimating the data uncertainty. As a
result, our model performs better than the previous baselines for predicting
drug-protein interactions. We also show that the quantified uncertainty from
the Bayesian inference is related to the confidence and can be used for
screening DPI data points.
- Abstract(参考訳): 薬物とタンパク質の相互作用のキャラクタリゼーションは、薬物発見のための高スループットスクリーニングにおいて重要である。
深層学習に基づくアプローチは、人間が試行錯誤することなく薬物とタンパク質の相互作用を予測できるため、注目を集めている。
しかし、データラベリングは重要なリソースを必要とするため、利用可能なタンパク質データのサイズは比較的小さく、結果としてモデルの性能が低下する。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
まず,タンパク質配列を事前訓練したモデルで符号化するトランスファーラーニングを用いて,汎用配列表現を教師なしで訓練する。
次に,ベイズ型ニューラルネットワークを用いて,データ不確かさを推定することでロバストなモデルを構築する。
その結果,本モデルでは,従来の基準値よりも,薬物とタンパク質の相互作用を予測できる性能が向上した。
また,ベイズ推定の量的不確実性は信頼度と相関し,DPIデータポイントのスクリーニングに使用できることを示す。
関連論文リスト
- ProtIR: Iterative Refinement between Retrievers and Predictors for
Protein Function Annotation [38.019425619750265]
本稿では,タンパク質間類似性モデリングを取り入れた関数予測器の改良を目的とした,新しい変分擬似類似性フレームワークProtIRを提案する。
ProtIRは、バニラ予測に基づく手法よりも約10%改善されている。
タンパク質言語モデルに基づく手法と同等の性能を発揮するが、大規模な事前学習は必要としない。
論文 参考訳(メタデータ) (2024-02-10T17:31:46Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - DeepGATGO: A Hierarchical Pretraining-Based Graph-Attention Model for
Automatic Protein Function Prediction [4.608328575930055]
自動タンパク質機能予測(AFP)は大規模多ラベル分類問題に分類される。
現在、一般的な手法は主にタンパク質関連情報と遺伝子オントロジー(GO)の用語を組み合わせて、最終的な機能予測を生成する。
本稿では,タンパク質配列とGO項ラベルを階層的に処理するシークエンスベースの階層予測手法であるDeepGATGOを提案する。
論文 参考訳(メタデータ) (2023-07-24T07:01:32Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Reprogramming Pretrained Language Models for Protein Sequence
Representation Learning [68.75392232599654]
エンドツーエンドの表現学習フレームワークである辞書学習(R2DL)による表現学習を提案する。
R2DLは、タンパク質配列の埋め込みを学ぶために、事前訓練された英語モデルを再プログラムする。
我々のモデルは,事前訓練および標準教師付き手法によって設定されたベースラインに対して,最大105ドルの精度でデータ効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-05T15:55:18Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - A new framework for experimental design using Bayesian Evidential
Learning: the case of wellhead protection area [0.0]
我々は、少数の追跡実験(予測器)から、油圧導電率(K)の分布に影響を及ぼすウェルヘッド保護領域(WHPA)の形状と範囲を予測した。
最初の目標は、マシンラーニングを使用して予測者とターゲット間の直接的な関係を見つけることを目的とした、ベイズ式Evidential Learningフレームワーク内のWHPAの予測を行うことです。
第2の目的は、whpaの後方の不確かさを最小限に抑えるデータソースロケーションの最適設計をベルに拡張することである。
論文 参考訳(メタデータ) (2021-05-12T09:40:28Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - GEFA: Early Fusion Approach in Drug-Target Affinity Prediction [28.695523040015164]
本稿では,結合効果により対象表現の変化に対処するアテンション機構を備えた新しいグラフイングラフニューラルネットワークを提案する。
薬物は原子のグラフとしてモデル化され、残基-ドラッグ複合体の大きなグラフのノードとして機能する。
また、文脈化されたタンパク質表現を学習する最近の取り組みにより、事前訓練されたタンパク質表現を使用する。
論文 参考訳(メタデータ) (2020-09-25T11:54:15Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。