論文の概要: Enzyme promiscuity prediction using hierarchy-informed multi-label
classification
- arxiv url: http://arxiv.org/abs/2002.07327v2
- Date: Tue, 26 Jan 2021 03:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:46:52.199497
- Title: Enzyme promiscuity prediction using hierarchy-informed multi-label
classification
- Title(参考訳): 階層型マルチラベル分類を用いた酵素プロミスキュリティ予測
- Authors: Gian Marco Visani, Michael C. Hughes, Soha Hassoun
- Abstract要約: 本稿では,983個の異なる酵素が問合せ分子と相互作用しうるかを予測するための機械学習モデルを提案し,評価する。
いくつかの相互作用は自然選択に起因し、酵素の天然基質を含む。
しかし、相互作用の大部分は非天然基質を含んでおり、プロミスキュラスな酵素活性を反映している。
- 参考スコア(独自算出の注目度): 6.6828647808002595
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As experimental efforts are costly and time consuming, computational
characterization of enzyme capabilities is an attractive alternative. We
present and evaluate several machine-learning models to predict which of 983
distinct enzymes, as defined via the Enzyme Commission, EC, numbers, are likely
to interact with a given query molecule. Our data consists of enzyme-substrate
interactions from the BRENDA database. Some interactions are attributed to
natural selection and involve the enzyme's natural substrates. The majority of
the interactions however involve non-natural substrates, thus reflecting
promiscuous enzymatic activities. We frame this enzyme promiscuity prediction
problem as a multi-label classification task. We maximally utilize inhibitor
and unlabelled data to train prediction models that can take advantage of known
hierarchical relationships between enzyme classes. We report that a
hierarchical multi-label neural network, EPP-HMCNF, is the best model for
solving this problem, outperforming k-nearest neighbors similarity-based and
other machine learning models. We show that inhibitor information during
training consistently improves predictive power, particularly for EPP-HMCNF. We
also show that all promiscuity prediction models perform worse under a
realistic data split when compared to a random data split, and when evaluating
performance on non-natural substrates compared to natural substrates. We
provide Python code for EPP-HMCNF and other models in a repository termed EPP
(Enzyme Promiscuity Prediction) at https://github.com/hassounlab/EPP.
- Abstract(参考訳): 実験はコストと時間を要するため、酵素の能力の計算的特徴は魅力的な代替手段である。
本稿では,酵素委員会(EC)によって定義された973個の異なる酵素が,与えられたクエリ分子と相互作用する可能性が高いかを予測するための機械学習モデルを提示し,評価する。
我々のデータはBRENDAデータベースからの酵素-基質相互作用からなる。
いくつかの相互作用は自然選択に起因し、酵素の天然基質を含む。
しかし、ほとんどの相互作用は非天然基質を含んでおり、それゆえ酵素活性を反映している。
この酵素プロミスキュイティ予測問題をマルチラベル分類タスクとして構成する。
我々は酵素クラス間の既知の階層的関係を生かした予測モデルを学習するために,阻害剤と非標識データを最大限活用する。
我々は,階層型マルチラベルニューラルネットワークであるEPP-HMCNFが,k-nearest近傍の類似性に基づくその他の機械学習モデルよりも優れていることを報告した。
トレーニング中のインヒビター情報は予測力、特にEPP-HMCNFに対して一貫して改善することを示す。
また,全ての確率予測モデルは,ランダムなデータ分割よりも現実的なデータ分割や,自然基質と比較して非自然基質の性能を評価する場合に,より悪い結果を示す。
我々は EPP (Enzyme Promiscuity Prediction) と呼ばれるリポジトリで EPP-HMCNF や他のモデル向けに Python コードを提供しています。
関連論文リスト
- Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information [5.456047952635665]
本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
論文 参考訳(メタデータ) (2024-03-08T01:43:21Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - Machine learning modeling of family wide enzyme-substrate specificity
screens [2.276367922551686]
バイオ触媒は、医薬品、複雑な天然物、商品化学物質を大規模に合成するための有望なアプローチである。
生体触媒の導入は、非天然基質上での化学的変換を触媒する酵素の選択能力によって制限される。
論文 参考訳(メタデータ) (2021-09-08T19:44:42Z) - DebiasedDTA: Model Debiasing to Boost Drug -- Target Affinity Prediction [0.10499611180329804]
DebiasedDTAは、新しい生体分子の親和性予測を促進するために、データセットバイアスを回避する最初のモデル脱バイアス手法である。
以上の結果から,DebiasedDTAは新規生体分子間の相互作用を予測しながらモデルを向上させることができることがわかった。
実験により、DebiasedDTAは異なる入力構造とモデル構造のDTA予測モデルを増大させることができることが示された。
論文 参考訳(メタデータ) (2021-07-04T19:21:37Z) - Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction [3.499870393443268]
ディープラーニングのアプローチは、人間による試行錯誤なしに薬物とタンパク質の相互作用を予測できる。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
論文 参考訳(メタデータ) (2020-12-15T10:24:34Z) - Towards Discriminability and Diversity: Batch Nuclear-norm Maximization
under Label Insufficient Situations [154.51144248210338]
Batch Nuclear-norm Maximization (BNM) は、学習シナリオのラベルが不十分な場合の学習を促進するために提案されている。
BNMはライバルより優れており、既存のよく知られた手法でうまく機能する。
論文 参考訳(メタデータ) (2020-03-27T05:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。