論文の概要: Interpretable Enzyme Function Prediction via Residue-Level Detection
- arxiv url: http://arxiv.org/abs/2501.05644v1
- Date: Fri, 10 Jan 2025 01:02:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:26:25.724761
- Title: Interpretable Enzyme Function Prediction via Residue-Level Detection
- Title(参考訳): 残響レベル検出による解釈可能な酵素機能予測
- Authors: Zhao Yang, Bing Su, Jiahao Chen, Ji-Rong Wen,
- Abstract要約: 本稿では,酵素機能予測のための注意に基づくフレームワークであるProtDETRを提案する。
学習可能な関数クエリのセットを使用して、残差レベルの一連の特徴から異なるローカル表現を適応的に抽出する。
ProtDETRは、既存のディープラーニングベースの酵素機能予測法よりも大幅に優れている。
- 参考スコア(独自算出の注目度): 58.30647671797602
- License:
- Abstract: Predicting multiple functions labeled with Enzyme Commission (EC) numbers from the enzyme sequence is of great significance but remains a challenge due to its sparse multi-label classification nature, i.e., each enzyme is typically associated with only a few labels out of more than 6000 possible EC numbers. However, existing machine learning algorithms generally learn a fixed global representation for each enzyme to classify all functions, thereby they lack interpretability and the fine-grained information of some function-specific local residue fragments may be overwhelmed. Here we present an attention-based framework, namely ProtDETR (Protein Detection Transformer), by casting enzyme function prediction as a detection problem. It uses a set of learnable functional queries to adaptatively extract different local representations from the sequence of residue-level features for predicting different EC numbers. ProtDETR not only significantly outperforms existing deep learning-based enzyme function prediction methods, but also provides a new interpretable perspective on automatically detecting different local regions for identifying different functions through cross-attentions between queries and residue-level features. Code is available at https://github.com/yangzhao1230/ProtDETR.
- Abstract(参考訳): 酵素配列から酵素委員会(EC)番号でラベル付けされた複数の関数を予測することは非常に重要であるが、その希少な多ラベル分類の性質、すなわち、それぞれの酵素は通常、6000以上のEC番号のうち数個のラベルにのみ関連付けられているため、依然として課題である。
しかし、既存の機械学習アルゴリズムは、一般的に、すべての関数を分類するために各酵素の固定されたグローバル表現を学習するので、解釈性が欠如し、関数固有の局所的な断片の微細な情報が圧倒される可能性がある。
本稿では,酵素機能予測を検出問題とする注目型フレームワークであるProtDETR(Protein Detection Transformer)を提案する。
学習可能な関数クエリのセットを使用して、異なるEC数値を予測するための残差レベルの機能のシーケンスから、異なるローカル表現を適応的に抽出する。
ProtDETRは、既存のディープラーニングベースの酵素関数予測法を著しく上回るだけでなく、クエリと残基レベルの特徴間の相互アテンションを通じて、異なる関数を識別するための異なるローカル領域を自動的に検出する新しい解釈可能な視点を提供する。
コードはhttps://github.com/yangzhao1230/ProtDETRで入手できる。
関連論文リスト
- Adversarial Learning for Feature Shift Detection and Correction [45.65548560695731]
機能シフトは、複数のセンサデータ、一部のセンサが機能不全である、あるいは構造化データ、欠陥のある標準化とデータ処理パイプラインが誤った機能につながる、など、多くのデータセットで起こりうる。
そこで本研究では,2つの分布を区別するために訓練された複数の識別器から得られる情報を用いて,破損した特徴を検知し,それらを修正することにより,データセット間の分布シフトを除去する。
論文 参考訳(メタデータ) (2023-12-07T18:58:40Z) - Improving Out-of-Distribution Robustness via Selective Augmentation [61.147630193060856]
機械学習アルゴリズムは、トレーニングとテスト例が同じ分布から引き出されると仮定する。
分散シフトは現実世界のアプリケーションでは一般的な問題であり、テスト時にモデルが劇的に悪化する可能性がある。
LISAと呼ばれる選択的な拡張によって不変関数を学習するミックスアップ方式を提案する。
論文 参考訳(メタデータ) (2022-01-02T05:58:33Z) - sigmoidF1: A Smooth F1 Score Surrogate Loss for Multilabel
Classification [42.37189502220329]
マルチラベル分類評価の複雑さを考慮した損失関数 sigmoidF1 を提案する。
SigmoidF1は4つのデータセットといくつかのメトリクスで他の損失関数よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-24T08:11:33Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Rethinking Generative Zero-Shot Learning: An Ensemble Learning
Perspective for Recognising Visual Patches [52.67723703088284]
我々はMPGAN(Multi-patch Generative Adversarial Nets)と呼ばれる新しいフレームワークを提案する。
MPGANは、新しい重み付き投票戦略で、ローカルパッチ機能とラベルが見えないクラスを合成する。
MPGANは最先端の手法よりもはるかに精度が高い。
論文 参考訳(メタデータ) (2020-07-27T05:49:44Z) - Differentiable Unsupervised Feature Selection based on a Gated Laplacian [7.970954821067042]
本稿では,低周波特徴を優先するラプラシアンスコアと,特徴選択のためのゲーティング機構を組み合わせた識別可能な損失関数を提案する。
我々は,提案手法を数学的に動機付け,高雑音条件下では,全特徴集合ではなく,ゲート入力上でラプラシアンを計算することが重要であることを示す。
論文 参考訳(メタデータ) (2020-07-09T11:58:16Z) - Self-training Avoids Using Spurious Features Under Domain Shift [54.794607791641745]
教師なし領域適応においては、条件付きエントロピー最小化と擬似ラベル処理は、既存の理論で解析されたものよりもドメインシフトがはるかに大きい場合であっても行われる。
ドメインシフトが大きくなる可能性のある特定の設定を特定・分析するが、特定のスパイラルな特徴はソースドメインのラベルと相関するが、ターゲットの独立なラベルである。
論文 参考訳(メタデータ) (2020-06-17T17:51:42Z) - Enzyme promiscuity prediction using hierarchy-informed multi-label
classification [6.6828647808002595]
本稿では,983個の異なる酵素が問合せ分子と相互作用しうるかを予測するための機械学習モデルを提案し,評価する。
いくつかの相互作用は自然選択に起因し、酵素の天然基質を含む。
しかし、相互作用の大部分は非天然基質を含んでおり、プロミスキュラスな酵素活性を反映している。
論文 参考訳(メタデータ) (2020-02-18T01:39:24Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。