論文の概要: Adaptive Residue-wise Profile Fusion for Low Homologous Protein
SecondaryStructure Prediction Using External Knowledge
- arxiv url: http://arxiv.org/abs/2108.04176v1
- Date: Thu, 5 Aug 2021 08:31:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 09:11:36.999371
- Title: Adaptive Residue-wise Profile Fusion for Low Homologous Protein
SecondaryStructure Prediction Using External Knowledge
- Title(参考訳): 外部知識を用いた低相同タンパク質二次構造予測のための適応的残基方向プロファイル融合
- Authors: Qin Wang, Jun Wei, Boyuan Wang, Zhen Li1, Sheng Wang, Shuguang Cu
- Abstract要約: 本研究は,PSSPが低い場合の自己管理的知識を,残像融合の指導の下でインポートする。
本研究は,新たな自己監督型BERT特徴を疑似プロファイルとして紹介する。
異なる特徴を適応的に融合させるために、新しい残余注意が特別に設計されている。
- 参考スコア(独自算出の注目度): 6.179020799890733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein secondary structure prediction (PSSP) is essential for protein
function analysis. However, for low homologous proteins, the PSSP suffers from
insufficient input features. In this paper, we explicitly import external
self-supervised knowledge for low homologous PSSP under the guidance of
residue-wise profile fusion. In practice, we firstly demonstrate the
superiority of profile over Position-Specific Scoring Matrix (PSSM) for low
homologous PSSP. Based on this observation, we introduce the novel
self-supervised BERT features as the pseudo profile, which implicitly involves
the residue distribution in all native discovered sequences as the
complementary features. Further-more, a novel residue-wise attention is
specially designed to adaptively fuse different features (i.e.,original
low-quality profile, BERT based pseudo profile), which not only takes full
advantage of each feature but also avoids noise disturbance. Be-sides, the
feature consistency loss is proposed to accelerate the model learning from
multiple semantic levels. Extensive experiments confirm that our method
outperforms state-of-the-arts (i.e.,4.7%forextremely low homologous cases on
BC40 dataset).
- Abstract(参考訳): タンパク質二次構造予測(PSSP)はタンパク質の機能解析に必須である。
しかし、低相同性タンパク質では、PSSPは入力特性が不十分である。
本稿では,残差分布融合の指導の下で,低相同性PSSPのための外部自己教師型知識を明示的にインポートする。
まず,低相同性psspに対する位置特異的スコアリングマトリクス(pssm)よりもプロファイルが優れていることを示す。
そこで本研究では,新たな自己教師型BERT特徴を擬似プロファイルとして紹介する。
さらに、新しい残余的注意は、それぞれの特徴を最大限に活用するだけでなく、ノイズの乱れを避けるために、適応的に異なる特徴(すなわち、元々の低品質プロファイル、bertベースの擬似プロファイル)を融合するように特別に設計されている。
逆に、複数の意味レベルからモデル学習を加速するために、機能一貫性の損失が提案されている。
広範な実験により,本手法が最先端(すなわち,bc40データセット上の極めて低いホモログの場合)よりも優れていることが確認された。
関連論文リスト
- Peptide-GPT: Generative Design of Peptides using Generative Pre-trained Transformers and Bio-informatic Supervision [7.275932354889042]
異なる性質を持つタンパク質配列を生成するのに適したタンパク質言語モデルを導入する。
生成した配列をそれらの難易度スコアに基づいてランク付けし、タンパク質の許容凸殻の外にある配列をフィルタリングする。
溶血率76.26%, 非溶血率72.46%, 非溶血率78.84%, 溶血率68.06%であった。
論文 参考訳(メタデータ) (2024-10-25T00:15:39Z) - Position Specific Scoring Is All You Need? Revisiting Protein Sequence Classification Tasks [41.7345616221048]
タンパク質配列のPSS表現と文字列カーネルの概念を組み合わせた重み付きPSSカーネル行列(W-PSSKM)を提案する。
この結果、タンパク質配列分類の他の多くのアプローチよりも優れた新しいカーネル関数がもたらされる。
論文 参考訳(メタデータ) (2024-10-16T15:16:50Z) - MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training [48.398329286769304]
マルチシークエンスアライメント(MSA)は、タンパク質ファミリーの進化的軌道を明らかにする上で重要な役割を担っている。
MSAGPTは、低MSA状態下でのMSA生成前訓練を通じてタンパク質構造予測を促進する新しいアプローチである。
論文 参考訳(メタデータ) (2024-06-08T04:23:57Z) - Don't Miss Out on Novelty: Importance of Novel Features for Deep Anomaly
Detection [64.21963650519312]
異常検出(AD)は、正規性の学習モデルに適合しない観察を識別する重要なタスクである。
本稿では, 入力空間における説明不能な観測として, 説明可能性を用いた新しいAD手法を提案する。
当社のアプローチでは,複数のベンチマークにまたがる新たな最先端性を確立し,さまざまな異常な型を扱う。
論文 参考訳(メタデータ) (2023-10-01T21:24:05Z) - Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.630603355510324]
そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文 参考訳(メタデータ) (2022-08-20T10:23:17Z) - Sample-Efficient Optimisation with Probabilistic Transformer Surrogates [66.98962321504085]
本稿では,ベイズ最適化における最先端確率変換器の適用可能性について検討する。
トレーニング手順と損失定義から生じる2つの欠点を観察し、ブラックボックス最適化のプロキシとして直接デプロイすることを妨げる。
1)非一様分散点を前処理するBO調整トレーニング,2)予測性能を向上させるために最適な定常点をフィルタする新しい近似後正則整定器トレードオフ精度と入力感度を導入する。
論文 参考訳(メタデータ) (2022-05-27T11:13:17Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Spectral Tensor Train Parameterization of Deep Learning Layers [136.4761580842396]
重み行列の低ランクパラメータ化をDeep Learningコンテキストに埋め込まれたスペクトル特性を用いて検討する。
分類設定におけるニューラルネットワーク圧縮の効果と,生成的対角トレーニング設定における圧縮および安定性トレーニングの改善について述べる。
論文 参考訳(メタデータ) (2021-03-07T00:15:44Z) - Retrieval of aboveground crop nitrogen content with a hybrid machine
learning method [5.6740282691255075]
ハイパースペクトル取得は、窒素(N)含有量を推定するための最も有益な地球観測データソースであることが証明されています。
過去には、この生化学植物成分に関する情報をキャノピー反射から得るために、経験的アルゴリズムが広く用いられてきた。
本研究では,物理ベースアプローチと機械学習回帰を組み合わせ,作物N含有量を推定するハイブリッド検索手法を提案する。
論文 参考訳(メタデータ) (2020-12-07T13:06:59Z) - NP-PROV: Neural Processes with Position-Relevant-Only Variances [113.20013269514327]
位置関連性オンリーバリアース(NP-PROV)を有するニューラルプロセスと呼ばれる新しいメンバーを提案する。
NP-PROVは、その位置の関数値に関係なく、コンテキストポイントに近いターゲットポイントが小さな不確実性を持つという仮説を立てている。
我々は, NP-PROVが有界分散を維持しつつ, 最先端の可能性を実現することができることを示す。
論文 参考訳(メタデータ) (2020-06-15T06:11:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。