論文の概要: Knowledge-Design: Pushing the Limit of Protein Design via Knowledge
Refinement
- arxiv url: http://arxiv.org/abs/2305.15151v4
- Date: Tue, 30 May 2023 02:52:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 11:41:52.290732
- Title: Knowledge-Design: Pushing the Limit of Protein Design via Knowledge
Refinement
- Title(参考訳): ナレッジデザイン:ナレッジリファインメントによるタンパク質設計の限界を押し上げる
- Authors: Zhangyang Gao, Cheng Tan, Stan Z. Li
- Abstract要約: 低品質残基を精製する知識認識モジュールを提案する。
また、トレーニング時間の50%以上を節約するメモリ検索機構も導入しました。
以上の結果から,我々の知識設計法は従来のPiFold法よりも約9%優れていた。
- 参考スコア(独自算出の注目度): 37.937378787812264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies have shown competitive performance in protein design that aims
to find the amino acid sequence folding into the desired structure. However,
most of them disregard the importance of predictive confidence, fail to cover
the vast protein space, and do not incorporate common protein knowledge. After
witnessing the great success of pretrained models on diverse protein-related
tasks and the fact that recovery is highly correlated with confidence, we
wonder whether this knowledge can push the limits of protein design further. As
a solution, we propose a knowledge-aware module that refines low-quality
residues. We also introduce a memory-retrieval mechanism to save more than 50\%
of the training time. We extensively evaluate our proposed method on the CATH,
TS50, and TS500 datasets and our results show that our Knowledge-Design method
outperforms the previous PiFold method by approximately 9\% on the CATH
dataset. Specifically, Knowledge-Design is the first method that achieves 60+\%
recovery on CATH, TS50 and TS500 benchmarks. We also provide additional
analysis to demonstrate the effectiveness of our proposed method. The code will
be publicly available.
- Abstract(参考訳): 近年の研究では、アミノ酸配列を所望の構造に折りたたむことを目的としたタンパク質設計における競合性が示されている。
しかし、その多くは予測信頼の重要性を無視し、広大なタンパク質空間をカバーできず、共通のタンパク質知識を取り入れていない。
タンパク質関連タスクにおける事前学習モデルの成功と、リカバリが信頼と非常に相関しているという事実を目撃した後、この知識がタンパク質設計の限界をさらに推し進めるかどうか疑問である。
そこで,我々は,低品質残基を洗練する知識認識モジュールを提案する。
また、トレーニング時間の50%以上を節約するメモリ検索機構も導入しました。
提案手法をCATH, TS50, TS500データセット上で広範囲に評価した結果, 知識設計法は従来のPiFold手法よりも約9倍高い性能を示した。
具体的には、知識設計はCATH、TS50、TS500ベンチマークで60%以上のリカバリを達成する最初の方法である。
また,提案手法の有効性を示すための追加分析を行った。
コードは公開される予定だ。
関連論文リスト
- Model-based reinforcement learning for protein backbone design [1.7383284836821535]
我々はAlphaZeroを用いてタンパク質のバックボーンを生成することを提案する。
既存のモンテカルロ木探索(MCTS)フレームワークを,新しいしきい値に基づく報酬と二次目的を取り入れて拡張する。
AlphaZeroは、トップダウンのタンパク質設計タスクにおいて、ベースラインMCTSを100%以上上回っている。
論文 参考訳(メタデータ) (2024-05-03T10:24:33Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Enhancing Protein Predictive Models via Proteins Data Augmentation: A
Benchmark and New Directions [58.819567030843025]
本稿では,これまで画像やテキストに用いたデータ拡張手法をタンパク質に拡張し,タンパク質関連タスクでこれらの手法をベンチマークする。
本稿では,2つの新規な意味レベルタンパク質増強法,すなわち,統合的グラディエント置換法とバック翻訳置換法を提案する。
最後に、拡張および提案された拡張を拡張プールに統合し、シンプルで効果的なフレームワークであるAutomated Protein Augmentation (APA)を提案する。
論文 参考訳(メタデータ) (2024-03-01T07:58:29Z) - Improving few-shot learning-based protein engineering with evolutionary
sampling [0.0]
本稿では,高価なウェットラボテストサイクルを加速することを目的とした,新規なタンパク質設計のための数発の学習手法を提案する。
提案手法は, 所望のタンパク質機能に対する個別のフィットネスランドスケープを生成する半教師ありトランスファー学習法と, 新たな進化的モンテカルロ連鎖サンプリングアルゴリズムとから構成される。
予測された高適合性遺伝子アクチベーターを実験的にスクリーニングすることにより,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-05-23T23:07:53Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Representation Learning via Knowledge Enhanced Primary Structure
Modeling [47.719106806436926]
タンパク質表現学習のための知識探索型タンパク質自動エンコーダ(KeAP)を提案する。
KeAPはタンパク質表現学習のためのトークンレベルの知識グラフ探索を行う。
我々は、9つの下流アプリケーションにおいて、KeAPが従来よりも一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T18:33:15Z) - PiFold: Toward effective and efficient protein inverse folding [33.755125937173965]
本稿では, 新規残基分解剤とPiGNN層を含むPiFoldを用いて, タンパク質配列をワンショットで生成する手法を提案する。
実験の結果、PiFoldはCATH 4.2で51.66%のリカバリを達成することができた。
論文 参考訳(メタデータ) (2022-09-22T04:52:27Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。