論文の概要: ProDesign: Toward effective and efficient protein design
- arxiv url: http://arxiv.org/abs/2209.12643v1
- Date: Thu, 22 Sep 2022 04:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:23:45.868040
- Title: ProDesign: Toward effective and efficient protein design
- Title(参考訳): ProDesign: 効率的かつ効率的なタンパク質設計を目指して
- Authors: Zhangyang Gao, Cheng Tan, Stan Z. Li
- Abstract要約: 本稿では,新規な残基破砕剤とProGNN層を含むタンパク質配列をワンショットで生成するProDesignを提案する。
実験の結果、ProDesignはCATH 4.2で51.66%のリカバリが可能であり、推論速度はオートレグレッシブ・コンペティターの70倍速かった。
- 参考スコア(独自算出の注目度): 37.937378787812264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to design protein sequences folding into the desired structures
effectively and efficiently? Structure-based protein design has attracted
increasing attention in recent years; however, few methods can simultaneously
improve the accuracy and efficiency due to the lack of expressive features and
autoregressive sequence decoder. To address these issues, we propose ProDesign,
which contains a novel residue featurizer and ProGNN layers to generate protein
sequences in a one-shot way with improved recovery. Experiments show that
ProDesign could achieve 51.66\% recovery on CATH 4.2, while the inference speed
is 70 times faster than the autoregressive competitors. In addition, ProDesign
achieves 58.72\% and 60.42\% recovery scores on TS50 and TS500, respectively.
We conduct comprehensive ablation studies to reveal the role of different types
of protein features and model designs, inspiring further simplification and
improvement.
- Abstract(参考訳): 所望の構造に折りたたむタンパク質配列を効果的に効率的に設計する方法?
近年、構造ベースのタンパク質設計が注目されているが、表現的特徴の欠如と自己回帰的配列デコーダにより、精度と効率を同時に向上できる方法はほとんどない。
これらの問題に対処するために,prodesignを提案する。prodesignは,新規な残基フェアチュレータとprognn層を含み,タンパク質配列をワンショットで生成し,回復性が向上する。
実験により、プロデザインはcath 4.2で51.66\%回復し、推論速度は自己回帰の競合相手の70倍速くなることが示された。
さらに、ProDesignはTS50とTS500でそれぞれ58.72\%と60.42\%のリカバリスコアを達成した。
種々のタンパク質の特徴とモデル設計の役割を明らかにするため、包括的アブレーション研究を行い、さらなる単純化と改善を促した。
関連論文リスト
- Enhancing Protein Predictive Models via Proteins Data Augmentation: A
Benchmark and New Directions [58.819567030843025]
本稿では,これまで画像やテキストに用いたデータ拡張手法をタンパク質に拡張し,タンパク質関連タスクでこれらの手法をベンチマークする。
本稿では,2つの新規な意味レベルタンパク質増強法,すなわち,統合的グラディエント置換法とバック翻訳置換法を提案する。
最後に、拡張および提案された拡張を拡張プールに統合し、シンプルで効果的なフレームワークであるAutomated Protein Augmentation (APA)を提案する。
論文 参考訳(メタデータ) (2024-03-01T07:58:29Z) - Improving few-shot learning-based protein engineering with evolutionary
sampling [0.0]
本稿では,高価なウェットラボテストサイクルを加速することを目的とした,新規なタンパク質設計のための数発の学習手法を提案する。
提案手法は, 所望のタンパク質機能に対する個別のフィットネスランドスケープを生成する半教師ありトランスファー学習法と, 新たな進化的モンテカルロ連鎖サンプリングアルゴリズムとから構成される。
予測された高適合性遺伝子アクチベーターを実験的にスクリーニングすることにより,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-05-23T23:07:53Z) - Knowledge-Design: Pushing the Limit of Protein Design via Knowledge
Refinement [37.937378787812264]
低品質残基を精製する知識認識モジュールを提案する。
また、トレーニング時間の50%以上を節約するメモリ検索機構も導入しました。
以上の結果から,我々の知識設計法は従来のPiFold法よりも約9%優れていた。
論文 参考訳(メタデータ) (2023-05-20T08:49:36Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - AlphaDesign: A graph protein design method and benchmark on AlphaFoldDB [37.937378787812264]
DeepMindは、タンパク質の折り畳みを一時的に解決しているが、その逆問題であるタンパク質設計は依然として重大な課題に直面している。
我々は、世界最大のタンパク質構造データベースであるAlphaFold DBを使用して、新しいグラフベースのベンチマークであるAlphaDesignを構築しています。
グラフトランスフォーマーエンコーダ(SGT)を簡略化し,信頼性に配慮したタンパク質デコーダ(CPD)を提案することにより,タンパク質アングルを新たな特徴として導入することにより,ADesignと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-01T08:28:24Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。