論文の概要: PiFold: Toward effective and efficient protein inverse folding
- arxiv url: http://arxiv.org/abs/2209.12643v4
- Date: Thu, 13 Apr 2023 04:52:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 17:23:09.567848
- Title: PiFold: Toward effective and efficient protein inverse folding
- Title(参考訳): PiFold: 効率的かつ効率的なタンパク質逆フォールディングを目指して
- Authors: Zhangyang Gao, Cheng Tan, Pablo Chac\'on, Stan Z. Li
- Abstract要約: 本稿では, 新規残基分解剤とPiGNN層を含むPiFoldを用いて, タンパク質配列をワンショットで生成する手法を提案する。
実験の結果、PiFoldはCATH 4.2で51.66%のリカバリを達成することができた。
- 参考スコア(独自算出の注目度): 33.755125937173965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How can we design protein sequences folding into the desired structures
effectively and efficiently? AI methods for structure-based protein design have
attracted increasing attention in recent years; however, few methods can
simultaneously improve the accuracy and efficiency due to the lack of
expressive features and autoregressive sequence decoder. To address these
issues, we propose PiFold, which contains a novel residue featurizer and PiGNN
layers to generate protein sequences in a one-shot way with improved recovery.
Experiments show that PiFold could achieve 51.66\% recovery on CATH 4.2, while
the inference speed is 70 times faster than the autoregressive competitors. In
addition, PiFold achieves 58.72\% and 60.42\% recovery scores on TS50 and
TS500, respectively. We conduct comprehensive ablation studies to reveal the
role of different types of protein features and model designs, inspiring
further simplification and improvement. The PyTorch code is available at
\href{https://github.com/A4Bio/PiFold}{GitHub}.
- Abstract(参考訳): 所望の構造に折り畳まれたタンパク質配列を効果的に効率的に設計する方法
近年、構造に基づくタンパク質設計のためのAI手法が注目されているが、表現的特徴の欠如や自己回帰的配列デコーダの欠如により、精度と効率を同時に向上できる手法はほとんどない。
これらの問題に対処するため,我々はpifoldを提案する。pifoldは新規な残基フェタタイザ層とpinn層を含み,タンパク質配列をワンショットで生成し,回復性が向上する。
実験により、ピフォールドはcath 4.2で51.66\%回復し、推論速度は自己回帰の競合相手の70倍速くなることが示された。
さらに、PiFoldはTS50とTS500でそれぞれ58.72\%と60.42\%のリカバリスコアを達成した。
種々のタンパク質の特徴とモデル設計の役割を明らかにするため、包括的アブレーション研究を行い、さらなる単純化と改善を促した。
PyTorch のコードは \href{https://github.com/A4Bio/PiFold}{GitHub} で公開されている。
関連論文リスト
- Enhancing Protein Predictive Models via Proteins Data Augmentation: A
Benchmark and New Directions [58.819567030843025]
本稿では,これまで画像やテキストに用いたデータ拡張手法をタンパク質に拡張し,タンパク質関連タスクでこれらの手法をベンチマークする。
本稿では,2つの新規な意味レベルタンパク質増強法,すなわち,統合的グラディエント置換法とバック翻訳置換法を提案する。
最後に、拡張および提案された拡張を拡張プールに統合し、シンプルで効果的なフレームワークであるAutomated Protein Augmentation (APA)を提案する。
論文 参考訳(メタデータ) (2024-03-01T07:58:29Z) - Improving few-shot learning-based protein engineering with evolutionary
sampling [0.0]
本稿では,高価なウェットラボテストサイクルを加速することを目的とした,新規なタンパク質設計のための数発の学習手法を提案する。
提案手法は, 所望のタンパク質機能に対する個別のフィットネスランドスケープを生成する半教師ありトランスファー学習法と, 新たな進化的モンテカルロ連鎖サンプリングアルゴリズムとから構成される。
予測された高適合性遺伝子アクチベーターを実験的にスクリーニングすることにより,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-05-23T23:07:53Z) - Knowledge-Design: Pushing the Limit of Protein Design via Knowledge
Refinement [37.937378787812264]
低品質残基を精製する知識認識モジュールを提案する。
また、トレーニング時間の50%以上を節約するメモリ検索機構も導入しました。
以上の結果から,我々の知識設計法は従来のPiFold法よりも約9%優れていた。
論文 参考訳(メタデータ) (2023-05-20T08:49:36Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - AlphaDesign: A graph protein design method and benchmark on AlphaFoldDB [37.937378787812264]
DeepMindは、タンパク質の折り畳みを一時的に解決しているが、その逆問題であるタンパク質設計は依然として重大な課題に直面している。
我々は、世界最大のタンパク質構造データベースであるAlphaFold DBを使用して、新しいグラフベースのベンチマークであるAlphaDesignを構築しています。
グラフトランスフォーマーエンコーダ(SGT)を簡略化し,信頼性に配慮したタンパク質デコーダ(CPD)を提案することにより,タンパク質アングルを新たな特徴として導入することにより,ADesignと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-01T08:28:24Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。