論文の概要: Protein Inverse Folding From Structure Feedback
- arxiv url: http://arxiv.org/abs/2506.03028v1
- Date: Tue, 03 Jun 2025 16:02:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.824206
- Title: Protein Inverse Folding From Structure Feedback
- Title(参考訳): 構造フィードバックからのタンパク質逆フォールディング
- Authors: Junde Xu, Zijun Gao, Xinyi Zhou, Jie Hu, Xingyi Cheng, Le Song, Guangyong Chen, Pheng-Ann Heng, Jiezhong Qiu,
- Abstract要約: 本稿では,タンパク質の折りたたみモデルからのフィードバックを用いて,逆折りたたみモデルを微調整する手法を提案する。
CATH 4.2 テストセットの結果,DPO の微調整により平均 TM-Score が大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 78.27854221882572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The inverse folding problem, aiming to design amino acid sequences that fold into desired three-dimensional structures, is pivotal for various biotechnological applications. Here, we introduce a novel approach leveraging Direct Preference Optimization (DPO) to fine-tune an inverse folding model using feedback from a protein folding model. Given a target protein structure, we begin by sampling candidate sequences from the inverse-folding model, then predict the three-dimensional structure of each sequence with the folding model to generate pairwise structural-preference labels. These labels are used to fine-tune the inverse-folding model under the DPO objective. Our results on the CATH 4.2 test set demonstrate that DPO fine-tuning not only improves sequence recovery of baseline models but also leads to a significant improvement in average TM-Score from 0.77 to 0.81, indicating enhanced structure similarity. Furthermore, iterative application of our DPO-based method on challenging protein structures yields substantial gains, with an average TM-Score increase of 79.5\% with regard to the baseline model. This work establishes a promising direction for enhancing protein sequence design ability from structure feedback by effectively utilizing preference optimization.
- Abstract(参考訳): 逆フォールディング問題は、望まれる3次元構造に折り畳まれるアミノ酸配列を設計することを目的としており、様々なバイオテクノロジー応用に欠かせない問題である。
本稿では,タンパク質の折りたたみモデルからのフィードバックを用いて,逆折りたたみモデルを微調整するために,DPO(Direct Preference Optimization)を利用した新しいアプローチを提案する。
対象タンパク質構造が与えられた場合、まず逆折り畳みモデルから候補配列をサンプリングし、各配列の3次元構造を折り畳みモデルで予測し、一対の構造参照ラベルを生成する。
これらのラベルは、DPOの目的の下で逆折り畳みモデルを微調整するために使用される。
CATH 4.2 テストセットの結果,DPO の微調整はベースラインモデルのシーケンス回復を向上するだけでなく,平均 TM-Score が 0.77 から 0.81 に向上し,構造的類似性が向上することを示した。
さらに, DPO法をベースラインモデルに応用することにより, 平均TMスコアは79.5倍に向上した。
本研究は、タンパク質配列設計能力を構造フィードバックから有効に活用することで、タンパク質配列設計能力を高めるための有望な方向を確立する。
関連論文リスト
- Improving Protein Sequence Design through Designability Preference Optimization [22.037870784317885]
我々は、高い設計性に向けてシーケンス生成を操ることで、トレーニング目標を再定義する。
ResiDPO(Residue-level Designability Preference Optimization)を導入する。
これにより、すでにうまく機能している領域を保存しながら、設計性を直接改善することができる。
論文 参考訳(メタデータ) (2025-05-30T23:02:51Z) - Improving Inverse Folding for Peptide Design with Diversity-regularized Direct Preference Optimization [33.131551374836775]
逆折り畳みモデルは、望ましい参照構造に折り畳むアミノ酸配列を予測する。
メッセージパッシングエンコーダデコーダモデルであるProteinMPNNは、参照構造から新しいシーケンスを確実に生成するように訓練されている。
しかし、ペプチドに適用すると、これらのモデルは参照構造に折りたたみしない反復配列を生成する傾向がある。
論文 参考訳(メタデータ) (2024-10-25T11:04:02Z) - Inverse folding for antibody sequence design using deep learning [2.8998926117101367]
本稿では, 抗体構造に特異的に最適化した, 精密な折り畳み逆モデルを提案する。
本研究では、相補性決定領域の標準的コンフォーメーションについて検討し、これらのループの既知のクラスタへの符号化を改善した。
論文 参考訳(メタデータ) (2023-10-30T13:12:41Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。