論文の概要: Full-Atom Peptide Design based on Multi-modal Flow Matching
- arxiv url: http://arxiv.org/abs/2406.00735v1
- Date: Sun, 2 Jun 2024 12:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 03:36:42.605345
- Title: Full-Atom Peptide Design based on Multi-modal Flow Matching
- Title(参考訳): マルチモーダルフローマッチングに基づく全原子ペプチド設計
- Authors: Jiahan Li, Chaoran Cheng, Zuofan Wu, Ruihan Guo, Shitong Luo, Zhizhou Ren, Jian Peng, Jianzhu Ma,
- Abstract要約: フル原子ペプチドの設計のためのフローマッチングフレームワークを基盤とした,最初のマルチモーダル深層生成モデルであるPepFlowについて述べる。
高次元トーラス上で,$mathrmSE(3)$多様体内の剛性バックボーンフレームと側鎖角を用いてペプチド構造を特徴付ける。
提案手法は,固定バックボーンシーケンス設計や部分サンプリングによるサイドチェーンパッキングなど,様々なタスクに順応的に取り組む。
- 参考スコア(独自算出の注目度): 32.58558711545861
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Peptides, short chains of amino acid residues, play a vital role in numerous biological processes by interacting with other target molecules, offering substantial potential in drug discovery. In this work, we present PepFlow, the first multi-modal deep generative model grounded in the flow-matching framework for the design of full-atom peptides that target specific protein receptors. Drawing inspiration from the crucial roles of residue backbone orientations and side-chain dynamics in protein-peptide interactions, we characterize the peptide structure using rigid backbone frames within the $\mathrm{SE}(3)$ manifold and side-chain angles on high-dimensional tori. Furthermore, we represent discrete residue types in the peptide sequence as categorical distributions on the probability simplex. By learning the joint distributions of each modality using derived flows and vector fields on corresponding manifolds, our method excels in the fine-grained design of full-atom peptides. Harnessing the multi-modal paradigm, our approach adeptly tackles various tasks such as fix-backbone sequence design and side-chain packing through partial sampling. Through meticulously crafted experiments, we demonstrate that PepFlow exhibits superior performance in comprehensive benchmarks, highlighting its significant potential in computational peptide design and analysis.
- Abstract(参考訳): アミノ酸残基の短鎖であるペプチドは、他の標的分子と相互作用することで多くの生物学的プロセスにおいて重要な役割を果たす。
本研究では,タンパク質受容体を標的としたフル原子ペプチドの設計のためのフローマッチングフレームワークを基盤とした,最初の多モード深層生成モデルであるPepFlowについて述べる。
タンパク質-ペプチド相互作用における残基のバックボーン配向と側鎖のダイナミックスの重要な役割からインスピレーションを得て, $\mathrm{SE}(3)$多様体内の固いバックボーンフレームと高次元トーラス上の側鎖角を用いてペプチド構造を特徴づけた。
さらに、ペプチド配列の離散残基型を、確率単純度上のカテゴリー分布として表現する。
導出したフローと対応する多様体上のベクトル場を用いて各モードの関節分布を学習することにより、本手法はフル原子ペプチドの微細な設計に優れる。
提案手法は, 固定バックボーンシーケンス設計や部分サンプリングによるサイドチェーンパッキングなど, 様々な課題に順応的に対処する。
綿密に構築された実験を通して、PepFlowは総合的なベンチマークにおいて優れた性能を示し、計算ペプチドの設計と解析においてその有意義な可能性を浮き彫りにしている。
関連論文リスト
- MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Large-Scale Multi-omic Biosequence Transformers for Modeling Peptide-Nucleotide Interactions [2.84640003522012]
本研究は,最初のマルチオミックヌクレオチド-ペプチド基盤モデルについて述べる。
これらのマルチオミクスモデルは、様々な単一オミクス分布間の結合表現を学習可能であることを示す。
また,MOMはペプチド-ヌクレオチド相互作用タスクにおける最先端の結果を得るために微調整できることを示した。
論文 参考訳(メタデータ) (2024-08-29T03:56:40Z) - Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.812284760539713]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。
溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。
本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文 参考訳(メタデータ) (2024-07-02T20:13:47Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.567714059931646]
ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文 参考訳(メタデータ) (2024-03-05T13:26:42Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - Co-modeling the Sequential and Graphical Routes for Peptide
Representation Learning [67.66393016797181]
本稿では,表現の相互情報を強化するためのペプチド共モデリング手法RepConを提案する。
RepConは、正のサンプルペア間の表現の一貫性を高め、負のペア間の表現を撃退することを学ぶ。
この結果から,コモデリング手法が独立モデルよりも優れていること,コモデリングフレームワーク下での他の手法よりもRepConの方が優れていることが示唆された。
論文 参考訳(メタデータ) (2023-10-04T16:58:25Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。