論文の概要: The Dance of Atoms-De Novo Protein Design with Diffusion Model
- arxiv url: http://arxiv.org/abs/2504.16479v1
- Date: Wed, 23 Apr 2025 07:45:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.036632
- Title: The Dance of Atoms-De Novo Protein Design with Diffusion Model
- Title(参考訳): 拡散モデルによるAtoms-De Novoタンパク質の設計
- Authors: Yujie Qin, Ming He, Changyong Yu, Ming Ni, Xian Liu, Xiaochen Bo,
- Abstract要約: デノボタンパク質の設計は、自然に存在しない特定の構造と機能を持つタンパク質を作成することを指す。
近年、高品質なタンパク質構造と配列データの蓄積と技術進歩が、タンパク質設計における生成人工知能(AI)モデルの成功の道を開いた。
様々な生成AIモデルの中で、拡散モデルはタンパク質設計において最も有望な結果をもたらした。
- 参考スコア(独自算出の注目度): 9.521115574728915
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The de novo design of proteins refers to creating proteins with specific structures and functions that do not naturally exist. In recent years, the accumulation of high-quality protein structure and sequence data and technological advancements have paved the way for the successful application of generative artificial intelligence (AI) models in protein design. These models have surpassed traditional approaches that rely on fragments and bioinformatics. They have significantly enhanced the success rate of de novo protein design, and reduced experimental costs, leading to breakthroughs in the field. Among various generative AI models, diffusion models have yielded the most promising results in protein design. In the past two to three years, more than ten protein design models based on diffusion models have emerged. Among them, the representative model, RFDiffusion, has demonstrated success rates in 25 protein design tasks that far exceed those of traditional methods, and other AI-based approaches like RFjoint and hallucination. This review will systematically examine the application of diffusion models in generating protein backbones and sequences. We will explore the strengths and limitations of different models, summarize successful cases of protein design using diffusion models, and discuss future development directions.
- Abstract(参考訳): タンパク質のde novo設計は、自然に存在しない特定の構造と機能を持つタンパク質を作成することを指す。
近年、高品質なタンパク質構造と配列データの蓄積と技術進歩が、タンパク質設計における生成人工知能(AI)モデルの成功の道を開いた。
これらのモデルは、断片やバイオインフォマティクスに依存する伝統的なアプローチを超越している。
それらはデノボタンパク質の設計の成功率を大幅に向上させ、実験コストを削減し、この分野の突破口となった。
様々な生成AIモデルの中で、拡散モデルはタンパク質設計において最も有望な結果をもたらした。
過去2~3年間で、拡散モデルに基づく10以上のタンパク質設計モデルが出現している。
その中でも代表的モデルであるRFDiffusionは、従来の方法よりもはるかに多い25のタンパク質設計タスクや、RFjointや幻覚といったAIベースのアプローチの成功率を示している。
本稿では,タンパク質のバックボーンと配列の生成における拡散モデルの適用について系統的に検討する。
我々は、異なるモデルの強みと限界を探求し、拡散モデルを用いたタンパク質設計の成功事例を要約し、今後の開発方向性について議論する。
関連論文リスト
- An All-Atom Generative Model for Designing Protein Complexes [49.09672038729524]
APM(All-Atom Protein Generative Model)は、マルチチェーンタンパク質をモデル化するためのモデルである。
原子レベルの情報を統合し、多鎖タンパク質のデータを活用することで、APMは鎖間相互作用を正確にモデル化し、結合能力を持つタンパク質複合体をゼロから設計することができる。
論文 参考訳(メタデータ) (2025-04-17T16:37:41Z) - UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。
自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。
材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - A Model-Centric Review of Deep Learning for Protein Design [0.0]
ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。
ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。
最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文 参考訳(メタデータ) (2025-02-26T14:31:21Z) - Computational Protein Science in the Era of Large Language Models (LLMs) [54.35488233989787]
計算タンパク質科学(Computational protein science)は、タンパク質配列構造-機能パラダイムにおける知識を明らかにすること、および応用を開発することを目的としている。
最近、言語モデル (Language Models, PLM) は、前例のない言語処理と一般化能力のために、AIのマイルストーンとして登場した。
論文 参考訳(メタデータ) (2025-01-17T16:21:18Z) - From thermodynamics to protein design: Diffusion models for biomolecule generation towards autonomous protein engineering [8.173909751137888]
まず拡散モデルの定義と特徴を述べ,拡散確率モデルとスコアベース生成モデルという2つの戦略に焦点をあてる。
タンパク質設計、ペプチド生成、薬物発見、タンパク質-リガンド相互作用におけるそれらの応用について論じる。
論文 参考訳(メタデータ) (2025-01-05T22:36:43Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - Generative artificial intelligence for de novo protein design [1.2021565114959365]
生成的アーキテクチャは、新しいが現実的なタンパク質を生成するには適しているようだ。
設計プロトコルは20%近い実験的な成功率を達成した。
広範な進歩にもかかわらず、フィールド全体の課題は明らかである。
論文 参考訳(メタデータ) (2023-10-15T00:02:22Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - ProGen2: Exploring the Boundaries of Protein Language Models [15.82416400246896]
タンパク質言語モデルであるProGen2を導入し、最大6.4Bのパラメータに拡張する。
ProGen2モデルは、観察された進化系列の分布を捉える際に、最先端の性能を示す。
モデルのサイズが大きくなり, タンパク質配列の数が多くなりつつあるため, タンパク質配列モデルに提供されるデータ分布に重点を置く必要があることが示唆された。
論文 参考訳(メタデータ) (2022-06-27T17:55:02Z) - Deep Generative Modeling for Protein Design [0.0]
ディープラーニングアプローチは、画像分類や自然言語処理などの分野で画期的な成果を上げている。
タンパク質の遺伝子モデルが開発され、既知のタンパク質配列を全て含む、特定のタンパク質ファミリーをモデル化する、または個々のタンパク質のダイナミクスを外挿する。
本稿では、タンパク質のモデリングに最も成功した5種類の生成モデルについて論じ、ガイドされたタンパク質設計のためのフレームワークを提供する。
論文 参考訳(メタデータ) (2021-08-31T14:38:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。