論文の概要: Protein-SE(3): Benchmarking SE(3)-based Generative Models for Protein Structure Design
- arxiv url: http://arxiv.org/abs/2507.20243v1
- Date: Sun, 27 Jul 2025 11:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.286039
- Title: Protein-SE(3): Benchmarking SE(3)-based Generative Models for Protein Structure Design
- Title(参考訳): タンパク質-SE(3):タンパク質構造設計のためのSE(3)に基づく生成モデルベンチマーク
- Authors: Lang Yu, Zhangyang Gao, Cheng Tan, Qin Chen, Jie Zhou, Liang He,
- Abstract要約: SE(3)に基づく生成モデルは、タンパク質の幾何学的モデリングと効率的な構造設計において非常に有望である。
統合トレーニングフレームワークに基づく新しいベンチマークであるProtein-SE(3)は、タンパク質の足場タスク、統合生成モデル、高レベルの数学的抽象化、多様な評価指標で構成されている。
- 参考スコア(独自算出の注目度): 35.87227562237066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SE(3)-based generative models have shown great promise in protein geometry modeling and effective structure design. However, the field currently lacks a modularized benchmark to enable comprehensive investigation and fair comparison of different methods. In this paper, we propose Protein-SE(3), a new benchmark based on a unified training framework, which comprises protein scaffolding tasks, integrated generative models, high-level mathematical abstraction, and diverse evaluation metrics. Recent advanced generative models designed for protein scaffolding, from multiple perspectives like DDPM (Genie1 and Genie2), Score Matching (FrameDiff and RfDiffusion) and Flow Matching (FoldFlow and FrameFlow) are integrated into our framework. All integrated methods are fairly investigated with the same training dataset and evaluation metrics. Furthermore, we provide a high-level abstraction of the mathematical foundations behind the generative models, enabling fast prototyping of future algorithms without reliance on explicit protein structures. Accordingly, we release the first comprehensive benchmark built upon unified training framework for SE(3)-based protein structure design, which is publicly accessible at https://github.com/BruthYU/protein-se3.
- Abstract(参考訳): SE(3)に基づく生成モデルは、タンパク質の幾何学的モデリングと効率的な構造設計において非常に有望である。
しかし、現時点では、様々な方法の総合的な調査と公正な比較を可能にする、モジュール化されたベンチマークが欠落している。
本稿では,タンパク質スキャフォールディングタスク,統合生成モデル,高レベルの数学的抽象化,多種多様な評価指標を含む,統一的なトレーニングフレームワークに基づく新しいベンチマークであるProtein-SE(3)を提案する。
DDPM (Genie1 と Genie2)、Score Matching (FrameDiff と RfDiffusion)、Flow Matching (FoldFlow と FrameFlow) といった様々な観点から、タンパク質の足場構築のために設計された最近の高度な生成モデルが我々のフレームワークに統合されている。
すべての統合されたメソッドは、同じトレーニングデータセットと評価メトリクスでかなり調査されている。
さらに、生成モデルの背後にある数学的基礎を高度に抽象化し、明示的なタンパク質構造に依存することなく、将来のアルゴリズムの高速なプロトタイピングを可能にする。
そこで我々は,SE(3)をベースとしたタンパク質構造設計のための統一的なトレーニングフレームワーク上に構築された最初の包括的なベンチマークを,https://github.com/BruthYU/ protein-se3で公開している。
関連論文リスト
- Protein Structure Tokenization: Benchmarking and New Recipe [16.842453216446987]
StructTokenBenchは、構造トークン化器の品質と効率を包括的に評価するフレームワークである。
AminoAseedは、コードブックの更新を強化し、コードブックのサイズと寸法を最適にバランスさせ、トークン化ツールの利用と品質を改善する戦略である。
本手法は,24タスクに対して平均6.31%の性能向上を実現し,感度と利用率をそれぞれ12.83%,124.03%向上させた。
論文 参考訳(メタデータ) (2025-02-28T15:14:33Z) - ProteinWeaver: A Divide-and-Assembly Approach for Protein Backbone Design [61.19456204667385]
本稿では,タンパク質のバックボーン設計のための2段階フレームワークであるProteinWeaverを紹介する。
プロテインウィーバーは、多用途ドメインアセンブリを通じて高品質で新規なタンパク質のバックボーンを生成する。
分割組立パラダイムを導入することにより、タンパク質工学を進歩させ、機能的タンパク質設計のための新たな道を開く。
論文 参考訳(メタデータ) (2024-11-08T08:10:49Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - Neural Embeddings for Protein Graphs [0.8258451067861933]
幾何学ベクトル空間にタンパク質グラフを埋め込む新しい枠組みを提案する。
タンパク質グラフ間の構造的距離を保存するエンコーダ関数を学習する。
本フレームワークは,タンパク質構造分類の課題において,顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-06-07T14:50:34Z) - A Systematic Study of Joint Representation Learning on Protein Sequences
and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。
近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。
本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文 参考訳(メタデータ) (2023-03-11T01:24:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。