論文の概要: SimpleFold: Folding Proteins is Simpler than You Think
- arxiv url: http://arxiv.org/abs/2509.18480v2
- Date: Sat, 27 Sep 2025 03:34:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 11:50:46.811385
- Title: SimpleFold: Folding Proteins is Simpler than You Think
- Title(参考訳): SimpleFold: 折りたたみタンパク質は思ったよりシンプル
- Authors: Yuyang Wang, Jiarui Lu, Navdeep Jaitly, Josh Susskind, Miguel Angel Bautista,
- Abstract要約: フローマッチングベースのタンパク質折り畳みモデルであるSimpleFoldを紹介する。
SimpleFoldは適応層を持つ標準のトランスフォーマーブロックを採用しており、生成フローマッチングの目的を通じてトレーニングされている。
標準的な折りたたみベンチマークでは、SimpleFold-3Bは最先端のベースラインに比べて競争力がある。
- 参考スコア(独自算出の注目度): 18.435187216907384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein folding models have achieved groundbreaking results typically via a combination of integrating domain knowledge into the architectural blocks and training pipelines. Nonetheless, given the success of generative models across different but related problems, it is natural to question whether these architectural designs are a necessary condition to build performant models. In this paper, we introduce SimpleFold, the first flow-matching based protein folding model that solely uses general purpose transformer blocks. Protein folding models typically employ computationally expensive modules involving triangular updates, explicit pair representations or multiple training objectives curated for this specific domain. Instead, SimpleFold employs standard transformer blocks with adaptive layers and is trained via a generative flow-matching objective with an additional structural term. We scale SimpleFold to 3B parameters and train it on approximately 9M distilled protein structures together with experimental PDB data. On standard folding benchmarks, SimpleFold-3B achieves competitive performance compared to state-of-the-art baselines, in addition SimpleFold demonstrates strong performance in ensemble prediction which is typically difficult for models trained via deterministic reconstruction objectives. Due to its general-purpose architecture, SimpleFold shows efficiency in deployment and inference on consumer-level hardware. SimpleFold challenges the reliance on complex domain-specific architectures designs in protein folding, opening up an alternative design space for future progress.
- Abstract(参考訳): タンパク質の折りたたみモデルは、一般的にドメイン知識をアーキテクチャブロックとトレーニングパイプラインに統合することで、画期的な成果を上げています。
それでも、異なるが関連する問題にまたがる生成モデルの成功を考えると、これらのアーキテクチャ設計がパフォーマンスモデルを構築するために必要な条件であるかどうかに疑問を呈するのは当然である。
本稿では,汎用トランスブロックのみを用いた最初のフローマッチング型タンパク質折り畳みモデルであるSimpleFoldを紹介する。
タンパク質折り畳みモデルは典型的には、三角形の更新、明示的なペア表現、あるいはこの特定の領域のためにキュレートされた複数の訓練目的を含む計算コストの高いモジュールを使用する。
その代わり、SimpleFoldは適応層を持つ標準のトランスフォーマーブロックを採用し、生成フローマッチングの目的を付加的な構造用語でトレーニングする。
我々はSimpleFoldを3Bパラメータに拡張し、実験的なPDBデータとともに約9Mの蒸留タンパク質構造をトレーニングした。
標準的な折りたたみベンチマークでは、SimpleFold-3Bは最先端のベースラインと比較して競争性能が向上し、さらにSimpleFoldは、決定論的再構成の目的によってトレーニングされたモデルでは一般的に難しいアンサンブル予測において、強力なパフォーマンスを示す。
汎用アーキテクチャのため、SimpleFoldはコンシューマレベルのハードウェアへのデプロイメントと推論の効率性を示している。
SimpleFoldは、タンパク質の折り畳みにおける複雑なドメイン固有のアーキテクチャ設計への依存に挑戦し、将来の進歩のための代替設計空間を開く。
関連論文リスト
- Protein-SE(3): Benchmarking SE(3)-based Generative Models for Protein Structure Design [35.87227562237066]
SE(3)に基づく生成モデルは、タンパク質の幾何学的モデリングと効率的な構造設計において非常に有望である。
統合トレーニングフレームワークに基づく新しいベンチマークであるProtein-SE(3)は、タンパク質の足場タスク、統合生成モデル、高レベルの数学的抽象化、多様な評価指標で構成されている。
論文 参考訳(メタデータ) (2025-07-27T11:53:05Z) - Fast and Accurate Blind Flexible Docking [79.88520988144442]
小分子(配位子)のタンパク質標的への結合構造を予測する分子ドッキングは、薬物発見において重要な役割を果たす。
本研究では,現実的な視覚的フレキシブルドッキングシナリオを対象とした,高速かつ高精度な回帰ベースマルチタスク学習モデルであるFABFlexを提案する。
論文 参考訳(メタデータ) (2025-02-20T07:31:13Z) - Jet: A Modern Transformer-Based Normalizing Flow [62.2573739835562]
本稿では,結合型正規化フローモデルの設計を再考する。
よりシンプルなアーキテクチャで、最先端の定量的、質的なパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-12-19T18:09:42Z) - Emergence of Segmentation with Minimalistic White-Box Transformers [22.688777622988795]
従来の研究では、視覚変換器(ViT)はDINOのような自己教師型手法で訓練されるが、教師型分類タスクでは訓練されていない。
本研究では,複雑な自己教師付き学習機構の結果としてのみ,変圧器モデルにセグメンテーションが出現するかどうかを考察する。
この結果から,高い性能と数学的に完全に解釈可能なホワイトボックス基礎モデルを設計するための道筋が示唆された。
論文 参考訳(メタデータ) (2023-08-30T19:02:17Z) - DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文 参考訳(メタデータ) (2023-01-30T14:02:33Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - Re-parameterizing Your Optimizers rather than Architectures [119.08740698936633]
本稿では,モデル固有の事前知識を構造学に取り入れ,汎用モデル(簡易モデル)の学習に使用する新しいパラダイムを提案する。
実装として,モデル固有のハイパーパラメータの集合に従って勾配を変更することによって,事前知識を付加する手法を提案する。
Reprでトレーニングされた単純なモデルに対しては、VGGスタイルのプレーンモデルに注目し、ReprでトレーニングされたそのようなシンプルなモデルがRep-VGGと呼ばれ、最近のよく設計されたモデルと同等に動作することを示す。
論文 参考訳(メタデータ) (2022-05-30T16:55:59Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。