論文の概要: AI-based Methods for Simulating, Sampling, and Predicting Protein Ensembles
- arxiv url: http://arxiv.org/abs/2509.17224v1
- Date: Sun, 21 Sep 2025 20:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.174115
- Title: AI-based Methods for Simulating, Sampling, and Predicting Protein Ensembles
- Title(参考訳): タンパク質アンサンブルのシミュレーション、サンプリング、予測のためのAIベースの方法
- Authors: Bowen Jing, Bonnie Berger, Tommi Jaakkola,
- Abstract要約: レビューでは、AIによるタンパク質アンサンブルの予測に向けた最近の研究の方向性を強調している。
現在の手法の技術的成熟度に関する現実的な評価に重点を置いている。
私たちは、トレーニングデータの可用性における課題を克服するために、モデルトレーニング、シミュレーション、推論の間の"ループを閉じる"ことを提唱します。
- 参考スコア(独自算出の注目度): 16.635202322160243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in deep learning have opened an era of abundant and accurate predicted protein structures; however, similar progress in protein ensembles has remained elusive. This review highlights several recent research directions towards AI-based predictions of protein ensembles, including coarse-grained force fields, generative models, multiple sequence alignment perturbation methods, and modeling of ensemble descriptors. An emphasis is placed on realistic assessments of the technological maturity of current methods, the strengths and weaknesses of broad families of techniques, and promising machine learning frameworks at an early stage of development. We advocate for "closing the loop" between model training, simulation, and inference to overcome challenges in training data availability and to enable the next generation of models.
- Abstract(参考訳): ディープラーニングの進歩は、豊富で正確な予測されたタンパク質構造の時代を開いたが、タンパク質のアンサンブルの類似した進歩は、いまだ解明されていない。
このレビューでは、粗い力場、生成モデル、複数のシーケンスアライメント摂動法、アンサンブル記述子のモデリングなど、AIに基づくタンパク質アンサンブルの予測に向けた最近の研究の方向性を強調している。
従来の手法の技術的成熟度、幅広い技術ファミリーの強みと弱さ、そして開発初期段階における有望な機械学習フレームワークの現実的な評価に重点を置いている。
我々は、モデルのトレーニング、シミュレーション、推論の間の「ループを閉じる」ことを提唱し、データの可用性をトレーニングする際の課題を克服し、次世代のモデルを可能にする。
関連論文リスト
- Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles [74.32932832937618]
幾何学的事前学習フレームワークであるtextbfRigidSSL$(textitRigidity-Aware Self-Supervised Learning$)を紹介した。
フェーズI(RigidSSL-Perturb)は、AlphaFoldタンパク質構造データベースから432K構造から、シミュレートされた摂動を持つ幾何学的先行を学習する。
フェーズII(RigidSSL-MD)は、1.3K分子動力学軌道上のこれらの表現を洗練し、物理的に現実的な遷移を捉える。
論文 参考訳(メタデータ) (2026-03-02T21:32:30Z) - Protein Autoregressive Modeling via Multiscale Structure Generation [51.92004892768298]
タンパク質自己回帰モデリング(PAR)は,タンパク質のバックボーン生成のための最初のマルチスケール自己回帰フレームワークである。
ノイズの多いコンテキスト学習とスケジュールサンプリングを採用し、堅牢なバックボーン生成を実現している。
非条件生成ベンチマークでは、PARはタンパク質の分布を効果的に学習し、高い設計品質のバックボーンを生成する。
論文 参考訳(メタデータ) (2026-02-04T18:59:49Z) - GeoGraph: Geometric and Graph-based Ensemble Descriptors for Intrinsically Disordered Proteins [0.43981305860983716]
シミュレーションインフォームド・サロゲートであるGeoGraphを導入し,残差残差マップトポロジのアンサンブル平均統計をシーケンスから直接予測する。
粗粒度分子動力学シミュレーションを残差レベルおよびシーケンスレベルのグラフ記述子に分解することにより、ロバストで情報豊富な学習ターゲットを作成する。
論文 参考訳(メタデータ) (2025-10-01T11:13:53Z) - AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [92.51919604882984]
本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文 参考訳(メタデータ) (2025-07-11T17:02:25Z) - Advanced Deep Learning Methods for Protein Structure Prediction and Design [28.575821996185024]
タンパク質構造予測と設計に応用した高度な深層学習手法を包括的に検討する。
テキストは、構造生成、評価指標、多重シーケンスアライメント処理、ネットワークアーキテクチャを含む重要なコンポーネントを分析する。
予測精度を向上し、深層学習技術と実験的検証を統合するための戦略を徹底的に検討した。
論文 参考訳(メタデータ) (2025-03-14T21:28:29Z) - Speculative Decoding and Beyond: An In-Depth Survey of Techniques [4.165029665035158]
シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。
ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文 参考訳(メタデータ) (2025-02-27T03:53:45Z) - Learning conformational ensembles of proteins based on backbone geometry [1.1874952582465603]
本稿では,背骨形状のみに基づくタンパク質コンホメーションをサンプリングするためのフローマッチングモデルを提案する。
結果として得られたモデルは、現在の最先端アプローチよりも桁違いに高速で、数日間でスクラッチからトレーニングできる。
論文 参考訳(メタデータ) (2025-02-19T17:16:27Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Regularized Neural Ensemblers [55.15643209328513]
本研究では,正規化ニューラルネットワークをアンサンブル手法として活用することを検討する。
低多様性のアンサンブルを学習するリスクを動機として,ランダムにベースモデル予測をドロップすることで,アンサンブルモデルの正規化を提案する。
このアプローチはアンサンブル内の多様性の低い境界を提供し、過度な適合を減らし、一般化能力を向上させる。
論文 参考訳(メタデータ) (2024-10-06T15:25:39Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - On the Robustness of Random Forest Against Untargeted Data Poisoning: An
Ensemble-Based Approach [42.81632484264218]
機械学習モデルでは、トレーニングセット(中毒)の分画の摂動が、モデルの精度を著しく損なう可能性がある。
本研究の目的は、ランダムな森林を標的のない無作為な毒殺攻撃から保護する、新しいハッシュベースのアンサンブルアプローチを実現することである。
論文 参考訳(メタデータ) (2022-09-28T11:41:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。