論文の概要: Generative Modeling in Protein Design: Neural Representations, Conditional Generation, and Evaluation Standards
- arxiv url: http://arxiv.org/abs/2603.26378v1
- Date: Fri, 27 Mar 2026 13:02:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.509957
- Title: Generative Modeling in Protein Design: Neural Representations, Conditional Generation, and Evaluation Standards
- Title(参考訳): タンパク質設計における生成モデリング:ニューラル表現、条件生成、評価基準
- Authors: Senura Hansaja Wanasekara, Minh-Duong Nguyen, Xiaochen Liu, Nguyen H. Tran, Ken-Tye Yong,
- Abstract要約: 生成モデリングはタンパク質研究の中心的なパラダイムとなっている。
この調査は、予測モデリングから信頼性の高い機能駆動タンパク質工学への移行を加速することを目的としている。
- 参考スコア(独自算出の注目度): 3.8025175740783026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative modeling has become a central paradigm in protein research, extending machine learning beyond structure prediction toward sequence design, backbone generation, inverse folding, and biomolecular interaction modeling. However, the literature remains fragmented across representations, model classes, and task formulations, making it difficult to compare methods or identify appropriate evaluation standards. This survey provides a systematic synthesis of generative AI in protein research, organized around (i) foundational representations spanning sequence, geometric, and multimodal encodings; (ii) generative architectures including $\mathrm{SE}(3)$-equivariant diffusion, flow matching, and hybrid predictor-generator systems; and (iii) task settings from structure prediction and de novo design to protein-ligand and protein-protein interactions. Beyond cataloging methods, we compare assumptions, conditioning mechanisms, and controllability, and we synthesize evaluation best practices that emphasize leakage-aware splits, physical validity checks, and function-oriented benchmarks. We conclude with critical open challenges: modeling conformational dynamics and intrinsically disordered regions, scaling to large assemblies while maintaining efficiency, and developing robust safety frameworks for dual-use biosecurity risks. By unifying architectural advances with practical evaluation standards and responsible development considerations, this survey aims to accelerate the transition from predictive modeling to reliable, function-driven protein engineering.
- Abstract(参考訳): 生成モデリングはタンパク質研究の中心的なパラダイムとなり、構造予測を越えてシーケンス設計、バックボーン生成、逆フォールディング、生体分子相互作用モデリングへと拡張されている。
しかし、文献は表現、モデルクラス、タスクの定式化の間で断片化されており、メソッドの比較や適切な評価基準の特定が困難である。
この調査は、タンパク質研究における生成AIの体系的な合成を提供する。
一 シーケンス、幾何及びマルチモーダルエンコーディングにまたがる基礎的表現
(ii)$\mathrm{SE}(3)$-equivariant diffusion, flow matching,およびハイブリッド予測器・ジェネレータシステムを含む生成的アーキテクチャ
3) 構造予測とデノボ設計からタンパク質-リガンドおよびタンパク質-タンパク質相互作用へのタスク設定。
カタログ化の方法以外にも,仮定,条件付け機構,制御性を比較し,リーク認識分割,物理的妥当性チェック,関数指向ベンチマークを強調する評価ベストプラクティスを合成する。
コンフォメーション力学と本質的に乱れた領域をモデル化し、効率を保ちながら大規模な集合体にスケーリングし、二重用途のバイオセキュリティリスクのための堅牢な安全性フレームワークを開発する。
本研究は, 予測モデルから信頼性の高い機能駆動タンパク質工学への転換を加速することを目的として, 実用評価基準と開発上の課題を両立させることにより, アーキテクチャの進歩を加速することを目的とする。
関連論文リスト
- From Snapshots to Symphonies: The Evolution of Protein Prediction from Static Structures to Generative Dynamics and Multimodal Interactions [0.8880611506199769]
レビューでは、5つの相互接続された次元にわたるAI駆動タンパク質科学のパラダイムシフトを体系的に検証している。
データ分散バイアス、機械的解釈可能性の制限、幾何学的メトリクスと生物物理学的現実の切り離しなど、現在のボトルネックを批判的に分析する。
この手法は、人工知能が構造解析ツールから普遍的なシミュレータへ移行し、生命の動的言語を理解し、最終的に書き換えることができることを示す。
論文 参考訳(メタデータ) (2026-03-19T05:25:17Z) - Protein Autoregressive Modeling via Multiscale Structure Generation [51.92004892768298]
タンパク質自己回帰モデリング(PAR)は,タンパク質のバックボーン生成のための最初のマルチスケール自己回帰フレームワークである。
ノイズの多いコンテキスト学習とスケジュールサンプリングを採用し、堅牢なバックボーン生成を実現している。
非条件生成ベンチマークでは、PARはタンパク質の分布を効果的に学習し、高い設計品質のバックボーンを生成する。
論文 参考訳(メタデータ) (2026-02-04T18:59:49Z) - Swarms of Large Language Model Agents for Protein Sequence Design with Experimental Validation [0.9332987715848714]
大規模言語モデル(LLM)エージェントは並列に動作し、それぞれ特定の残基位置に割り当てられる。
この位置的、非集中的な調整は、多様で明確に定義されたシーケンスの創発的設計を可能にする。
提案手法は,数時間以内に効率よく客観的な設計を実現し,微調整や特殊訓練を行なわずに完全に動作させる。
論文 参考訳(メタデータ) (2025-11-27T10:42:52Z) - AI-based Methods for Simulating, Sampling, and Predicting Protein Ensembles [16.635202322160243]
レビューでは、AIによるタンパク質アンサンブルの予測に向けた最近の研究の方向性を強調している。
現在の手法の技術的成熟度に関する現実的な評価に重点を置いている。
私たちは、トレーニングデータの可用性における課題を克服するために、モデルトレーニング、シミュレーション、推論の間の"ループを閉じる"ことを提唱します。
論文 参考訳(メタデータ) (2025-09-21T20:14:45Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Predictive Modeling, Pattern Recognition, and Spatiotemporal Representations of Plant Growth in Simulated and Controlled Environments: A Comprehensive Review [0.0]
本稿では,最先端の予測パターン認識技術について概説する。
植物形質の確率論的モデリングと動的環境相互作用の統合に着目した。
主なトピックは、予測タスクのための回帰とニューラルネットワークベースの表現モデルだ。
論文 参考訳(メタデータ) (2024-12-13T20:22:35Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。