論文の概要: Protein Design with Guided Discrete Diffusion
- arxiv url: http://arxiv.org/abs/2305.20009v2
- Date: Tue, 12 Dec 2023 05:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 20:18:30.244037
- Title: Protein Design with Guided Discrete Diffusion
- Title(参考訳): 離散拡散誘導によるタンパク質設計
- Authors: Nate Gruver, Samuel Stanton, Nathan C. Frey, Tim G. J. Rudner, Isidro
Hotzel, Julien Lafrance-Vanasse, Arvind Rajpal, Kyunghyun Cho, and Andrew
Gordon Wilson
- Abstract要約: タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
- 参考スコア(独自算出の注目度): 67.06148688398677
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A popular approach to protein design is to combine a generative model with a
discriminative model for conditional sampling. The generative model samples
plausible sequences while the discriminative model guides a search for
sequences with high fitness. Given its broad success in conditional sampling,
classifier-guided diffusion modeling is a promising foundation for protein
design, leading many to develop guided diffusion models for structure with
inverse folding to recover sequences. In this work, we propose diffusioN
Optimized Sampling (NOS), a guidance method for discrete diffusion models that
follows gradients in the hidden states of the denoising network. NOS makes it
possible to perform design directly in sequence space, circumventing
significant limitations of structure-based methods, including scarce data and
challenging inverse design. Moreover, we use NOS to generalize LaMBO, a
Bayesian optimization procedure for sequence design that facilitates multiple
objectives and edit-based constraints. The resulting method, LaMBO-2, enables
discrete diffusions and stronger performance with limited edits through a novel
application of saliency maps. We apply LaMBO-2 to a real-world protein design
task, optimizing antibodies for higher expression yield and binding affinity to
several therapeutic targets under locality and developability constraints,
attaining a 99% expression rate and 40% binding rate in exploratory in vitro
experiments.
- Abstract(参考訳): タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
生成モデルは可塑性配列をサンプリングし、識別モデルは高い適合度を有する配列を探索する。
条件付きサンプリングにおいて広範囲に成功しているため、分類器誘導拡散モデリングはタンパク質設計の有望な基礎となり、逆折り畳み構造のためのガイド付き拡散モデルを開発した。
本研究では,離散拡散モデルの誘導手法であるdiffusioN Optimized Smpling (NOS)を提案する。
nosはシーケンス空間で直接設計を行うことを可能にし、少ないデータや挑戦的な逆設計を含む構造ベースの方法の重大な制限を回避する。
さらに,複数の目的や編集に基づく制約を緩和するシーケンス設計のためのベイズ最適化手法であるLaMBOをNOSで一般化する。
得られた方法であるLaMBO-2は、サリエンシマップの新たな応用を通じて、離散拡散と限定的な編集によるパフォーマンスの向上を可能にする。
我々はLaMBO-2を実世界のタンパク質設計タスクに適用し、局所性および開発可能性制約下でのいくつかの治療対象に対する高発現収率および結合親和性の抗体を最適化し、実験室での試験で99%の発現率と40%の結合率を達成する。
関連論文リスト
- Discrete Diffusion Modeling by Estimating the Ratios of the Data
Distribution [76.33705947080871]
離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文 参考訳(メタデータ) (2023-10-25T17:59:12Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - Dirichlet Diffusion Score Model for Biological Sequence Generation [2.0910267321492926]
拡散生成モデルは、多くのアプリケーションでかなりの成功を収めた。
定常分布がディリクレ分布である確率単純空間で定義される拡散過程を導入する。
これにより、離散データのモデリングには連続空間での拡散が自然になる。
論文 参考訳(メタデータ) (2023-05-18T04:24:31Z) - Diffusion Probabilistic Model Based Accurate and High-Degree-of-Freedom
Metasurface Inverse Design [14.18549701990854]
メタマテリアルの設計に最適化アルゴリズムを用いた逆設計法が導入された。
メタマテリアルの逆設計にGAN(Generative Adversarial Networks)で表されるディープラーニング手法を適用した。
本稿では拡散確率理論に基づく新しいメタマテリアル逆設計法を提案する。
論文 参考訳(メタデータ) (2023-04-25T08:25:23Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - Towards Controllable Diffusion Models via Reward-Guided Exploration [15.857464051475294]
強化学習(RL)による拡散モデルの学習段階を導く新しい枠組みを提案する。
RLは、政策そのものではなく、指数スケールの報酬に比例したペイオフ分布からのサンプルによる政策勾配を計算することができる。
3次元形状と分子生成タスクの実験は、既存の条件拡散モデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-04-14T13:51:26Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。