論文の概要: DiffSDS: A language diffusion model for protein backbone inpainting
under geometric conditions and constraints
- arxiv url: http://arxiv.org/abs/2301.09642v1
- Date: Sun, 22 Jan 2023 05:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 15:05:38.610097
- Title: DiffSDS: A language diffusion model for protein backbone inpainting
under geometric conditions and constraints
- Title(参考訳): diffsds: 幾何学的条件と制約下でのタンパク質バックボーンインパインティングのための言語拡散モデル
- Authors: Zhangyang Gao, Cheng Tan, Stan Z. Li
- Abstract要約: 最近の研究は、タンパク質の構造をタンパク質の角度の配列として単純化することを約束している。
このような単純化は、モデルが未成熟のタンパク質に条件付けられた構造を復元する必要がある制約されたタンパク質の塗布問題には適さない。
言語モデルに隠れたtextbfatomic textbfdirection textbfADSを導入し、不変なバックボーン角を等価方向ベクトルに変換する。
実験によると、プラグアンドプレイのADSは、単純さを損なうことなく、言語モデルを強力な構造モデルに変換することができる。
- 参考スコア(独自算出の注目度): 37.937378787812264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Have you ever been troubled by the complexity and computational cost of SE(3)
protein structure modeling and been amazed by the simplicity and power of
language modeling? Recent work has shown promise in simplifying protein
structures as sequences of protein angles; therefore, language models could be
used for unconstrained protein backbone generation. Unfortunately, such
simplification is unsuitable for the constrained protein inpainting problem,
where the model needs to recover masked structures conditioned on unmasked
ones, as it dramatically increases the computing cost of geometric constraints.
To overcome this dilemma, we suggest inserting a hidden \textbf{a}tomic
\textbf{d}irection \textbf{s}pace (\textbf{ADS}) upon the language model,
converting invariant backbone angles into equivalent direction vectors and
preserving the simplicity, called Seq2Direct encoder ($\text{Enc}_{s2d}$).
Geometric constraints could be efficiently imposed on the newly introduced
direction space. A Direct2Seq decoder ($\text{Dec}_{d2s}$) with mathematical
guarantees is also introduced to develop a \textbf{SDS}
($\text{Enc}_{s2d}$+$\text{Dec}_{d2s}$) model. We apply the SDS model as the
denoising neural network during the conditional diffusion process, resulting in
a constrained generative model--\textbf{DiffSDS}. Extensive experiments show
that the plug-and-play ADS could transform the language model into a strong
structural model without loss of simplicity. More importantly, the proposed
DiffSDS outperforms previous strong baselines by a large margin on the task of
protein inpainting.
- Abstract(参考訳): SE(3)タンパク質構造モデリングの複雑さと計算コストに悩まされ、言語モデリングの単純さとパワーに驚いたことはありますか?
近年の研究では、タンパク質の構造をタンパク質の角度の配列として単純化することが期待されている。
残念なことに、そのような単純化は、構造的制約の計算コストを劇的に増大させるため、モデルがマスキングされた構造を復元する必要がある制約付きタンパク質塗布問題には適さない。
このジレンマを克服するために、言語モデル上に隠れた \textbf{a}tomic \textbf{d}irection \textbf{s}pace (\textbf{ADS}) を挿入し、不変なバックボーン角を等価な方向ベクトルに変換し、単純さを保つことを提案する。
幾何学的制約は新しく導入された方向空間に効率的に課すことができる。
数学的保証を持つ direct2seq decoder (\text{dec}_{d2s}$) もまた、 \textbf{sds} (\text{enc}_{s2d}$+$\text{dec}_{d2s}$) モデルを開発するために導入された。
本研究では,SDSモデルを条件拡散過程における認知ニューラルネットワークとして適用し,制約付き生成モデル--\textbf{DiffSDS} を導出する。
大規模な実験により、プラグアンドプレイのADSは、単純さを失うことなく、言語モデルを強力な構造モデルに変換することができた。
さらに重要なことは、提案されたDiffSDSは、タンパク質の塗布のタスクに大きなマージンで、以前の強いベースラインを上回ります。
関連論文リスト
- Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文 参考訳(メタデータ) (2023-10-04T01:01:11Z) - SE(3)-Stochastic Flow Matching for Protein Backbone Generation [54.951832422425454]
本稿では,3textD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルについて紹介する。
我々のモデルは、タンパク質の生成的モデリングに対するこれまでのアプローチに対して、いくつかの重要な利点を提供している。
論文 参考訳(メタデータ) (2023-10-03T19:24:24Z) - Variational Diffusion Auto-encoder: Latent Space Extraction from
Pre-trained Diffusion Models [0.0]
可変オートエンコーダ(VAE)は、生成された画像の品質の問題に直面し、しばしば目立った曖昧さを示す。
この問題は、条件付きデータ分布を近似する非現実的な仮定である $p(textbfx | textbfz)$ が等方ガウス的であることに由来する。
本稿では,エンコーダを最適化することにより,既存の拡散モデルから潜在空間を抽出し,限界データのログ化を最大化する方法について述べる。
論文 参考訳(メタデータ) (2023-04-24T14:44:47Z) - Robust Empirical Risk Minimization with Tolerance [24.434720137937756]
我々は、(ロバストな)$textitempirical risk minimization$(RERM)の基本パラダイムについて研究する。
自然寛容なRERMは、$mathbbRd$を超える$gamma$-tolerantな学習VCクラスに十分であることを示す。
論文 参考訳(メタデータ) (2022-10-02T21:26:15Z) - Confident Adaptive Language Modeling [95.45272377648773]
CALMは、入力と生成時間ごとに異なる量の計算を動的に割り当てるフレームワークである。
ハイパフォーマンスを確実に維持しつつ、計算能力、潜在的スピードアップを最大3ドルまで削減する上で、我々のフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-14T17:00:19Z) - Diffusion models as plug-and-play priors [98.16404662526101]
我々は、事前の$p(mathbfx)$と補助的な制約である$c(mathbfx,mathbfy)$からなるモデルにおいて、高次元データ$mathbfx$を推論する問題を考える。
拡散モデルの構造は,異なるノイズ量に富んだ定性デノナイジングネットワークを通じて,微分を反復することで近似推論を行うことができる。
論文 参考訳(メタデータ) (2022-06-17T21:11:36Z) - Towards improving discriminative reconstruction via simultaneous dense
and sparse coding [9.87575928269854]
スパース符号化モデルから抽出した識別的特徴は、分類と再構成において良好に機能することが示されている。
本稿では,表現能力と識別機能の両方を統合した,疎密かつ疎結合な符号化モデルを提案する。
論文 参考訳(メタデータ) (2020-06-16T21:53:20Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。