論文の概要: DiffSDS: A language diffusion model for protein backbone inpainting
under geometric conditions and constraints
- arxiv url: http://arxiv.org/abs/2301.09642v1
- Date: Sun, 22 Jan 2023 05:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 15:05:38.610097
- Title: DiffSDS: A language diffusion model for protein backbone inpainting
under geometric conditions and constraints
- Title(参考訳): diffsds: 幾何学的条件と制約下でのタンパク質バックボーンインパインティングのための言語拡散モデル
- Authors: Zhangyang Gao, Cheng Tan, Stan Z. Li
- Abstract要約: 最近の研究は、タンパク質の構造をタンパク質の角度の配列として単純化することを約束している。
このような単純化は、モデルが未成熟のタンパク質に条件付けられた構造を復元する必要がある制約されたタンパク質の塗布問題には適さない。
言語モデルに隠れたtextbfatomic textbfdirection textbfADSを導入し、不変なバックボーン角を等価方向ベクトルに変換する。
実験によると、プラグアンドプレイのADSは、単純さを損なうことなく、言語モデルを強力な構造モデルに変換することができる。
- 参考スコア(独自算出の注目度): 37.937378787812264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Have you ever been troubled by the complexity and computational cost of SE(3)
protein structure modeling and been amazed by the simplicity and power of
language modeling? Recent work has shown promise in simplifying protein
structures as sequences of protein angles; therefore, language models could be
used for unconstrained protein backbone generation. Unfortunately, such
simplification is unsuitable for the constrained protein inpainting problem,
where the model needs to recover masked structures conditioned on unmasked
ones, as it dramatically increases the computing cost of geometric constraints.
To overcome this dilemma, we suggest inserting a hidden \textbf{a}tomic
\textbf{d}irection \textbf{s}pace (\textbf{ADS}) upon the language model,
converting invariant backbone angles into equivalent direction vectors and
preserving the simplicity, called Seq2Direct encoder ($\text{Enc}_{s2d}$).
Geometric constraints could be efficiently imposed on the newly introduced
direction space. A Direct2Seq decoder ($\text{Dec}_{d2s}$) with mathematical
guarantees is also introduced to develop a \textbf{SDS}
($\text{Enc}_{s2d}$+$\text{Dec}_{d2s}$) model. We apply the SDS model as the
denoising neural network during the conditional diffusion process, resulting in
a constrained generative model--\textbf{DiffSDS}. Extensive experiments show
that the plug-and-play ADS could transform the language model into a strong
structural model without loss of simplicity. More importantly, the proposed
DiffSDS outperforms previous strong baselines by a large margin on the task of
protein inpainting.
- Abstract(参考訳): SE(3)タンパク質構造モデリングの複雑さと計算コストに悩まされ、言語モデリングの単純さとパワーに驚いたことはありますか?
近年の研究では、タンパク質の構造をタンパク質の角度の配列として単純化することが期待されている。
残念なことに、そのような単純化は、構造的制約の計算コストを劇的に増大させるため、モデルがマスキングされた構造を復元する必要がある制約付きタンパク質塗布問題には適さない。
このジレンマを克服するために、言語モデル上に隠れた \textbf{a}tomic \textbf{d}irection \textbf{s}pace (\textbf{ADS}) を挿入し、不変なバックボーン角を等価な方向ベクトルに変換し、単純さを保つことを提案する。
幾何学的制約は新しく導入された方向空間に効率的に課すことができる。
数学的保証を持つ direct2seq decoder (\text{dec}_{d2s}$) もまた、 \textbf{sds} (\text{enc}_{s2d}$+$\text{dec}_{d2s}$) モデルを開発するために導入された。
本研究では,SDSモデルを条件拡散過程における認知ニューラルネットワークとして適用し,制約付き生成モデル--\textbf{DiffSDS} を導出する。
大規模な実験により、プラグアンドプレイのADSは、単純さを失うことなく、言語モデルを強力な構造モデルに変換することができた。
さらに重要なことは、提案されたDiffSDSは、タンパク質の塗布のタスクに大きなマージンで、以前の強いベースラインを上回ります。
関連論文リスト
- Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.561961365113554]
3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)に顕著な効果を示した
しかし、3DGSモデルはスパースポーズビューで訓練すると過度に適合する傾向にあり、その一般化能力は新規ビューに制限される。
オーバーフィッティング問題を緩和するために,Self-Ensembling Gaussian Splatting (SE-GS) アプローチを提案する。
提案手法は,NVSの品質向上に寄与し,既存の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-10-31T18:43:48Z) - Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。
我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。
我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2~3倍の高速化を実現した。
論文 参考訳(メタデータ) (2024-07-22T18:00:00Z) - FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。
学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文 参考訳(メタデータ) (2024-02-04T12:18:51Z) - Variational Diffusion Auto-encoder: Latent Space Extraction from
Pre-trained Diffusion Models [0.0]
可変オートエンコーダ(VAE)は、生成された画像の品質の問題に直面し、しばしば目立った曖昧さを示す。
この問題は、条件付きデータ分布を近似する非現実的な仮定である $p(textbfx | textbfz)$ が等方ガウス的であることに由来する。
本稿では,エンコーダを最適化することにより,既存の拡散モデルから潜在空間を抽出し,限界データのログ化を最大化する方法について述べる。
論文 参考訳(メタデータ) (2023-04-24T14:44:47Z) - Robust Empirical Risk Minimization with Tolerance [24.434720137937756]
我々は、(ロバストな)$textitempirical risk minimization$(RERM)の基本パラダイムについて研究する。
自然寛容なRERMは、$mathbbRd$を超える$gamma$-tolerantな学習VCクラスに十分であることを示す。
論文 参考訳(メタデータ) (2022-10-02T21:26:15Z) - Diffusion models as plug-and-play priors [98.16404662526101]
我々は、事前の$p(mathbfx)$と補助的な制約である$c(mathbfx,mathbfy)$からなるモデルにおいて、高次元データ$mathbfx$を推論する問題を考える。
拡散モデルの構造は,異なるノイズ量に富んだ定性デノナイジングネットワークを通じて,微分を反復することで近似推論を行うことができる。
論文 参考訳(メタデータ) (2022-06-17T21:11:36Z) - Towards improving discriminative reconstruction via simultaneous dense
and sparse coding [9.87575928269854]
スパース符号化モデルから抽出した識別的特徴は、分類と再構成において良好に機能することが示されている。
本稿では,表現能力と識別機能の両方を統合した,疎密かつ疎結合な符号化モデルを提案する。
論文 参考訳(メタデータ) (2020-06-16T21:53:20Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。