Fugu-MT 論文翻訳(概要): DiffSDS: A language diffusion model for protein backbone inpainting under geometric conditions and constraints

論文の概要: DiffSDS: A language diffusion model for protein backbone inpainting under geometric conditions and constraints

arxiv url: http://arxiv.org/abs/2301.09642v1
Date: Sun, 22 Jan 2023 05:07:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-25 15:05:38.610097
Title: DiffSDS: A language diffusion model for protein backbone inpainting under geometric conditions and constraints
Title（参考訳）: diffsds: 幾何学的条件と制約下でのタンパク質バックボーンインパインティングのための言語拡散モデル
Authors: Zhangyang Gao, Cheng Tan, Stan Z. Li
Abstract要約: 最近の研究は、タンパク質の構造をタンパク質の角度の配列として単純化することを約束している。このような単純化は、モデルが未成熟のタンパク質に条件付けられた構造を復元する必要がある制約されたタンパク質の塗布問題には適さない。言語モデルに隠れたtextbfatomic textbfdirection textbfADSを導入し、不変なバックボーン角を等価方向ベクトルに変換する。実験によると、プラグアンドプレイのADSは、単純さを損なうことなく、言語モデルを強力な構造モデルに変換することができる。
参考スコア（独自算出の注目度）: 37.937378787812264
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Have you ever been troubled by the complexity and computational cost of SE(3) protein structure modeling and been amazed by the simplicity and power of language modeling? Recent work has shown promise in simplifying protein structures as sequences of protein angles; therefore, language models could be used for unconstrained protein backbone generation. Unfortunately, such simplification is unsuitable for the constrained protein inpainting problem, where the model needs to recover masked structures conditioned on unmasked ones, as it dramatically increases the computing cost of geometric constraints. To overcome this dilemma, we suggest inserting a hidden \textbf{a}tomic \textbf{d}irection \textbf{s}pace (\textbf{ADS}) upon the language model, converting invariant backbone angles into equivalent direction vectors and preserving the simplicity, called Seq2Direct encoder ($\text{Enc}_{s2d}$). Geometric constraints could be efficiently imposed on the newly introduced direction space. A Direct2Seq decoder ($\text{Dec}_{d2s}$) with mathematical guarantees is also introduced to develop a \textbf{SDS} ($\text{Enc}_{s2d}$+$\text{Dec}_{d2s}$) model. We apply the SDS model as the denoising neural network during the conditional diffusion process, resulting in a constrained generative model--\textbf{DiffSDS}. Extensive experiments show that the plug-and-play ADS could transform the language model into a strong structural model without loss of simplicity. More importantly, the proposed DiffSDS outperforms previous strong baselines by a large margin on the task of protein inpainting.
Abstract（参考訳）: SE(3)タンパク質構造モデリングの複雑さと計算コストに悩まされ、言語モデリングの単純さとパワーに驚いたことはありますか? 近年の研究では、タンパク質の構造をタンパク質の角度の配列として単純化することが期待されている。残念なことに、そのような単純化は、構造的制約の計算コストを劇的に増大させるため、モデルがマスキングされた構造を復元する必要がある制約付きタンパク質塗布問題には適さない。このジレンマを克服するために、言語モデル上に隠れた \textbf{a}tomic \textbf{d}irection \textbf{s}pace (\textbf{ADS}) を挿入し、不変なバックボーン角を等価な方向ベクトルに変換し、単純さを保つことを提案する。幾何学的制約は新しく導入された方向空間に効率的に課すことができる。数学的保証を持つ direct2seq decoder (\text{dec}_{d2s}$) もまた、 \textbf{sds} (\text{enc}_{s2d}$+$\text{dec}_{d2s}$) モデルを開発するために導入された。本研究では,SDSモデルを条件拡散過程における認知ニューラルネットワークとして適用し,制約付き生成モデル--\textbf{DiffSDS} を導出する。大規模な実験により、プラグアンドプレイのADSは、単純さを失うことなく、言語モデルを強力な構造モデルに変換することができた。さらに重要なことは、提案されたDiffSDSは、タンパク質の塗布のタスクに大きなマージンで、以前の強いベースラインを上回ります。

関連論文リスト

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles [74.32932832937618]
幾何学的事前学習フレームワークであるtextbfRigidSSL$(textitRigidity-Aware Self-Supervised Learning$)を紹介した。フェーズI(RigidSSL-Perturb)は、AlphaFoldタンパク質構造データベースから432K構造から、シミュレートされた摂動を持つ幾何学的先行を学習する。フェーズII(RigidSSL-MD)は、1.3K分子動力学軌道上のこれらの表現を洗練し、物理的に現実的な遷移を捉える。
論文参考訳（メタデータ） (2026-03-02T21:32:30Z)
Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space [56.37266873329401]
大規模言語モデル (LLM) は、高度に一様でない情報密度を示す言語にもかかわらず、全てのトークンに一様計算を適用する。我々は,潜在表現から意味境界を学習し,トークンから推論がより効率的である圧縮概念空間へ移行する階層型言語モデリングフレームワークである$textbfDynamic Large Concept Models (DLCM)$を提案する。
論文参考訳（メタデータ） (2025-12-31T04:19:33Z)
Latent Iterative Refinement Flow: A Geometric-Constrained Approach for Few-Shot Generation [5.062604189239418]
少ショット生成に対する新しいアプローチであるLIRF(Latent Iterative Refinement Flow)を導入する。 LIRFは,新しいtextbfmanifold保存損失をトレーニングしたオートエンコーダを用いて,安定な潜伏空間を確立する。このサイクルの中で、候補サンプルは幾何的テクスチャ補正演算子によって洗練される。
論文参考訳（メタデータ） (2025-09-24T08:57:21Z)
Symmetry-Breaking Descent for Invariant Cost Functionals [0.0]
我々は,大域対称性群$GサブセットのMathrmDiff(M)$の下でコストが不変である場合,Sobolev-classシグナル$S$上で定義されるタスクコスト関数$W(S)$の削減問題を考察する。入力信号の明示的対称性を破る変形を構成するために,対称性構造を利用する変分法を提案する。
論文参考訳（メタデータ） (2025-05-19T15:06:31Z)
UniF$^2$ace: A Unified Fine-grained Face Understanding and Generation Model [62.66515621965686]
本稿では,2次元離散拡散(D3Diff)損失を伴う新しい理論枠組みを導入し,離散的なスコアマッチング拡散を伴うマスク付き生成モデルを統一する。このD3Diffは、テキスト入力に沿った高忠実度顔の詳細を合成するモデルの能力を大幅に向上させる。提案するUniF$2$aceD-1Mは,130Kの微細な画像キャプチャ対と100Mの視覚的質問応答対からなる大規模データセットである。
論文参考訳（メタデータ） (2025-03-11T07:34:59Z)
E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling [44.75336958712181]
We introduced E2Former, an equivariant and efficient transformer architecture that with the Wigner 6,j$ convolution (Wigner 6,j$ Conv) 計算負荷をエッジからノードにシフトすることで、Wigner 6j$ Convは複雑さを$O(|mathcalE|)$から$O(| MathcalV|)$に縮める。この開発は、スケーラブルで効率的な分子モデリングのための有望な方向を示唆する可能性がある。
論文参考訳（メタデータ） (2025-01-31T15:22:58Z)
Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.561961365113554]
3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)に顕著な効果を示したしかし、3DGSモデルはスパースポーズビューで訓練すると過度に適合する傾向にあり、その一般化能力は新規ビューに制限される。オーバーフィッティング問題を緩和するために,Self-Ensembling Gaussian Splatting (SE-GS) アプローチを提案する。提案手法は,NVSの品質向上に寄与し,既存の最先端手法よりも優れる。
論文参考訳（メタデータ） (2024-10-31T18:43:48Z)
Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。私たちのフレームワークは、3つの新しい目標のファミリーにつながります。 Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文参考訳（メタデータ） (2024-10-10T17:18:30Z)
Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2～3倍の高速化を実現した。
論文参考訳（メタデータ） (2024-07-22T18:00:00Z)
Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文参考訳（メタデータ） (2024-04-29T15:04:07Z)
FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文参考訳（メタデータ） (2024-02-04T12:18:51Z)
Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文参考訳（メタデータ） (2023-10-04T01:01:11Z)
Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文参考訳（メタデータ） (2023-07-11T16:51:38Z)
Variational Diffusion Auto-encoder: Latent Space Extraction from Pre-trained Diffusion Models [0.0]
可変オートエンコーダ(VAE)は、生成された画像の品質の問題に直面し、しばしば目立った曖昧さを示す。この問題は、条件付きデータ分布を近似する非現実的な仮定である $p(textbfx | textbfz)$ が等方ガウス的であることに由来する。本稿では,エンコーダを最適化することにより,既存の拡散モデルから潜在空間を抽出し,限界データのログ化を最大化する方法について述べる。
論文参考訳（メタデータ） (2023-04-24T14:44:47Z)
Robust Empirical Risk Minimization with Tolerance [24.434720137937756]
我々は、(ロバストな)$textitempirical risk minimization$(RERM)の基本パラダイムについて研究する。自然寛容なRERMは、$mathbbRd$を超える$gamma$-tolerantな学習VCクラスに十分であることを示す。
論文参考訳（メタデータ） (2022-10-02T21:26:15Z)
Diffusion models as plug-and-play priors [98.16404662526101]
我々は、事前の$p(mathbfx)$と補助的な制約である$c(mathbfx,mathbfy)$からなるモデルにおいて、高次元データ$mathbfx$を推論する問題を考える。拡散モデルの構造は,異なるノイズ量に富んだ定性デノナイジングネットワークを通じて,微分を反復することで近似推論を行うことができる。
論文参考訳（メタデータ） (2022-06-17T21:11:36Z)
Towards improving discriminative reconstruction via simultaneous dense and sparse coding [9.87575928269854]
スパース符号化モデルから抽出した識別的特徴は、分類と再構成において良好に機能することが示されている。本稿では,表現能力と識別機能の両方を統合した,疎密かつ疎結合な符号化モデルを提案する。
論文参考訳（メタデータ） (2020-06-16T21:53:20Z)
Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文参考訳（メタデータ） (2020-06-15T09:15:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。