論文の概要: Multi-segment preserving sampling for deep manifold sampler
- arxiv url: http://arxiv.org/abs/2205.04259v1
- Date: Mon, 9 May 2022 13:19:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 18:49:03.942760
- Title: Multi-segment preserving sampling for deep manifold sampler
- Title(参考訳): 深部マニホールドサンプラーのマルチセグメント保存サンプリング
- Authors: Daniel Berenberg, Jae Hyeon Lee, Simon Kelow, Ji Won Park, Andrew
Watkins, Vladimir Gligorijevi\'c, Richard Bonneau, Stephen Ra, Kyunghyun Cho
- Abstract要約: マルチセグメント保存サンプリングにより、ドメイン固有の知識を直接含めることができる。
我々は、IGHV1-18遺伝子にアノテートされた600万近い重鎖配列上の深い多様体サンプルとGPT-2言語モデルという2つのモデルを訓練する。
サンプルCDR3毎にGPT-2モデルからログ確率スコアを取得し,複数セグメント保存サンプリングが妥当な設計を生成することを示す。
- 参考スコア(独自算出の注目度): 40.88321000839884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep generative modeling for biological sequences presents a unique challenge
in reconciling the bias-variance trade-off between explicit biological insight
and model flexibility. The deep manifold sampler was recently proposed as a
means to iteratively sample variable-length protein sequences by exploiting the
gradients from a function predictor. We introduce an alternative approach to
this guided sampling procedure, multi-segment preserving sampling, that enables
the direct inclusion of domain-specific knowledge by designating preserved and
non-preserved segments along the input sequence, thereby restricting variation
to only select regions. We present its effectiveness in the context of antibody
design by training two models: a deep manifold sampler and a GPT-2 language
model on nearly six million heavy chain sequences annotated with the IGHV1-18
gene. During sampling, we restrict variation to only the
complementarity-determining region 3 (CDR3) of the input. We obtain log
probability scores from a GPT-2 model for each sampled CDR3 and demonstrate
that multi-segment preserving sampling generates reasonable designs while
maintaining the desired, preserved regions.
- Abstract(参考訳): 生物学的シーケンスのディープジェネレーティブモデリングは、明示的な生物学的洞察とモデルの柔軟性の間のバイアス分散トレードオフを調停するユニークな課題である。
deep manifold samplerは、関数予測器からの勾配を利用して可変長タンパク質配列を反復的にサンプリングする方法として最近提案されている。
本稿では,入力シーケンスに沿って保存されたセグメントと保存されていないセグメントを指定することにより,ドメイン固有の知識を直接包含できるマルチセグメン保存サンプリング手法を提案する。
IGHV1-18遺伝子にアノテートされた600万の重鎖配列上で, ディープ・多様体・サンプルラーとGPT-2言語モデルという2つのモデルを訓練することにより, 抗体設計の文脈での有効性を示す。
サンプリング中は,入力の相補性決定領域3(CDR3)のみに変動が制限される。
サンプルCDR3毎にGPT-2モデルからログ確率スコアを取得し,所望の保存領域を維持しつつ,複数セグメント保存サンプリングが合理的な設計を生成することを示す。
関連論文リスト
- Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling [22.256068524699472]
本研究では,これらの問題に対処するために,Annealed Importance Smpling (AIS)アプローチを提案する。
シークエンシャルモンテカルロサンプリング器とVIの強度を組み合わせることで、より広い範囲の後方分布を探索し、徐々にターゲット分布に接近する。
実験結果から,本手法はより厳密な変動境界,高い対数類似度,より堅牢な収束率で最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-13T08:09:05Z) - Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.14884528360199]
本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。
提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文 参考訳(メタデータ) (2024-07-11T16:46:04Z) - MTS-DVGAN: Anomaly Detection in Cyber-Physical Systems using a Dual
Variational Generative Adversarial Network [7.889342625283858]
深層生成モデルは、ラベル付き情報に頼ることなく、サイバー物理システム(CPS)の脆弱性を軽減し、新しいサイバー物理攻撃を検出することを約束している。
本稿では、MST-DVGANという、教師なし二重変分生成対向モデルを提案する。
中心となる概念は、再構成された異常サンプルと正常なサンプルとの区別を広げることで、モデルの識別能力を高めることである。
論文 参考訳(メタデータ) (2023-11-04T11:19:03Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - StyleGenes: Discrete and Efficient Latent Distributions for GANs [149.0290830305808]
GAN(Generative Adversarial Networks)のための離散潜在分布を提案する。
連続的な先行点から潜在ベクトルを描く代わりに、学習可能な潜在点の有限集合からサンプリングする。
私たちは生物の情報のエンコーディングからインスピレーションを得ます。
論文 参考訳(メタデータ) (2023-04-30T23:28:46Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Relaxed-Responsibility Hierarchical Discrete VAEs [3.976291254896486]
textitRelaxed-Responsibility Vector-Quantisationを導入する。
我々は、様々な標準データセットに対して、最先端のビット/ディミット結果を得る。
論文 参考訳(メタデータ) (2020-07-14T19:10:05Z) - Feature Transformation Ensemble Model with Batch Spectral Regularization
for Cross-Domain Few-Shot Classification [66.91839845347604]
特徴抽出ネットワークの後に多様な特徴変換を行うことにより,アンサンブル予測モデルを提案する。
我々は,事前学習中に特徴行列の特異値を抑制するために,バッチスペクトル正規化項を用い,モデルの一般化能力を向上させる。
提案したモデルは、ターゲット領域で微調整して、数発の分類に対処することができる。
論文 参考訳(メタデータ) (2020-05-18T05:31:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。