Fugu-MT 論文翻訳(概要): Protein Discovery with Discrete Walk-Jump Sampling

論文の概要: Protein Discovery with Discrete Walk-Jump Sampling

arxiv url: http://arxiv.org/abs/2306.12360v1
Date: Thu, 8 Jun 2023 17:03:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-26 01:09:19.835206
Title: Protein Discovery with Discrete Walk-Jump Sampling
Title（参考訳）: 離散ウォークジャンプサンプリングによるタンパク質発見
Authors: Nathan C. Frey, Daniel Berenberg, Karina Zadorozhny, Joseph Kleinhenz, Julien Lafrance-Vanasse, Isidro Hotzel, Yan Wu, Stephen Ra, Richard Bonneau, Kyunghyun Cho, Andreas Loukas, Vladimir Gligorijevic, Saeed Saremi
Abstract要約: 我々はスムーズなエネルギー関数を学び、ランゲヴィン・マルコフ連鎖モンテカルロの滑らかなデータ多様体からサンプリングし、一段階のデノイングで真のデータ多様体に投影する。我々の離散ウォーク・ジャンプサンプリング形式は、エネルギーベースモデルの最大可能性トレーニングとスコアベースモデルのサンプル品質の改善を組み合わせたものである。抗体タンパク質生成モデルにおける本手法のロバスト性を評価し, タンパク質生成モデルに分布整合性スコアを導入する。
参考スコア（独自算出の注目度）: 54.588524248466406
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We resolve difficulties in training and sampling from a discrete generative model by learning a smoothed energy function, sampling from the smoothed data manifold with Langevin Markov chain Monte Carlo (MCMC), and projecting back to the true data manifold with one-step denoising. Our Discrete Walk-Jump Sampling formalism combines the maximum likelihood training of an energy-based model and improved sample quality of a score-based model, while simplifying training and sampling by requiring only a single noise level. We evaluate the robustness of our approach on generative modeling of antibody proteins and introduce the distributional conformity score to benchmark protein generative models. By optimizing and sampling from our models for the proposed distributional conformity score, 97-100% of generated samples are successfully expressed and purified and 35% of functional designs show equal or improved binding affinity compared to known functional antibodies on the first attempt in a single round of laboratory experiments. We also report the first demonstration of long-run fast-mixing MCMC chains where diverse antibody protein classes are visited in a single MCMC chain.
Abstract（参考訳）: 離散生成モデルにおける学習とサンプリングの難しさは、滑らかなエネルギー関数を学習し、ランジュバン・マルコフ連鎖モンテカルロ(mcmc)で滑らかなデータ多様体からサンプリングし、一段階の分別で真のデータ多様体へ投影することで解決する。我々の離散ウォーク・ジャンプサンプリング形式は、エネルギーベースモデルの最大限のトレーニングとスコアベースモデルのサンプル品質の改善を組み合わせ、単一ノイズレベルのみを必要とするトレーニングとサンプリングを簡素化する。抗体タンパク質生成モデルにおける本手法のロバスト性を評価し,タンパク質生成モデルに分布整合性スコアを導入する。提案した分布適合度スコアをモデルから最適化・サンプリングすることにより, 97-100%のサンプルを正常に表現し精製し, 35%の官能基設計は, 実験1回実験において, 既知の官能基抗体と同等あるいは改善された結合親和性を示す。また,MCMC鎖に多種多様な抗体タンパク群が出現する長周期高速混合MCMCMC鎖の最初の実演も報告した。

関連論文リスト

Reinforced sequential Monte Carlo for amortised sampling [49.92678178064033]
我々は、最大エントロピー強化学習(MaxEnt RL)により訓練されたシーケンシャルモンテカルロ(SMC)とニューラルシーケンシャルサンプリングとの接続を述べる。本稿では,提案関数とツイスト関数の安定な連成訓練手法と,トレーニング信号のばらつきを低減するための適応重み付け方式について述べる。
論文参考訳（メタデータ） (2025-10-13T17:59:11Z)
Amortized Sampling with Transferable Normalizing Flows [65.48838168417564]
プロス(英: Prose)は、ペプチド分子動力学のコーパスで訓練された、最大8個の残基の移動可能な正規化フローである。本稿では, Prose が様々なサンプリングアルゴリズムの提案であることを示す。我々はProseデータセットをオープンソース化し、償却されたサンプリング手法と微調整目的の研究をさらに促進する。
論文参考訳（メタデータ） (2025-08-25T16:28:18Z)
Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文参考訳（メタデータ） (2025-06-11T06:01:39Z)
Parameter Expanded Stochastic Gradient Markov Chain Monte Carlo [32.46884330460211]
グラディエント・マルコフ・チェイン・モンテカルロにおけるサンプルの多様性を高めるための単純かつ効果的な手法を提案する。このアプローチはより多様なサンプルセットを生成し、同じ計算予算内でより高速な混合を可能にする。 OODのロバスト性,多様性,損失面の解析,ハミルトン・モンテカルロとの比較などの画像分類に関する実験は,提案手法の優位性を実証している。
論文参考訳（メタデータ） (2025-03-02T02:42:50Z)
CCS: Controllable and Constrained Sampling with Diffusion Models via Initial Noise Perturbation [9.12693573953231]
生成出力の変化と初期雑音摂動のスケールの関係は拡散ODEサンプリングにより非常に線形である。そこで我々は,新しい制御可能・制約付きサンプリング法 (CCS) と,所望の統計特性を持つ拡散モデルに対する新しい制御アルゴリズムを提案する。その結果, CCS法は, 優れた試料品質と多様性を維持しつつ, より精密にサンプリングを制御できることが示唆された。
論文参考訳（メタデータ） (2025-02-07T05:30:48Z)
The Unreasonable Effectiveness of Gaussian Score Approximation for Diffusion Models and its Applications [1.8416014644193066]
学習したニューラルスコアと2種類の抽出可能な分布のスコアを比較した。学習したニューラルスコアは、中等度から高雑音スケールに対する線形(ガウス)近似によって支配される。その結果,試料品質を維持しつつ,最初の15～30%のサンプリングステップをスキップできることがわかった。
論文参考訳（メタデータ） (2024-12-12T21:31:27Z)
Provable Statistical Rates for Consistency Diffusion Models [87.28777947976573]
最先端の性能にもかかわらず、拡散モデルは、多くのステップが伴うため、遅いサンプル生成で知られている。本稿では, 整合性モデルに関する最初の統計理論に寄与し, 分散不整合最小化問題としてトレーニングを定式化している。
論文参考訳（メタデータ） (2024-06-23T20:34:18Z)
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文参考訳（メタデータ） (2024-03-26T16:57:55Z)
Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.23137009609519]
反復Denoising Energy Matching (iDEM) iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。提案手法は,全測定値の最先端性能を達成し,2～5倍の速さでトレーニングを行う。
論文参考訳（メタデータ） (2024-02-09T01:11:23Z)
MCMC-Correction of Score-Based Diffusion Models for Model Composition [2.682859657520006]
拡散モデルは、スコアやエネルギー関数の観点からパラメータ化することができる。スコア関数の行積分に基づく新しいMH型受入規則を導入する。
論文参考訳（メタデータ） (2023-07-26T07:50:41Z)
Model ensemble instead of prompt fusion: a sample-specific knowledge transfer method for few-shot prompt tuning [85.55727213502402]
我々は、ソースタスクのソフトプロンプトから知識を伝達することで、プロンプトチューニングにおける数ショットのパフォーマンスを改善することに集中する。我々はソースモデル(SESoM)のサンプル固有アンサンブルを提案する。 SESoMは、ソースモデルが出力されるときに、ターゲットの各サンプルに対するソースモデルのコントリビューションを個別に調整することを学ぶ。
論文参考訳（メタデータ） (2022-10-23T01:33:16Z)
Selectively increasing the diversity of GAN-generated samples [8.980453507536017]
本稿では,GAN生成サンプルの多様性を選択的に向上する手法を提案する。本研究では,CERN における ALICE 実験のZero Degree Calorimeter から得られたデータをシミュレーションする実生活シナリオとともに,本手法の優位性を示す。
論文参考訳（メタデータ） (2022-07-04T16:27:06Z)
Reconstructing the Universe with Variational self-Boosted Sampling [7.922637707393503]
ハミルトニアン・モンテカルロ (HMC) のような伝統的なアルゴリズムは、相関サンプルを生成するために計算的に非効率である。本稿では,両アルゴリズムの欠点を軽減するために,変分自己ブーストサンプリング(VBS)と呼ばれるハイブリッド方式を開発する。 VBSは、単純なVIアプローチよりも優れた品質のサンプルを生成し、HMCのみを用いてサンプリングフェーズの相関長を10～50倍に削減する。
論文参考訳（メタデータ） (2022-06-28T21:30:32Z)
Learning a Restricted Boltzmann Machine using biased Monte Carlo sampling [0.6554326244334867]
マルコフ・チェイン・モンテカルロによる平衡分布のサンプリングはバイアスサンプリング法により劇的に加速できることを示す。また、このサンプリング手法を用いて、トレーニング中のログライクな勾配の計算を改善することも示している。
論文参考訳（メタデータ） (2022-06-02T21:29:01Z)
Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文参考訳（メタデータ） (2020-10-12T03:27:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。