論文の概要: Boltzmann Machine Learning with a Parallel, Persistent Markov chain Monte Carlo method for Estimating Evolutionary Fields and Couplings from a Protein Multiple Sequence Alignment
- arxiv url: http://arxiv.org/abs/2604.18022v1
- Date: Mon, 20 Apr 2026 09:48:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.793496
- Title: Boltzmann Machine Learning with a Parallel, Persistent Markov chain Monte Carlo method for Estimating Evolutionary Fields and Couplings from a Protein Multiple Sequence Alignment
- Title(参考訳): Boltzmann Machine Learning with a Parallel, Persistent Markov chain Monte Carlo method for Estimation Evolutionary Fields and Couplings from a protein Multiple Sequence Alignment (特集:ユビキタスコンピューティング)
- Authors: Sanzo Miyazawa,
- Abstract要約: 進化的単一部位場とタンパク質配列の対結合を推定するための逆ポッツ問題について検討した。
ボルツマン機械法は計算集約的であるが、ここで用いられる。
並列で永続的なマルコフ連鎖モンテカルロ法は、一点分布と対辺分布を推定するために用いられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The inverse Potts problem for estimating evolutionary single-site fields and pairwise couplings in homologous protein sequences from their single-site and pairwise amino acid frequencies observed in their multiple sequence alignment would be still one of useful methods in the studies of protein structure and evolution. Since the reproducibility of fields and couplings are the most important, the Boltzmann machine method is employed here, although it is computationally intensive. In order to reduce computational time required for the Boltzmann machine, parallel, persistent Markov chain Monte Carlo method is employed to estimate the single-site and pairwise marginal distributions in each learning step. Also, stochastic gradient descent methods are used to reduce computational time for each learning. Another problem is how to adjust the values of hyperparameters; there are two regularization parameters for evolutionary fields and couplings. The precision of contact residue pair prediction is often used to adjust the hyperparameters. However, it is not sensitive to these regularization parameters. Here, they are adjusted for the fields and couplings to satisfy a specific condition that is appropriate for protein conformations. This method has been applied to eight protein families.
- Abstract(参考訳): 逆ポッツ問題(Potts problem)は、タンパク質の構造と進化の研究において有用な方法の1つである。
場と結合の再現性が最も重要なので、ボルツマン機械法は計算集約的であるが、ここで用いられる。
ボルツマンマシンに必要な計算時間を短縮するために, 並列かつ永続的なマルコフ連鎖モンテカルロ法を用いて, 各学習ステップにおける一点分布と対辺分布を推定する。
また、確率勾配降下法を用いて各学習の計算時間を短縮する。
もう一つの問題はハイパーパラメータの値を調整する方法であり、進化場と結合の正規化パラメータが2つある。
接触残差対予測の精度は、しばしばハイパーパラメータの調整に使用される。
しかし、これらの正規化パラメータには敏感ではない。
ここでは、タンパク質のコンフォメーションに適した特定の条件を満たすために、フィールドとカップリングが調整される。
この方法は8つのタンパク質ファミリーに適用されている。
関連論文リスト
- Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Variance-Reducing Couplings for Random Features [57.73648780299374]
ランダム機能(RF)は、機械学習においてカーネルメソッドをスケールアップする一般的なテクニックである。
ユークリッド空間と離散入力空間の両方で定義されるRFを改善するための結合を求める。
パラダイムとしての分散還元の利点と限界について、驚くほどの結論に達した。
論文 参考訳(メタデータ) (2024-05-26T12:25:09Z) - Self-Tuning Hamiltonian Monte Carlo for Accelerated Sampling [12.163119957680802]
ハミルトニアンモンテカルロシミュレーションは、積分の時間ステップと積分の回数に大きく依存する。
このようなパラメータを自動的に調整する適応型汎用フレームワークを提案する。
損失と自己相関時間との良好な対応が確立できることを示す。
論文 参考訳(メタデータ) (2023-09-24T09:35:25Z) - Pairing interacting protein sequences using masked language modeling [0.3222802562733787]
配列アライメントに基づいて訓練されたタンパク質言語モデルを用いて相互作用するタンパク質配列をペア化する手法を開発した。
我々は、MSAトランスフォーマーが、周囲のコンテキストを用いて複数の配列アライメントでマスクされたアミノ酸を埋める能力を利用する。
単一チェーンデータでトレーニングされている間に、チェーン間の共進化をキャプチャできることが示されています。
論文 参考訳(メタデータ) (2023-08-14T13:42:09Z) - Simulating scalar field theories on quantum computers with limited
resources [62.997667081978825]
量子ビットコンピュータ上での格子スカラー場理論を実装するための量子アルゴリズムを提案する。
このアルゴリズムは、通常の対称性相と壊れた対称性相の両方において、幅広い入力パラメータの効率的な$phi4$状態の準備を可能にする。
論文 参考訳(メタデータ) (2022-10-14T17:28:15Z) - Scalable Variational Gaussian Processes via Harmonic Kernel
Decomposition [54.07797071198249]
汎用性を維持しつつ高い忠実度近似を提供する,スケーラブルな変分ガウス過程近似を導入する。
様々な回帰問題や分類問題において,本手法は変換やリフレクションなどの入力空間対称性を活用できることを実証する。
提案手法は, 純粋なGPモデルのうち, CIFAR-10 の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-10T18:17:57Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - The Connection between Discrete- and Continuous-Time Descriptions of
Gaussian Continuous Processes [60.35125735474386]
我々は、一貫した推定子をもたらす離散化が粗粒化下での不変性を持つことを示す。
この結果は、導関数再構成のための微分スキームと局所時間推論アプローチの組み合わせが、2次または高次微分方程式の時系列解析に役立たない理由を説明する。
論文 参考訳(メタデータ) (2021-01-16T17:11:02Z) - Sparse generative modeling via parameter-reduction of Boltzmann
machines: application to protein-sequence families [0.0]
ボルツマン機械(BM)は生成モデルとして広く使われている。
BMの一般パラメータ推論手法を提案する。
いくつかのタンパク質ファミリーでは、PM結合の90%以上を除去することができる。
論文 参考訳(メタデータ) (2020-11-23T08:01:09Z) - Certified and fast computations with shallow covariance kernels [0.0]
パラメータ化された共分散演算子の族を低ランクで近似するアルゴリズムを新たに導入し,解析する。
提案アルゴリズムは,パラメータ依存確率場に対する高速サンプリング法の基礎を提供する。
論文 参考訳(メタデータ) (2020-01-24T20:28:05Z) - Boltzmann machine learning and regularization methods for inferring evolutionary fields and couplings from a multiple sequence alignment [0.0]
ボルツマン機械学習における相互作用を推論するための正規化と学習法について検討する。
2つの正規化パラメータは、進化エネルギーのサンプル平均とアンサンブル平均の両方に等しい値を与えるように調整される。
アダム法はスパース結合の勾配に比例したステップ化をするために修正される。
論文 参考訳(メタデータ) (2019-09-10T08:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。