Fugu-MT 論文翻訳(概要): Sparse generative modeling via parameter-reduction of Boltzmann machines: application to protein-sequence families

論文の概要: Sparse generative modeling via parameter-reduction of Boltzmann machines: application to protein-sequence families

arxiv url: http://arxiv.org/abs/2011.11259v3
Date: Fri, 30 Jul 2021 08:27:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-22 03:21:42.670377
Title: Sparse generative modeling via parameter-reduction of Boltzmann machines: application to protein-sequence families
Title（参考訳）: ボルツマンマシンのパラメータ還元によるスパース生成モデリング:タンパク質配列ファミリーへの応用
Authors: Pierre Barrat-Charlaix, Anna Paola Muntoni, Kai Shimagaki, Martin Weigt, Francesco Zamponi
Abstract要約: ボルツマン機械(BM)は生成モデルとして広く使われている。 BMの一般パラメータ推論手法を提案する。いくつかのタンパク質ファミリーでは、PM結合の90%以上を除去することができる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Boltzmann machines (BM) are widely used as generative models. For example, pairwise Potts models (PM), which are instances of the BM class, provide accurate statistical models of families of evolutionarily related protein sequences. Their parameters are the local fields, which describe site-specific patterns of amino-acid conservation, and the two-site couplings, which mirror the coevolution between pairs of sites. This coevolution reflects structural and functional constraints acting on protein sequences during evolution. The most conservative choice to describe the coevolution signal is to include all possible two-site couplings into the PM. This choice, typical of what is known as Direct Coupling Analysis, has been successful for predicting residue contacts in the three-dimensional structure, mutational effects, and in generating new functional sequences. However, the resulting PM suffers from important over-fitting effects: many couplings are small, noisy and hardly interpretable; the PM is close to a critical point, meaning that it is highly sensitive to small parameter perturbations. In this work, we introduce a general parameter-reduction procedure for BMs, via a controlled iterative decimation of the less statistically significant couplings, identified by an information-based criterion that selects either weak or statistically unsupported couplings. For several protein families, our procedure allows one to remove more than $90\%$ of the PM couplings, while preserving the predictive and generative properties of the original dense PM, and the resulting model is far away from criticality, hence more robust to noise.
Abstract（参考訳）: ボルツマン機械(BM)は生成モデルとして広く使われている。例えば、BMクラスの例であるペアワイズポッツモデル(PM)は、進化的に関連付けられたタンパク質配列のファミリーの正確な統計モデルを提供する。それらのパラメータは、アミノ酸保存の部位特異的パターンを記述する局所体と、一対の部位間の共進化を反映する二部位結合である。この共進化は、進化中にタンパク質配列に作用する構造的および機能的制約を反映している。共進化シグナルを記述する最も保守的な選択は、PMに可能な2つの部位の結合を全て含むことである。直接結合解析(Direct Coupling Analysis)として知られるこの選択は、3次元構造における残基接触の予測、突然変異効果、新しい機能配列の生成に成功している。しかし、結果として得られるPMは重要な過剰適合効果に悩まされる:多くのカップリングは小さく、ノイズが少なく、解釈しにくい;PMは臨界点に近く、小さなパラメータの摂動に非常に敏感である。本稿では,弱結合か統計的結合かを選択する情報に基づく基準によって識別される,統計的に有意な結合の制御された反復決定を通じて,BMの一般パラメータ推論手順を導入する。いくつかのタンパク質ファミリーでは、元の高密度PMの予測的および生成的特性を保ちながら、90\%以上のPMカップリングを除去することができ、その結果のモデルは臨界から遠く離れており、ノイズに対してより堅牢である。

関連論文リスト

Dynamics-inspired Structure Hallucination for Protein-protein Interaction Modeling [60.57197355431804]
タンパク質とタンパク質の相互作用 (PPI) は生物学の中心的な課題である。深層学習は、このような変異の影響を予測することは約束されているが、2つの主要な制約によって妨げられている。本稿では,Refine-PPIという新しいフレームワークについて述べる。
論文参考訳（メタデータ） (2026-01-08T19:29:04Z)
Seek and You Shall Fold [0.0]
実験観測変数のほとんどの予測子は微分不可能であり、勾配に基づく条件付きサンプリングとは相容れない。これは特に核磁気共鳴において制限されており、化学シフトのような豊富なデータは生成的モデリングに直接統合することは困難である。本研究では, タンパク質生成モデルの非分化誘導のためのフレームワークを導入し, 遺伝的アルゴリズムを用いて, 連続拡散型ジェネレータとブラックボックスの目的を結合する。
論文参考訳（メタデータ） (2025-11-17T11:07:49Z)
S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.89086338778098]
タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文参考訳（メタデータ） (2025-11-10T11:57:47Z)
Evolutionary Profiles for Protein Fitness Prediction [45.945064429964084]
EvoIFは、配列構造表現を進化的信号と融合させ、ログノードスコアリングのキャリブレーションされた確率を得る。タンパク質Gym (217変異アッセイ; >2.5M変異株)について、EvoIFとそのMSA対応変異体は、トレーニング深度のわずか0.1%を使用しながら、最先端または競争的な性能を達成する。
論文参考訳（メタデータ） (2025-10-08T17:46:02Z)
Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文参考訳（メタデータ） (2025-06-26T09:05:38Z)
JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention [0.0]
残基の変化がタンパク質の安定性にどのように影響するかを理解することは機能的なタンパク質を設計するのに重要である。タンパク質言語モデル(PLM)の最近の進歩は、計算タンパク質分析に革命をもたらした。我々は PLM 由来の埋め込みと双方向のクロスアテンショントランスフォーマアーキテクチャを利用するディープラーニングフレームワーク JanusDDG を紹介する。
論文参考訳（メタデータ） (2025-04-04T09:02:32Z)
Generative Intervention Models for Causal Perturbation Modeling [80.72074987374141]
多くの応用において、システムのメカニズムが外部の摂動によって変更されるかは未定である。本稿では、これらの摂動特徴を原子間干渉による分布にマッピングする方法を学習する生成的介入モデル(GIM)を提案する。
論文参考訳（メタデータ） (2024-11-21T10:37:57Z)
Multiview Random Vector Functional Link Network for Predicting DNA-Binding Proteins [0.0]
本稿では,マルチビュー学習とニューラルネットワークアーキテクチャを融合したMvRVFL(Multiview random vector functional link)ネットワークを提案する。提案したMvRVFLモデルは、後期および初期融合の利点を組み合わせ、異なるビューをまたいだ明確な正規化パラメータを可能にする。 DBPデータセット上で提案したMvRVFLモデルの性能はベースラインモデルよりも優れており、その優れた効果を示している。
論文参考訳（メタデータ） (2024-09-04T10:14:17Z)
Mutagenesis screen to map the functions of parameters of Large Language Models [10.19684167876245]
我々は、Llama2-7bとZephyrの生物学的研究で用いられた手法に触発された変異原性スクリーンを用いた。表現型、特に重篤な結果をもたらす変異は、軸に沿って集結する傾向にあった。ゼファーでは、特定の突然変異は、記述的なアウトプットよりも詩的な、あるいは会話的な結果をもたらす。
論文参考訳（メタデータ） (2024-08-21T10:10:08Z)
Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文参考訳（メタデータ） (2024-05-16T03:53:21Z)
Beyond the Universal Law of Robustness: Sharper Laws for Random Features and Neural Tangent Kernels [14.186776881154127]
本稿では、ランダム特徴とニューラル・タンジェント・カーネル(NTK)の2つの設定における経験的リスク最小化に焦点を当てた。ランダムな特徴に対して、モデルが任意のパラメータ化の度合いに対してロバストであることは、普遍的ロバスト性法則から生じる必要条件が満たされている場合でも証明する。本研究の結果は, 合成および標準原型データセットの数値的証拠によって裏付けられている。
論文参考訳（メタデータ） (2023-02-03T09:58:31Z)
Noise-resilient Edge Modes on a Chain of Superconducting Qubits [103.93329374521808]
量子系の遺伝対称性は、それ以外は脆弱な状態を保護することができる。非局所マヨラナエッジモード(MEM)を$mathbbZ$パリティ対称性で表す一次元キックドイジングモデルを実装した。 MEMは、予熱機構により特定の対称性を破るノイズに対して弾力性があることが判明した。
論文参考訳（メタデータ） (2022-04-24T22:34:15Z)
Learning Generalized Gumbel-max Causal Mechanisms [31.64007831043909]
対物処理効果を推定する際のばらつきの最小化など,定量的な基準の下で最良となる因果メカニズムを選択することを論じる。興味のある問合せの分布に反実効果のばらつきやその他の損失を最小化するように訓練できることが示される。
論文参考訳（メタデータ） (2021-11-11T22:02:20Z)
Understanding Interlocking Dynamics of Cooperative Rationalization [90.6863969334526]
選択的合理化(Selective rationalization)は、ニューラルネットワークの出力を予測するのに十分な入力の小さなサブセットを見つけることによって、複雑なニューラルネットワークの予測を説明する。このような合理化パラダイムでは,モデルインターロックという大きな問題が浮かび上がっている。 A2Rと呼ばれる新しい合理化フレームワークを提案し、アーキテクチャに第3のコンポーネントを導入し、選択とは対照的にソフトアテンションによって駆動される予測器を提案する。
論文参考訳（メタデータ） (2021-10-26T17:39:18Z)
Estimation of Bivariate Structural Causal Models by Variational Gaussian Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文参考訳（メタデータ） (2021-09-06T14:52:58Z)
EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。 EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文参考訳（メタデータ） (2021-05-11T03:40:29Z)
Generative Capacity of Probabilistic Protein Sequence Models [0.0]
ポッツモデルと変分オートエンコーダ(VAEs)は、最近、生成タンパク質配列モデル(GPSMs)として人気を博している。 GPSMsが転移によって引き起こされる自然配列で観察される複雑な多重残基変異パターンを忠実に再現できるかどうかは現在不明である。我々は近年の3つのGPSMの「生成能力」を評価するための一連の統計データを開発した。
論文参考訳（メタデータ） (2020-12-03T21:59:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。