論文の概要: Seek and You Shall Fold
- arxiv url: http://arxiv.org/abs/2511.13244v1
- Date: Mon, 17 Nov 2025 11:07:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.145797
- Title: Seek and You Shall Fold
- Title(参考訳): Seek and You Shall Fold
- Authors: Nadav Bojan Sellam, Meital Bojan, Paul Schanda, Alex Bronstein,
- Abstract要約: 実験観測変数のほとんどの予測子は微分不可能であり、勾配に基づく条件付きサンプリングとは相容れない。
これは特に核磁気共鳴において制限されており、化学シフトのような豊富なデータは生成的モデリングに直接統合することは困難である。
本研究では, タンパク質生成モデルの非分化誘導のためのフレームワークを導入し, 遺伝的アルゴリズムを用いて, 連続拡散型ジェネレータとブラックボックスの目的を結合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate protein structures are essential for understanding biological function, yet incorporating experimental data into protein generative models remains a major challenge. Most predictors of experimental observables are non-differentiable, making them incompatible with gradient-based conditional sampling. This is especially limiting in nuclear magnetic resonance, where rich data such as chemical shifts are hard to directly integrate into generative modeling. We introduce a framework for non-differentiable guidance of protein generative models, coupling a continuous diffusion-based generator with any black-box objective via a tailored genetic algorithm. We demonstrate its effectiveness across three modalities: pairwise distance constraints, nuclear Overhauser effect restraints, and for the first time chemical shifts. These results establish chemical shift guided structure generation as feasible, expose key weaknesses in current predictors, and showcase a general strategy for incorporating diverse experimental signals. Our work points toward automated, data-conditioned protein modeling beyond the limits of differentiability.
- Abstract(参考訳): 正確なタンパク質構造は生物学的機能を理解するのに不可欠であるが、実験データをタンパク質生成モデルに組み込むことは大きな課題である。
実験観測変数のほとんどの予測子は微分不可能であり、勾配に基づく条件付きサンプリングとは相容れない。
これは特に核磁気共鳴において制限されており、化学シフトのような豊富なデータは生成的モデリングに直接統合することは困難である。
本研究では, タンパク質生成モデルの非分化誘導のためのフレームワークを導入し, 遺伝的アルゴリズムを用いて, 連続拡散型ジェネレータとブラックボックスの目的を結合する。
本研究は, 対距離制約, 核オーバーハウザー効果抑制, 化学シフトの3つのモードで有効性を示す。
これらの結果は、化学シフト誘導構造生成を実現可能として確立し、現在の予測器の鍵となる弱点を明らかにし、多様な実験信号を組み込むための一般的な戦略を示す。
我々の研究は、差別化の限界を超えて、自動化されたデータ条件付きタンパク質モデリングを目指しています。
関連論文リスト
- Demystify Protein Generation with Hierarchical Conditional Diffusion Models [17.174551222714722]
本稿では,特定の機能によって誘導される効率的なエンド・ツー・エンドタンパク質設計のための新しい条件付き拡散モデルを提案する。
異なるレベルの表現を同時に生成することにより、我々のフレームワークは、異なるレベルの階層関係を効果的にモデル化することができる。
また,生成したタンパク質の品質を評価するため,新しい信頼性評価指標であるProtein-MMDを提案する。
論文 参考訳(メタデータ) (2025-07-24T17:34:02Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [63.592664795493725]
NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。
内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。
NOBLEは、その一般化を実際の実験データで検証する最初の大規模ディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2025-06-05T01:01:18Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Large-Scale Multi-omic Biosequence Transformers for Modeling Protein-Nucleic Acid Interactions [4.36852565205713]
OmniBioTEは,250億以上のタンパク質と核酸を混合したトークンをトレーニングした,オープンソースのマルチオミックモデルである。
我々は,OmbiBioTEが与えられた核酸とタンパク質の結合相互作用のギブス自由エネルギーの変化を予測できることを示す。
論文 参考訳(メタデータ) (2024-08-29T03:56:40Z) - Data-Error Scaling Laws in Machine Learning on Combinatorial Mutation-prone Sets: Proteins and Small Molecules [0.0]
本研究では、離散空間で訓練された機械学習モデルのデータエラースケーリング法則の傾向について検討する。
典型的なデータエラースケーリング法とは対照的に,学習中に不連続なモノトニック相転移がみられた。
学習曲線を正規化するための代替戦略を提案し,ミュータントに基づくシャッフルの概念を導入する。
論文 参考訳(メタデータ) (2024-05-08T16:04:50Z) - Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics [44.97217246897902]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - SESNet: sequence-structure feature-integrated deep learning method for
data-efficient protein engineering [6.216757583450049]
タンパク質変異体の適合度を予測するための教師付きディープラーニングモデルであるSESNetを開発した。
SESNetは,シーケンスと関数の関係を予測するための最先端モデルよりも優れていることを示す。
我々のモデルは、タンパク質変異体の適合性の予測において、特に高次変異体に対して驚くほど高い精度を達成することができる。
論文 参考訳(メタデータ) (2022-12-29T01:49:52Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。