論文の概要: Q-BIOLAT: Binary Latent Protein Fitness Landscapes for QUBO-Based Optimization
- arxiv url: http://arxiv.org/abs/2603.27526v1
- Date: Sun, 29 Mar 2026 05:33:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.002695
- Title: Q-BIOLAT: Binary Latent Protein Fitness Landscapes for QUBO-Based Optimization
- Title(参考訳): Q-BIOLAT:QUBO最適化のための2成分潜在タンパク質繊維景観
- Authors: Truong-Son Hy,
- Abstract要約: Q-BIOLATは、コンパクトなバイナリ潜在空間におけるタンパク質のフィットネスランドスケープをモデル化し、最適化するためのフレームワークである。
この目的をQUBO形式で表現することで、現代の機械学習と離散的および量子的に着想を得た最適化を結びつける。
- 参考スコア(独自算出の注目度): 8.081417415802443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein fitness optimization is inherently a discrete combinatorial problem, yet most learning-based approaches rely on continuous representations and are primarily evaluated through predictive accuracy. We introduce Q-BIOLAT, a framework for modeling and optimizing protein fitness landscapes in compact binary latent spaces. Starting from pretrained protein language model embeddings, we construct binary latent representations and learn a quadratic unconstrained binary optimization (QUBO) surrogate that captures unary and pairwise interactions. Beyond its formulation, Q-BIOLAT provides a representation-centric perspective on protein fitness modeling. We show that representations with similar predictive performance can induce fundamentally different optimization landscapes. In particular, learned autoencoder-based representations collapse after binarization, producing degenerate latent spaces that fail to support combinatorial search, whereas simple structured representations such as PCA yield high-entropy, decodable, and optimization-friendly latent spaces. Across multiple datasets and data regimes, we demonstrate that classical combinatorial optimization methods, including simulated annealing, genetic algorithms, and greedy hill climbing, are highly effective in structured binary latent spaces. By expressing the objective in QUBO form, our approach connects modern machine learning with discrete and quantum-inspired optimization. Our implementation and dataset are publicly available at: https://github.com/HySonLab/Q-BIOLAT-Extended
- Abstract(参考訳): タンパク質の適合性最適化は本質的には離散的な組合せ問題であるが、ほとんどの学習ベースのアプローチは連続的な表現に依存し、主に予測精度によって評価される。
Q-BIOLATは、コンパクトなバイナリ潜在空間におけるタンパク質のフィットネスランドスケープをモデル化し、最適化するためのフレームワークである。
事前訓練されたタンパク質言語モデル埋め込みから始め、バイナリ潜在表現を構築し、一元的および対的な相互作用をキャプチャする二次的非制約バイナリ最適化(QUBO)を学習する。
定式化以外にも、Q-BIOLATはタンパク質の適合性モデリングにおける表現中心の視点を提供する。
類似した予測性能を持つ表現は、根本的に異なる最適化景観を導き出すことができることを示す。
特に、学習された自己エンコーダに基づく表現は双項化後に崩壊し、組合せ探索をサポートしない退化潜在空間が生成されるのに対し、PCAのような単純な構造化された表現は高エントロピー、退化可能、最適化に優しい潜在空間が得られる。
複数のデータセットやデータレギュレーションにわたって、シミュレーションアニーリング、遺伝的アルゴリズム、グリーディヒルクライミングを含む古典的な組合せ最適化手法が、構造化されたバイナリ潜在空間において非常に有効であることを示す。
この目的をQUBO形式で表現することで、現代の機械学習と離散的および量子的に着想を得た最適化を結びつける。
私たちの実装とデータセットは、https://github.com/HySonLab/Q-BIOLAT-Extendedで公開されています。
関連論文リスト
- Binary Latent Protein Fitness Landscapes for Quantum Annealing Optimization [8.081417415802443]
Q-BIOLAT(Q-BIOLAT)は,タンパク質の適合性環境をモデル化し,最適化するためのフレームワークである。
Q-BIOLATは、タンパク質の適合性ランドスケープにおいて有意義な構造を捉え、高適合性変異の同定を可能にする。
論文 参考訳(メタデータ) (2026-03-18T01:06:20Z) - Efficient Protein Optimization via Structure-aware Hamiltonian Dynamics [16.336540408998598]
HADESはハミルトニアン力学を利用したベイズ最適化法であり、構造対応の近似後部から効率的にサンプリングする。
このような連続状態系から離散的なタンパク質配列を提案するために、位置離散化手順を導入する。
実験により,本手法はシリコン内評価において最先端のベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-01-16T05:53:53Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - Joint Composite Latent Space Bayesian Optimization [15.262166538890243]
複合遅延空間ベイズ最適化(JoCo)について紹介する。
JoCoは、ニューラルネットワークエンコーダと確率モデルを共同でトレーニングし、高次元の入力空間と出力空間を、管理可能な潜在表現に適応的に圧縮する新しいフレームワークである。
これにより、圧縮された表現上で実行可能なBOが可能となり、JoCoは様々なシミュレートされた実世界の問題において、高次元BOにおける他の最先端の方法よりも優れている。
論文 参考訳(メタデータ) (2023-11-03T19:53:37Z) - Robust Model-Based Optimization for Challenging Fitness Landscapes [96.63655543085258]
タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:47:32Z) - A Pareto-optimal compositional energy-based model for sampling and
optimization of protein sequences [55.25331349436895]
深層生成モデルは、生命科学における逆問題に対する一般的な機械学習ベースのアプローチとして登場した。
これらの問題は、データ分布の学習に加えて、興味のある複数の特性を満たす新しい設計をサンプリングする必要があることが多い。
論文 参考訳(メタデータ) (2022-10-19T19:04:45Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Combining Latent Space and Structured Kernels for Bayesian Optimization
over Combinatorial Spaces [27.989924313988016]
我々は、高価なブラックボックス関数評価を用いて、空間(シーケンス、ツリー、グラフなど)を最適化する問題を考察する。
空間に対する最近のBOアプローチは、構造体の潜在表現を学習することで連続空間上のBOへの還元である。
本稿では,この欠点を克服するための原則的アプローチであるLADDERを提案する。
論文 参考訳(メタデータ) (2021-11-01T18:26:22Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。