論文の概要: Binary Latent Protein Fitness Landscapes for Quantum Annealing Optimization
- arxiv url: http://arxiv.org/abs/2603.17247v1
- Date: Wed, 18 Mar 2026 01:06:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.464396
- Title: Binary Latent Protein Fitness Landscapes for Quantum Annealing Optimization
- Title(参考訳): 量子アニーリング最適化のための2成分潜在タンパク質繊維のランドスケープ
- Authors: Truong-Son Hy,
- Abstract要約: Q-BIOLAT(Q-BIOLAT)は,タンパク質の適合性環境をモデル化し,最適化するためのフレームワークである。
Q-BIOLATは、タンパク質の適合性ランドスケープにおいて有意義な構造を捉え、高適合性変異の同定を可能にする。
- 参考スコア(独自算出の注目度): 8.081417415802443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose Q-BIOLAT, a framework for modeling and optimizing protein fitness landscapes in binary latent spaces. Starting from protein sequences, we leverage pretrained protein language models to obtain continuous embeddings, which are then transformed into compact binary latent representations. In this space, protein fitness is approximated using a quadratic unconstrained binary optimization (QUBO) model, enabling efficient combinatorial search via classical heuristics such as simulated annealing and genetic algorithms. On the ProteinGym benchmark, we demonstrate that Q-BIOLAT captures meaningful structure in protein fitness landscapes and enables the identification of high-fitness variants. Despite using a simple binarization scheme, our method consistently retrieves sequences whose nearest neighbors lie within the top fraction of the training fitness distribution, particularly under the strongest configurations. We further show that different optimization strategies exhibit distinct behaviors, with evolutionary search performing better in higher-dimensional latent spaces and local search remaining competitive in preserving realistic sequences. Beyond its empirical performance, Q-BIOLAT provides a natural bridge between protein representation learning and combinatorial optimization. By formulating protein fitness as a QUBO problem, our framework is directly compatible with emerging quantum annealing hardware, opening new directions for quantum-assisted protein engineering. Our implementation is publicly available at: https://github.com/HySonLab/Q-BIOLAT
- Abstract(参考訳): Q-BIOLAT(Q-BIOLAT)は,タンパク質の適合性環境をモデル化し,最適化するためのフレームワークである。
タンパク質配列から始めると、事前訓練されたタンパク質言語モデルを利用して連続的な埋め込みを取得し、それをコンパクトなバイナリ潜在表現に変換する。
この空間では、タンパク質の適合性は2次非拘束バイナリ最適化(QUBO)モデルを用いて近似され、シミュレートされたアニールや遺伝的アルゴリズムのような古典的ヒューリスティックスによる効率的な組合せ探索を可能にする。
タンパク質Gymベンチマークでは、Q-BIOLATがタンパク質フィットネスのランドスケープにおいて有意義な構造を捉え、高適合性の変異を識別できることが示されている。
簡単なバイナライズ方式を用いても,トレーニング適合度分布の最上位部分,特に最強構成下において近接する列を常に検索する。
さらに, 進化的探索は高次元の潜伏空間において優れ, 局所探索は実数列の保存において競争力を維持したままである。
実証的な性能の他に、Q-BIOLATはタンパク質表現学習と組合せ最適化の自然な橋渡しを提供する。
タンパク質の適合性をQUBO問題として定式化することにより、我々のフレームワークは新たな量子アニールハードウェアと直接互換性を持ち、量子アシストタンパク質工学の新しい方向性を開拓する。
私たちの実装は、https://github.com/HySonLab/Q-BIOLATで公開されています。
関連論文リスト
- SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers [50.18388227899971]
本稿では,SaProt TokenizationとDiffusion Transformer (DiT)アーキテクチャを統合することで,タンパク質のバックボーン生成を促進する新しいフレームワークであるSaDiTを提案する。
実験により、SaDiTはRFDiffusionやProteinaといった最先端モデルよりも計算速度と構造的生存性が優れていることが示された。
論文 参考訳(メタデータ) (2026-02-06T13:50:13Z) - Efficient Protein Optimization via Structure-aware Hamiltonian Dynamics [16.336540408998598]
HADESはハミルトニアン力学を利用したベイズ最適化法であり、構造対応の近似後部から効率的にサンプリングする。
このような連続状態系から離散的なタンパク質配列を提案するために、位置離散化手順を導入する。
実験により,本手法はシリコン内評価において最先端のベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-01-16T05:53:53Z) - Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。
これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。
生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文 参考訳(メタデータ) (2025-12-10T05:34:47Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - A Variational Perspective on Generative Protein Fitness Optimization [14.726139539370307]
本稿では,適合度最適化における変動的視点である変分潜時生成タンパク質最適化(VLGPO)を紹介する。
本手法は, タンパク質配列を連続潜伏空間に埋め込んで, 適合度分布からの効率的なサンプリングを可能にする。
VLGPOは、複雑さの異なる2つの異なるタンパク質ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2025-01-31T15:07:26Z) - Robust Optimization in Protein Fitness Landscapes Using Reinforcement Learning in Latent Space [13.228932754390748]
大規模タンパク質言語モデルを利用したエンコーダデコーダで学習した潜在空間を効率的にトラバースする最適化手法であるLatProtRLを提案する。
局所最適化を回避すべく, 遅延空間で直接作用する強化学習を用いてマルコフ決定過程をモデル化した。
この結果とin vitroでの評価は, 生成配列が高適合領域に到達できることを示し, ラボイン・ザ・ループシナリオにおけるLatProtRLの有意な可能性を示した。
論文 参考訳(メタデータ) (2024-05-29T11:03:42Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。