論文の概要: Monte Carlo Tree Diffusion with Multiple Experts for Protein Design
- arxiv url: http://arxiv.org/abs/2509.15796v1
- Date: Fri, 19 Sep 2025 09:24:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.101315
- Title: Monte Carlo Tree Diffusion with Multiple Experts for Protein Design
- Title(参考訳): 複数のタンパク質設計の専門家によるモンテカルロ木拡散
- Authors: Xuefeng Liu, Mingxuan Cao, Songhao Jiang, Xiao Luo, Xiaotian Duan, Mengdi Wang, Tobin R. Sosnick, Jinbo Xu, Rick Stevens,
- Abstract要約: マスク付き拡散モデルと木探索を統合したMCTD-MEを提案する。
自己回帰型プランナーとは異なり、MCTD-MEはロールアウトエンジンとして生物物理学的な拡散デノナイジングを使用している。
このフレームワークはモデルに依存しず、デノボタンパク質工学や多目的分子生成を含む逆フォールディングを越えて適用できる。
- 参考スコア(独自算出の注目度): 50.056670856059014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of protein design is to generate amino acid sequences that fold into functional structures with desired properties. Prior methods combining autoregressive language models with Monte Carlo Tree Search (MCTS) struggle with long-range dependencies and suffer from an impractically large search space. We propose MCTD-ME, Monte Carlo Tree Diffusion with Multiple Experts, which integrates masked diffusion models with tree search to enable multi-token planning and efficient exploration. Unlike autoregressive planners, MCTD-ME uses biophysical-fidelity-enhanced diffusion denoising as the rollout engine, jointly revising multiple positions and scaling to large sequence spaces. It further leverages experts of varying capacities to enrich exploration, guided by a pLDDT-based masking schedule that targets low-confidence regions while preserving reliable residues. We propose a novel multi-expert selection rule (PH-UCT-ME) extends predictive-entropy UCT to expert ensembles. On the inverse folding task (CAMEO and PDB benchmarks), MCTD-ME outperforms single-expert and unguided baselines in both sequence recovery (AAR) and structural similarity (scTM), with gains increasing for longer proteins and benefiting from multi-expert guidance. More generally, the framework is model-agnostic and applicable beyond inverse folding, including de novo protein engineering and multi-objective molecular generation.
- Abstract(参考訳): タンパク質設計の目標は、望ましい性質を持つ機能構造に折り畳まれたアミノ酸配列を生成することである。
オートレグレッシブ言語モデルとモンテカルロ木探索(MCTS)を組み合わせる以前の手法は、長距離依存に苦慮し、急激な大きな検索空間に悩まされていた。
MCTD-ME, Monte Carlo Tree Diffusion with Multiple Expertsを提案する。
自己回帰プランナーとは異なり、MCTD-MEはロールアウトエンジンとして生物物理フィデリティ強化拡散をデノナイズし、複数の位置を共同修正し、大きな配列空間に拡大する。
さらに、様々な能力の専門家を活用して、信頼性の高い残留物を保存しながら、低信頼領域をターゲットにしたpLDDTベースのマスキングスケジュールによって導かれる探索を強化する。
予測エントロピーUCTをエキスパートアンサンブルに拡張する新しいマルチエキスパート選択規則(PH-UCT-ME)を提案する。
逆フォールディングタスク(CAMEOとPDBベンチマーク)では、MCTD-MEは、配列回復(AAR)と構造類似性(scTM)の両方においてシングルエキスパートとアンガイドベースラインを上回り、長いタンパク質では増加し、マルチエキスパートガイダンスの恩恵を受ける。
より一般的に、このフレームワークはモデルに依存しず、デノボタンパク質工学や多目的分子生成を含む逆フォールディングを越えて適用できる。
関連論文リスト
- MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts [0.8292000624465587]
実世界の時系列は、グローバルな傾向、局所的な周期性、非定常的な体制を含む複雑なマルチスケール構造を示すことができる。
MoHETSはSparse Mixture-of-Heterogeneous-Expertsレイヤを統合している。
パラメータ重リニアプロジェクションヘッドを軽量な畳み込みパッチデコーダに置き換える。
論文 参考訳(メタデータ) (2026-01-29T15:35:26Z) - Swarms of Large Language Model Agents for Protein Sequence Design with Experimental Validation [0.9332987715848714]
大規模言語モデル(LLM)エージェントは並列に動作し、それぞれ特定の残基位置に割り当てられる。
この位置的、非集中的な調整は、多様で明確に定義されたシーケンスの創発的設計を可能にする。
提案手法は,数時間以内に効率よく客観的な設計を実現し,微調整や特殊訓練を行なわずに完全に動作させる。
論文 参考訳(メタデータ) (2025-11-27T10:42:52Z) - HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation [72.69742127579508]
最近の統一モデルでは、理解の専門家(LLMなど)と生成の専門家(拡散モデルなど)を統合している。
本研究では,非対称なH字型アーキテクチャであるHBridgeを提案する。
複数のベンチマークにわたる大規模な実験は、HBridgeの有効性と優れた性能を示している。
論文 参考訳(メタデータ) (2025-11-25T17:23:38Z) - ProtInvTree: Deliberate Protein Inverse Folding with Reward-guided Tree Search [77.55575655986252]
ProtInvTreeはタンパク質逆フォールディングのための報酬誘導ツリー検索フレームワークである。
シークエンス生成は、意図的に、ステップワイズな意思決定プロセスとして再構成される。
検索深度と幅を広げて、再トレーニングすることなく、フレキシブルなテストタイムスケーリングをサポートする。
論文 参考訳(メタデータ) (2025-06-01T09:34:20Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Monte Carlo Tree Diffusion for System 2 Planning [57.50512800900167]
モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文 参考訳(メタデータ) (2025-02-11T02:51:42Z) - PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion [2.6668932659159905]
治療ペプチドSMILESの同時生成と最適化のための多目的離散拡散モデルであるPepTuneを提案する。
拡散過程を導出するために,推測時間多目的誘導アルゴリズムであるモンテカルロツリーガイダンス(MCTG)を導入する。
PepTune を用いて, 多様な化学修飾ペプチドを同時に生成し, 複数の治療特性に最適化した。
論文 参考訳(メタデータ) (2024-12-23T18:38:49Z) - Multi-Head Mixture-of-Experts [100.60556163597946]
MH-MoE(Multi-Head Mixture-of-Experts)を提案する。
MH-MoEは、他のSMoE最適化手法の実装と分離が容易であり、性能向上のために他のSMoEモデルとの統合が容易である。
論文 参考訳(メタデータ) (2024-04-23T13:47:09Z) - Diffusion on language model encodings for protein sequence generation [0.5088559194265662]
DiMAは、タンパク質言語モデル表現で動作する潜伏拡散フレームワークである。
新規で高品質で多様なタンパク質配列を生産する。
これは、タンパク質ファミリーの生成、モチーフの足場と埋め込み、折りたたみ特異的な配列設計を含む条件付き生成タスクをサポートする。
論文 参考訳(メタデータ) (2024-03-06T14:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。