論文の概要: Swarms of Large Language Model Agents for Protein Sequence Design with Experimental Validation
- arxiv url: http://arxiv.org/abs/2511.22311v1
- Date: Thu, 27 Nov 2025 10:42:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.515144
- Title: Swarms of Large Language Model Agents for Protein Sequence Design with Experimental Validation
- Title(参考訳): 実験検証によるタンパク質配列設計のための大規模言語モデルエージェントの群集
- Authors: Fiona Y. Wang, Di Sheng Lee, David L. Kaplan, Markus J. Buehler,
- Abstract要約: 大規模言語モデル(LLM)エージェントは並列に動作し、それぞれ特定の残基位置に割り当てられる。
この位置的、非集中的な調整は、多様で明確に定義されたシーケンスの創発的設計を可能にする。
提案手法は,数時間以内に効率よく客観的な設計を実現し,微調整や特殊訓練を行なわずに完全に動作させる。
- 参考スコア(独自算出の注目度): 0.9332987715848714
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Designing proteins de novo with tailored structural, physicochemical, and functional properties remains a grand challenge in biotechnology, medicine, and materials science, due to the vastness of sequence space and the complex coupling between sequence, structure, and function. Current state-of-the-art generative methods, such as protein language models (PLMs) and diffusion-based architectures, often require extensive fine-tuning, task-specific data, or model reconfiguration to support objective-directed design, thereby limiting their flexibility and scalability. To overcome these limitations, we present a decentralized, agent-based framework inspired by swarm intelligence for de novo protein design. In this approach, multiple large language model (LLM) agents operate in parallel, each assigned to a specific residue position. These agents iteratively propose context-aware mutations by integrating design objectives, local neighborhood interactions, and memory and feedback from previous iterations. This position-wise, decentralized coordination enables emergent design of diverse, well-defined sequences without reliance on motif scaffolds or multiple sequence alignments, validated with experiments on proteins with alpha helix and coil structures. Through analyses of residue conservation, structure-based metrics, and sequence convergence and embeddings, we demonstrate that the framework exhibits emergent behaviors and effective navigation of the protein fitness landscape. Our method achieves efficient, objective-directed designs within a few GPU-hours and operates entirely without fine-tuning or specialized training, offering a generalizable and adaptable solution for protein design. Beyond proteins, the approach lays the groundwork for collective LLM-driven design across biomolecular systems and other scientific discovery tasks.
- Abstract(参考訳): 構造、物理化学的、機能的性質を調整したタンパク質を設計することは、配列空間の広さと配列、構造、機能の間の複雑な結合のため、バイオテクノロジー、医学、材料科学において大きな課題である。
タンパク質言語モデル(PLM)や拡散型アーキテクチャ(拡散型アーキテクチャ)のような現在の最先端の生成手法は、しばしば、オブジェクト指向設計をサポートするために、広範囲な微調整、タスク固有のデータ、またはモデル再構成を必要とするため、柔軟性とスケーラビリティが制限される。
これらの制約を克服するために、我々は、de novoタンパク質設計のためのswarmインテリジェンスにインスパイアされた分散エージェントベースのフレームワークを提案する。
このアプローチでは、複数の大規模言語モデル(LLM)エージェントが並列に動作し、それぞれが特定の残基位置に割り当てられる。
これらのエージェントは、設計目的、局所的な近隣相互作用、および以前のイテレーションからのメモリとフィードバックを統合することで、文脈認識突然変異を反復的に提案する。
この位置的、分散的な調整は、αヘリックスとコイル構造を持つタンパク質の実験で検証されたモチーフの足場や複数の配列アライメントに依存することなく、多様で明確に定義された配列の創発的設計を可能にする。
残余保存,構造に基づくメトリクス,シーケンス収束および埋め込みの解析を通じて,本フレームワークがタンパク質のフィットネスランドスケープの創発的挙動と効果的なナビゲーションを示すことを実証した。
提案手法は,数時間以内に効率よく客観的な設計を実現し,微調整や特殊訓練を行なわずに完全に動作し,タンパク質設計のための汎用的で適応的なソリューションを提供する。
タンパク質以外にも、このアプローチは生体分子系や他の科学的発見タスクにまたがるLCM駆動設計の基盤となる。
関連論文リスト
- UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - A Model-Centric Review of Deep Learning for Protein Design [0.0]
ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。
ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。
最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文 参考訳(メタデータ) (2025-02-26T14:31:21Z) - OneProt: Towards Multi-Modal Protein Foundation Models [6.9092913261646345]
我々は、構造、シーケンス、テキスト、結合サイトデータを統合したタンパク質のためのマルチモーダルAIであるOneProtを紹介する。
ImageBindフレームワークを使用して、OneProtは軽量な微調整方式でタンパク質モダリティエンコーダの潜在空間を整列する。
この研究はマルチモーダルタンパク質モデルの地平線を広げ、薬物発見、生物触媒反応計画、タンパク質工学における変革的応用の道を開く。
論文 参考訳(メタデータ) (2024-11-07T16:54:54Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Generative Pretrained Autoregressive Transformer Graph Neural Network
applied to the Analysis and Discovery of Novel Proteins [0.0]
本稿では,タンパク質モデリングにおける複雑な前方および逆問題を解決するために,フレキシブル言語モデルに基づくディープラーニング戦略を適用した。
本モデルを用いて, 二次構造含量(残量レベル, 全体含量), タンパク質溶解度, シークエンシングタスクの予測を行った。
追加タスクを追加することで、モデルが全体的なパフォーマンスを改善するために活用する創発的なシナジーが得られることが分かりました。
論文 参考訳(メタデータ) (2023-05-07T12:30:24Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。