論文の概要: Enhancing Safe and Controllable Protein Generation via Knowledge Preference Optimization
- arxiv url: http://arxiv.org/abs/2507.10923v1
- Date: Tue, 15 Jul 2025 02:30:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.957473
- Title: Enhancing Safe and Controllable Protein Generation via Knowledge Preference Optimization
- Title(参考訳): 知識選好最適化による安全・制御可能なタンパク質生成の促進
- Authors: Yuhao Wang, Keyan Ding, Kehua Feng, Zeyuan Wang, Ming Qin, Xiaotong Li, Qiang Zhang, Huajun Chen,
- Abstract要約: 本稿では,有害タンパク質の発生リスクを最小限に抑えるために,タンパク質安全知識グラフを通じて事前知識を統合する枠組みを提案する。
実験により,KPOは高機能を維持しながら有害な配列を生成する可能性を効果的に低下させることが示された。
- 参考スコア(独自算出の注目度): 38.16596343856071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein language models have emerged as powerful tools for sequence generation, offering substantial advantages in functional optimization and denovo design. However, these models also present significant risks of generating harmful protein sequences, such as those that enhance viral transmissibility or evade immune responses. These concerns underscore critical biosafety and ethical challenges. To address these issues, we propose a Knowledge-guided Preference Optimization (KPO) framework that integrates prior knowledge via a Protein Safety Knowledge Graph. This framework utilizes an efficient graph pruning strategy to identify preferred sequences and employs reinforcement learning to minimize the risk of generating harmful proteins. Experimental results demonstrate that KPO effectively reduces the likelihood of producing hazardous sequences while maintaining high functionality, offering a robust safety assurance framework for applying generative models in biotechnology.
- Abstract(参考訳): タンパク質言語モデルはシーケンス生成の強力なツールとして登場し、機能最適化とデノボ設計において大きな利点をもたらしている。
しかし、これらのモデルはまた、ウイルスの感染性を高めたり免疫反応を回避したりするような有害なタンパク質配列を発生させる重大なリスクも示している。
これらの懸念は、重要な生物安全と倫理的課題を浮き彫りにした。
これらの課題に対処するために、タンパク質安全知識グラフを介して事前知識を統合する知識誘導型優先度最適化(KPO)フレームワークを提案する。
このフレームワークは、効率的なグラフ解析戦略を利用して、好ましい配列を同定し、有害なタンパク質を発生させるリスクを最小限に抑えるために強化学習を利用する。
実験により,KPOは高機能を維持しながら有害な配列を生成する可能性を効果的に低減し,バイオテクノロジーに生成モデルを適用するための堅牢な安全性保証フレームワークを提供することが示された。
関連論文リスト
- AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [67.46408900570657]
本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文 参考訳(メタデータ) (2025-07-11T17:02:25Z) - ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - Lattice Protein Folding with Variational Annealing [2.164205569823082]
本稿では,2次元疎水性多孔体(HP)格子タンパク質の折りたたみにおける低エネルギー折りたたみの同定にマスキングを用いた新しいトレーニング手法を提案する。
本研究は,複雑なタンパク質の折り畳み問題に対処するための高度な機械学習技術の可能性を強調した。
論文 参考訳(メタデータ) (2025-02-28T01:30:15Z) - Controllable Protein Sequence Generation with LLM Preference Optimization [19.28325662879149]
我々はCtrlProtと呼ばれる新しい制御可能なタンパク質設計法を提案する。
実験により、CtrlProtは機能と構造安定性の要求を効果的に満たせることが示された。
論文 参考訳(メタデータ) (2025-01-25T00:59:12Z) - Beyond ESM2: Graph-Enhanced Protein Sequence Modeling with Efficient Clustering [24.415612744612773]
タンパク質は生命の過程に必須であり、進化と多様性を支えている。
シークエンシング技術の進歩により数百万のタンパク質が明らかにされ、生物学的分析とAI開発のための高度な事前学習されたタンパク質モデルの必要性が強調されている。
FacebookのESM2は、これまでで最も先進的なタンパク質言語モデルであり、教師なし学習にマスク付き予測タスクを活用し、顕著な生化学的精度でアミノ酸表現を作成する。
しかし、機能的なタンパク質の洞察の提供に欠けており、表現の質を高める機会を示唆している。
本研究は,タンパク質ファミリー分類をESM2のトレーニングに組み込むことにより,このギャップに対処する。
論文 参考訳(メタデータ) (2024-04-24T11:09:43Z) - Enhancing Protein Predictive Models via Proteins Data Augmentation: A
Benchmark and New Directions [58.819567030843025]
本稿では,これまで画像やテキストに用いたデータ拡張手法をタンパク質に拡張し,タンパク質関連タスクでこれらの手法をベンチマークする。
本稿では,2つの新規な意味レベルタンパク質増強法,すなわち,統合的グラディエント置換法とバック翻訳置換法を提案する。
最後に、拡張および提案された拡張を拡張プールに統合し、シンプルで効果的なフレームワークであるAutomated Protein Augmentation (APA)を提案する。
論文 参考訳(メタデータ) (2024-03-01T07:58:29Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。
ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。
本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文 参考訳(メタデータ) (2022-05-19T13:21:31Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。