論文の概要: SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models
- arxiv url: http://arxiv.org/abs/2509.03487v1
- Date: Wed, 03 Sep 2025 17:13:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.605802
- Title: SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models
- Title(参考訳): SafeProtein: タンパク質基盤モデルのレッドチームフレームワークとベンチマーク
- Authors: Jigang Fan, Zhenghong Zhou, Ruofan Jin, Le Cong, Mengdi Wang, Zaixi Zhang,
- Abstract要約: 本稿では,タンパク質基盤モデル用に設計された最初のレッドチームフレームワークであるSafeProteinを紹介する。
SafeProteinはマルチモーダルプロンプトエンジニアリングを組み合わせ、ビームサーチを生成して、レッドチーム方式を体系的に設計する。
また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
- 参考スコア(独自算出の注目度): 48.33774972147132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins play crucial roles in almost all biological processes. The advancement of deep learning has greatly accelerated the development of protein foundation models, leading to significant successes in protein understanding and design. However, the lack of systematic red-teaming for these models has raised serious concerns about their potential misuse, such as generating proteins with biological safety risks. This paper introduces SafeProtein, the first red-teaming framework designed for protein foundation models to the best of our knowledge. SafeProtein combines multimodal prompt engineering and heuristic beam search to systematically design red-teaming methods and conduct tests on protein foundation models. We also curated SafeProtein-Bench, which includes a manually constructed red-teaming benchmark dataset and a comprehensive evaluation protocol. SafeProtein achieved continuous jailbreaks on state-of-the-art protein foundation models (up to 70% attack success rate for ESM3), revealing potential biological safety risks in current protein foundation models and providing insights for the development of robust security protection technologies for frontier models. The codes will be made publicly available at https://github.com/jigang-fan/SafeProtein.
- Abstract(参考訳): タンパク質は、ほとんどすべての生物学的過程において重要な役割を担っている。
深層学習の進歩はタンパク質基盤モデルの開発を大いに加速させ、タンパク質の理解と設計に大きな成功を収めた。
しかしながら、これらのモデルに系統的なリピートが欠如していることは、生物学的安全性のリスクのあるタンパク質の生成など、それらの潜在的な誤用に対する深刻な懸念を引き起こしている。
本稿では,タンパク質基盤モデルのための最初のレッドチームフレームワークであるSafeProteinを紹介する。
SafeProteinはマルチモーダル・プロンプト・エンジニアリングとヒューリスティック・ビーム・サーチを組み合わせて、リピート法を体系的に設計し、タンパク質基盤モデルの試験を行う。
また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
SafeProteinは、最先端のタンパク質基盤モデル(ESM3の攻撃成功率最大70%)に対する継続的なジェイルブレイクを達成し、現在のタンパク質基盤モデルにおける潜在的な生物学的安全性リスクを明らかにし、フロンティアモデルのための堅牢なセキュリティ保護技術開発のための洞察を提供する。
コードはhttps://github.com/jigang-fan/SafeProtein.comで公開される。
関連論文リスト
- ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Solvent: A Framework for Protein Folding [0.39373541926236766]
AlphaFold2の後、タンパク質の折り畳みタスクは新しい段階に入り、AlphaFold2の構成要素に基づいて多くの方法が提案されている。
タンパク質の折り畳みにおける統一された研究フレームワークの重要性は、様々なアプローチを一貫して、公平に比較するための実装とベンチマークを含んでいる。
本稿では,タンパク質の折りたたみ構造である溶剤について述べる。
論文 参考訳(メタデータ) (2023-07-07T09:01:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。