論文の概要: SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models
- arxiv url: http://arxiv.org/abs/2509.03487v1
- Date: Wed, 03 Sep 2025 17:13:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.605802
- Title: SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models
- Title(参考訳): SafeProtein: タンパク質基盤モデルのレッドチームフレームワークとベンチマーク
- Authors: Jigang Fan, Zhenghong Zhou, Ruofan Jin, Le Cong, Mengdi Wang, Zaixi Zhang,
- Abstract要約: 本稿では,タンパク質基盤モデル用に設計された最初のレッドチームフレームワークであるSafeProteinを紹介する。
SafeProteinはマルチモーダルプロンプトエンジニアリングを組み合わせ、ビームサーチを生成して、レッドチーム方式を体系的に設計する。
また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
- 参考スコア(独自算出の注目度): 48.33774972147132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins play crucial roles in almost all biological processes. The advancement of deep learning has greatly accelerated the development of protein foundation models, leading to significant successes in protein understanding and design. However, the lack of systematic red-teaming for these models has raised serious concerns about their potential misuse, such as generating proteins with biological safety risks. This paper introduces SafeProtein, the first red-teaming framework designed for protein foundation models to the best of our knowledge. SafeProtein combines multimodal prompt engineering and heuristic beam search to systematically design red-teaming methods and conduct tests on protein foundation models. We also curated SafeProtein-Bench, which includes a manually constructed red-teaming benchmark dataset and a comprehensive evaluation protocol. SafeProtein achieved continuous jailbreaks on state-of-the-art protein foundation models (up to 70% attack success rate for ESM3), revealing potential biological safety risks in current protein foundation models and providing insights for the development of robust security protection technologies for frontier models. The codes will be made publicly available at https://github.com/jigang-fan/SafeProtein.
- Abstract(参考訳): タンパク質は、ほとんどすべての生物学的過程において重要な役割を担っている。
深層学習の進歩はタンパク質基盤モデルの開発を大いに加速させ、タンパク質の理解と設計に大きな成功を収めた。
しかしながら、これらのモデルに系統的なリピートが欠如していることは、生物学的安全性のリスクのあるタンパク質の生成など、それらの潜在的な誤用に対する深刻な懸念を引き起こしている。
本稿では,タンパク質基盤モデルのための最初のレッドチームフレームワークであるSafeProteinを紹介する。
SafeProteinはマルチモーダル・プロンプト・エンジニアリングとヒューリスティック・ビーム・サーチを組み合わせて、リピート法を体系的に設計し、タンパク質基盤モデルの試験を行う。
また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
SafeProteinは、最先端のタンパク質基盤モデル(ESM3の攻撃成功率最大70%)に対する継続的なジェイルブレイクを達成し、現在のタンパク質基盤モデルにおける潜在的な生物学的安全性リスクを明らかにし、フロンティアモデルのための堅牢なセキュリティ保護技術開発のための洞察を提供する。
コードはhttps://github.com/jigang-fan/SafeProtein.comで公開される。
関連論文リスト
- AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [92.51919604882984]
本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文 参考訳(メタデータ) (2025-07-11T17:02:25Z) - ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - FoldMark: Protecting Protein Generative Models with Watermarking [43.99328410299662]
著作権保護と有害なコンテンツ生成は、タンパク質生成モデルの広範な実装に課題をもたらす。
タンパク質生成モデルの一般的な透かし戦略としての2段階FoldMarkを提案する。
本手法は, タンパク質構造品質に悪影響を及ぼすだけであり, ポストプロセッシングおよびアダプティブアタックの可能性を秘めている。
論文 参考訳(メタデータ) (2024-10-27T06:53:46Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Solvent: A Framework for Protein Folding [0.39373541926236766]
AlphaFold2の後、タンパク質の折り畳みタスクは新しい段階に入り、AlphaFold2の構成要素に基づいて多くの方法が提案されている。
タンパク質の折り畳みにおける統一された研究フレームワークの重要性は、様々なアプローチを一貫して、公平に比較するための実装とベンチマークを含んでいる。
本稿では,タンパク質の折りたたみ構造である溶剤について述べる。
論文 参考訳(メタデータ) (2023-07-07T09:01:42Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - PDBench: Evaluating Computational Methods for Protein Sequence Design [2.0187324832551385]
本稿では, タンパク質のベンチマークを行い, 深層学習法の性能評価試験を提案する。
我々の堅牢なベンチマークは、その性能と実用性を評価するのに欠かせない設計手法の振る舞いに関する生物学的知見を提供する。
論文 参考訳(メタデータ) (2021-09-16T12:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。