論文の概要: GeneBreaker: Jailbreak Attacks against DNA Language Models with Pathogenicity Guidance
- arxiv url: http://arxiv.org/abs/2505.23839v1
- Date: Wed, 28 May 2025 13:58:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.55598
- Title: GeneBreaker: Jailbreak Attacks against DNA Language Models with Pathogenicity Guidance
- Title(参考訳): ジーンブレイカー氏:DNA言語モデルに対するジェイルブレイク攻撃は病原性誘導
- Authors: Zaixi Zhang, Zhenghong Zhou, Ruofan Jin, Le Cong, Mengdi Wang,
- Abstract要約: DNA基盤モデルのジェイルブレイク脆弱性を評価する最初のフレームワークであるGeneBreakerを紹介する。
GeneBreakerは、高ホモロジー、非病原性ジェイルブレイクプロンプト、PathoLMでガイドされたビームサーチ、および病原体様の配列へのスタイア生成のためのログ確率を採用している。
GeneBreakerは、6つのバイラルカテゴリーにわたる最新のEvoシリーズのジェイルブレイクに成功している。
- 参考スコア(独自算出の注目度): 38.06803412128178
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: DNA, encoding genetic instructions for almost all living organisms, fuels groundbreaking advances in genomics and synthetic biology. Recently, DNA Foundation Models have achieved success in designing synthetic functional DNA sequences, even whole genomes, but their susceptibility to jailbreaking remains underexplored, leading to potential concern of generating harmful sequences such as pathogens or toxin-producing genes. In this paper, we introduce GeneBreaker, the first framework to systematically evaluate jailbreak vulnerabilities of DNA foundation models. GeneBreaker employs (1) an LLM agent with customized bioinformatic tools to design high-homology, non-pathogenic jailbreaking prompts, (2) beam search guided by PathoLM and log-probability heuristics to steer generation toward pathogen-like sequences, and (3) a BLAST-based evaluation pipeline against a curated Human Pathogen Database (JailbreakDNABench) to detect successful jailbreaks. Evaluated on our JailbreakDNABench, GeneBreaker successfully jailbreaks the latest Evo series models across 6 viral categories consistently (up to 60\% Attack Success Rate for Evo2-40B). Further case studies on SARS-CoV-2 spike protein and HIV-1 envelope protein demonstrate the sequence and structural fidelity of jailbreak output, while evolutionary modeling of SARS-CoV-2 underscores biosecurity risks. Our findings also reveal that scaling DNA foundation models amplifies dual-use risks, motivating enhanced safety alignment and tracing mechanisms. Our code is at https://github.com/zaixizhang/GeneBreaker.
- Abstract(参考訳): ほとんどすべての生物の遺伝的指示をコードするDNAは、ゲノム学と合成生物学の進歩を揺るがす。
近年、DNAファンデーションモデルは、全ゲノムでさえ合成機能的DNA配列を設計することに成功したが、ジェイルブレイクへの感受性は未解明のままであり、病原体や毒素生成遺伝子のような有害な配列を生成する可能性を懸念している。
本稿では,DNA基盤モデルのジェイルブレイク脆弱性を体系的に評価する最初のフレームワークであるGeneBreakerを紹介する。
GeneBreakerは、(1)ハイホモロジー、非病原性ジェイルブレイクプロンプトを設計するための、カスタマイズされたバイオインフォマティクスツールを備えたLCMエージェント、(2)PathoLMがガイドしたビームサーチと、病原体様の配列に対するスタイア生成のためのログプロビタブルヒューリスティックス、(3)治療されたヒト・パスジェニック・データベース(JailbreakDNABench)に対するBLASTベースの評価パイプラインを用いて、ジェイルブレイクを正常に検出する。
JailbreakDNABenchで評価したGeneBreakerは、6つのバイラルカテゴリー(Evo2-40Bのアタック成功率最大60%)にわたる最新のEvoシリーズモデルのジェイルブレイクに成功した。
SARS-CoV-2スパイクタンパク質とHIV-1エンベロープタンパク質のさらなるケーススタディは、ジェイルブレイク出力の配列と構造的忠実性を示し、SARS-CoV-2の進化的モデリングはバイオセキュリティのリスクを浮き彫りにする。
また,DNA基盤モデルのスケーリングが二重利用リスクを増幅し,安全アライメントと追跡機構の強化を動機としていることも明らかにした。
私たちのコードはhttps://github.com/zaixizhang/GeneBreakerにあります。
関連論文リスト
- GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Geneshift: Impact of different scenario shift on Jailbreaking LLM [55.26229741296822]
我々は、遺伝的アルゴリズムを用いてシナリオシフトを最適化し、GeneShiftと呼ばれるブラックボックスジェイルブレイク攻撃を提案する。
GeneShiftはJailbreakの成功率を0%から60%に向上させるが、直接のプロンプトだけでは失敗する。
論文 参考訳(メタデータ) (2025-04-10T20:02:35Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - HybriDNA: A Hybrid Transformer-Mamba2 Long-Range DNA Language Model [70.69095062674944]
ハイブリッドトランスフォーマー-マンバ2アーキテクチャを組み込んだデコーダのみのDNA言語モデルであるHybriDNAを提案する。
このハイブリッド設計により、HybriDNAはDNA配列を最大131kbまで効率よく単一のヌクレオチド分解能で処理できる。
HybriDNAは、BEND、GUE、LRBベンチマークから算出された33のDNA理解データセットにまたがる最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-15T14:23:43Z) - Exploring Adversarial Robustness in Classification tasks using DNA Language Models [11.33721814923557]
DNA言語モデルは、本質的にシークエンシングエラー、突然変異、実験室が引き起こしたノイズを含むDNA配列で動作する。
この問題の重要性にもかかわらず、DNA言語モデルの堅牢性はほとんど未解明のままである。
本研究は、DNA言語モデルの限界を強調し、バイオインフォマティクスにおける堅牢性の必要性を強調する。
論文 参考訳(メタデータ) (2024-09-29T21:20:57Z) - DNABERT-S: Pioneering Species Differentiation with Species-Aware DNA Embeddings [7.822348354050447]
DNABERT-S(DNABERT-S)は,異なる種のDNA配列を自然にクラスターし,分離するために,種認識の埋め込みを開発するゲノムモデルである。
23の多様なデータセットの創発的な結果は、特に現実的なラベルスカースシナリオにおいて、DNABERT-Sの有効性を示している。
論文 参考訳(メタデータ) (2024-02-13T20:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。