論文の概要: VFUSE: Virulent Feature Understanding with Sparse autoEncoders
- arxiv url: http://arxiv.org/abs/2606.10080v1
- Date: Mon, 08 Jun 2026 18:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.140596
- Title: VFUSE: Virulent Feature Understanding with Sparse autoEncoders
- Title(参考訳): VFUSE: スパースオートエンコーダによる脆弱性のある機能理解
- Authors: Michael Yu, Matthew L. Olson,
- Abstract要約: 本稿では, 拡散変圧器アクティベーションにSAEを訓練し, タンパク質モデルによるハザード認識機能の評価を行う, 機械論的解釈可能性手法であるVFUSEを紹介する。
特定のブロックに対して、線形プローブは、元のモデルの表現よりもSAE潜在空間に収まると、有害な設計を著しく検出する。
我々の知る限り、これは全原子拡散モデルで訓練された最初のSAEであり、タンパク質設計モデルの最初の特徴レベルの病原性検査である。
- 参考スコア(独自算出の注目度): 1.6150888379634967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative models have shown remarkable progress in a variety of domains such as protein design, but such power enables the opaque generation of hazardous proteins. In this work, we introduce VFUSE (Virulent Feature Understanding with Sparse autoEncoders), a mechanistic interpretability approach that trains SAEs on diffusion-transformer activations to audit protein models for hazard-aware features. We apply VFUSE to RoseTTAFold3 and RFDiffusion3, popular open-weight models for protein folding and synthesis. We find that for certain blocks, linear probes detect hazardous designs significantly better when fit in the SAE latent space over the original model's representations: improving interpretability without sacrificing model performance. Furthermore, we identify monosemantic features from the SAE that fire only on hazardous designs at up to AUROC $0.84$ ($q < 10^{-13}$). To our knowledge this is the first SAE trained on an all-atom diffusion model and the first feature-level virulence audit of a protein design model, paving the way towards safe and interpretable protein design.
- Abstract(参考訳): 生成モデルはタンパク質設計のような様々な領域で顕著な進歩を見せているが、そのようなパワーは有害なタンパク質を不透明に生成することを可能にする。
本稿では, 拡散変圧器のアクティベーションにSAEを訓練し, タンパク質モデルによるハザード認識機能の評価を行う機械的解釈可能性手法であるVFUSE(Virulent Feature Understanding with Sparse autoEncoders)を紹介する。
VFUSEをRoseTTAFold3およびRFDiffusion3に適用する。
あるブロックに対して、線形プローブは、元のモデルの表現よりもSAE潜在空間に収まると、モデル性能を犠牲にすることなく解釈性を向上させることにより、有害な設計を著しく検出する。
さらに, 有害な設計にのみ着火するSAEから, AUROC $0.84$(q < 10^{-13}$)までの単意味的特徴を同定した。
我々の知る限り、これは全原子拡散モデルで訓練された最初のSAEであり、タンパク質設計モデルの特徴レベルのウイルス検査であり、安全かつ解釈可能なタンパク質設計への道を開いた最初のものである。
関連論文リスト
- AMix-2: Establishing Protein as a Native Modality in Large Language Models [88.00237394496698]
大型言語モデル(LLM)において、タンパク質をネイティブなモダリティとして確立するタンパク質-テキスト基盤モデルAMix-2を提案する。
AMix-2は、(1)自然言語とタンパク質配列を共有トークン空間に埋め込む統一されたタンパク質-テキストの定式化、(2)ブロックワイド拡散言語モデリングバックボーンの2つの主要なアイデアに基づいて構築されている。
本稿では,様々な理解・設計タスクにまたがって,時間認識・ホモロジー認識プロトコルを用いた総合ベンチマークであるProteinArenaを紹介する。
論文 参考訳(メタデータ) (2026-05-29T07:58:08Z) - Protein Counterfactuals via Diffusion-Guided Latent Optimization [0.764671395172401]
ディープラーニングモデルは、前例のない精度でタンパク質特性を予測することができるが、工学的改良された変異体に対する機械的な洞察や実用的なガイダンスを提供することは滅多にない。
ミニマルかつ生物学的に妥当な配列編集を計算し、モデルの予測を所望の目標状態に戻すフレームワークであるMCCOP(Manifold-Constrained Counterfactual Optimization for Proteins)を紹介する。
GFP蛍光緩和, 熱力学的安定性向上, E3リガーゼ活性回復という3つのタンパク質工学的課題についてMCCOPを評価し, 離散的および連続的ベースラインよりもスペーサーで, より妥当な反物を生成することを示した。
論文 参考訳(メタデータ) (2026-03-11T14:19:52Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。
ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。
特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文 参考訳(メタデータ) (2025-06-09T06:08:59Z) - From thermodynamics to protein design: Diffusion models for biomolecule generation towards autonomous protein engineering [8.173909751137888]
まず拡散モデルの定義と特徴を述べ,拡散確率モデルとスコアベース生成モデルという2つの戦略に焦点をあてる。
タンパク質設計、ペプチド生成、薬物発見、タンパク質-リガンド相互作用におけるそれらの応用について論じる。
論文 参考訳(メタデータ) (2025-01-05T22:36:43Z) - Watch the Watcher! Backdoor Attacks on Security-Enhancing Diffusion Models [65.30406788716104]
本研究では,セキュリティ強化拡散モデルの脆弱性について検討する。
これらのモデルは、シンプルで効果的なバックドア攻撃であるDIFF2に非常に感受性があることを実証する。
ケーススタディでは、DIFF2は、ベンチマークデータセットとモデル間で、パーフィケーション後の精度と認定精度の両方を著しく削減できることを示している。
論文 参考訳(メタデータ) (2024-06-14T02:39:43Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。