Fugu-MT 論文翻訳(概要): When Backdoors Go Beyond Triggers: Semantic Drift in Diffusion Models Under Encoder Attacks

論文の概要: When Backdoors Go Beyond Triggers: Semantic Drift in Diffusion Models Under Encoder Attacks

arxiv url: http://arxiv.org/abs/2602.20193v1
Date: Sat, 21 Feb 2026 23:48:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.45344
Title: When Backdoors Go Beyond Triggers: Semantic Drift in Diffusion Models Under Encoder Attacks
Title（参考訳）: バックドアがトリガーを超えたとき:エンコーダ攻撃による拡散モデルのセマンティックドリフト
Authors: Shenyang Chen, Liuwan Zhu,
Abstract要約: エンコーダ側の中毒は持続的かつトリガーフリーなセマンティックな腐敗を引き起こすことを実証する。バックドアは低ランクで目標中心の変形として機能し、局所的な感度を増幅し、乱れがセマンティックな近傍を連続的に伝播する。本研究は, 拡散および対照的なパラダイムにまたがって検証され, エンコーダ中毒の深い構造的リスクを明らかにし, 単純な攻撃成功率を超える幾何的監査の必要性を強調した。
参考スコア（独自算出の注目度）: 2.4923006485141284
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Standard evaluations of backdoor attacks on text-to-image (T2I) models primarily measure trigger activation and visual fidelity. We challenge this paradigm, demonstrating that encoder-side poisoning induces persistent, trigger-free semantic corruption that fundamentally reshapes the representation manifold. We trace this vulnerability to a geometric mechanism: a Jacobian-based analysis reveals that backdoors act as low-rank, target-centered deformations that amplify local sensitivity, causing distortion to propagate coherently across semantic neighborhoods. To rigorously quantify this structural degradation, we introduce SEMAD (Semantic Alignment and Drift), a diagnostic framework that measures both internal embedding drift and downstream functional misalignment. Our findings, validated across diffusion and contrastive paradigms, expose the deep structural risks of encoder poisoning and highlight the necessity of geometric audits beyond simple attack success rates.
Abstract（参考訳）: テキスト・トゥ・イメージ(T2I)モデルに対するバックドア攻撃の標準評価は、主にトリガーアクティベーションと視覚的忠実度を測定する。我々はこのパラダイムに挑戦し、エンコーダ側の中毒が表現多様体を根本的に再認識する永続的でトリガーのない意味的腐敗を誘発することを示した。ヤコビアンに基づく分析によると、バックドアは局所的な感度を増幅する低ランクで目標中心の変形として作用し、意味的近傍でコヒーレントにゆがみを伝播させる。この構造劣化を厳密に定量化するために, 内部埋込ドリフトと下流機能不整合の両方を測定する診断フレームワークSEMAD(Semantic Alignment and Drift)を導入する。本研究は, 拡散および対照的なパラダイムにまたがって検証され, エンコーダ中毒の深い構造的リスクを明らかにし, 単純な攻撃成功率を超える幾何的監査の必要性を強調した。

関連論文リスト

TraceGuard: Process-Guided Firewall against Reasoning Backdoors in Large Language Models [19.148124494194317]
我々は,小規模モデルを堅牢な推論ファイアウォールに変換するプロセス誘導型セキュリティフレームワークであるTraceGuardを提案する。提案手法は,推理トレースを信頼できないペイロードとして扱い,詳細な防衛戦略を確立する。グレーボックス設定における適応的敵に対する堅牢性を実証し、TraceGuardを実用的で低レイテンシなセキュリティプリミティブとして確立する。
論文参考訳（メタデータ） (2026-03-02T22:19:13Z)
Self-Aware Object Detection via Degradation Manifolds [3.8265249634979734]
安全クリティカルな設定では、入力が検出器の名目上の操作状態内にあるかどうかを判断することなく予測を行うことはできない。劣化多様体に基づく自己認識フレームワークを提案する。本手法は,コントラスト学習により訓練された軽量な埋め込みヘッドを用いて,標準的な検出バックボーンを増強する。
論文参考訳（メタデータ） (2026-02-20T17:58:46Z)
Simulated Adoption: Decoupling Magnitude and Direction in LLM In-Context Conflict Resolution [3.0242762196828448]
大規模言語モデル(LLM)は、既存のパラメトリックメモリよりもコンテクスト内での競合情報を優先することが多い。モデルが「未学習」や内部の真理の大きさを抑えるのではなく、幾何変位のメカニズムを用いていることを示す。
論文参考訳（メタデータ） (2026-02-04T06:13:11Z)
Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文参考訳（メタデータ） (2025-11-10T15:48:50Z)
Geometry-Aware Backdoor Attacks: Leveraging Curvature in Hyperbolic Embeddings [3.8806403512213787]
非ユークリッド基底モデルは双曲幾何学のような曲線空間に表現を配置する。入力空間の小さな変化は標準の入力空間検出器には微妙に見えるが、モデルの表現空間において不均等に大きな変化をもたらす。本稿では,幾何適応型トリガを提案し,タスクやアーキテクチャにわたって評価する。
論文参考訳（メタデータ） (2025-10-07T19:24:43Z)
Generative Model Inversion Through the Lens of the Manifold Hypothesis [98.37040155914595]
モデル反転攻撃(MIA)は、訓練されたモデルからクラス表現型サンプルを再構成することを目的としている。最近の生成的MIAは、生成的敵ネットワークを使用して、反転過程を導く画像の事前学習を行う。
論文参考訳（メタデータ） (2025-09-24T14:39:25Z)
BURN: Backdoor Unlearning via Adversarial Boundary Analysis [73.14147934175604]
Backdoor Unlearningは、モデル本来の機能を保持しながら、バックドア関連の情報を削除することを目的としている。本稿では, 偽相関疎結合, プログレッシブデータリファインメント, モデル浄化を統合した新しい防御フレームワーク, BURNによるバックドア・アンラーニングを提案する。
論文参考訳（メタデータ） (2025-07-14T17:13:06Z)
Trigger without Trace: Towards Stealthy Backdoor Attack on Text-to-Image Diffusion Models [70.03122709795122]
テキストと画像の拡散モデルをターゲットにしたバックドア攻撃が急速に進んでいる。現在のバックドアサンプルは良性サンプルと比較して2つの重要な異常を示すことが多い。我々はこれらの成分を明示的に緩和することでTwT(Trigger without Trace)を提案する。
論文参考訳（メタデータ） (2025-03-22T10:41:46Z)
Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文参考訳（メタデータ） (2023-05-18T10:18:59Z)
Improving Adversarial Robustness to Sensitivity and Invariance Attacks with Deep Metric Learning [80.21709045433096]
対向ロバスト性の標準的な方法は、サンプルを最小に摂動させることによって作られたサンプルに対して防御する枠組みを仮定する。距離学習を用いて、最適輸送問題として逆正則化をフレーム化する。予備的な結果から, 変分摂動の規則化は, 変分防御と敏感防御の両方を改善することが示唆された。
論文参考訳（メタデータ） (2022-11-04T13:54:02Z)
Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文参考訳（メタデータ） (2022-06-23T14:16:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。