論文の概要: Sharpness-Aware Poisoning: Enhancing Transferability of Injective Attacks on Recommender Systems
- arxiv url: http://arxiv.org/abs/2604.22170v1
- Date: Fri, 24 Apr 2026 02:47:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.317084
- Title: Sharpness-Aware Poisoning: Enhancing Transferability of Injective Attacks on Recommender Systems
- Title(参考訳): シャープネスを意識した毒殺:リコメンダーシステムにおけるインジェクティブアタックの伝達性を高める
- Authors: Junsong Xie, Yonghui Yang, Pengyang Shao, Le Wu,
- Abstract要約: シャープネス・アウェア・ポジショニング(textitSharpAP)と呼ばれる新たな攻撃手法を提案する。
具体的には、ほぼ最悪の犠牲者モデルを求めるために、シャープネスを意識した最小化原理を用いる。
本手法では, モデル構造の変化に敏感でない, より堅牢な有毒なデータを生成することができる。
- 参考スコア(独自算出の注目度): 19.87814771447356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommender Systems~(RS) have been shown to be vulnerable to injective attacks, where attackers inject limited fake user profiles to promote the exposure of target items to real users for unethical gains (e.g., economic or political advantages). Since attackers typically lack knowledge of the victim model deployed in the target RS, existing methods resort to using a fixed surrogate model to mimic the potential victim model. Despite considerable progress, we argue that the assumption that \textit{poisoned data generated for the surrogate model can be used to attack other victim models} is wishful. When there are significant structural discrepancies between the surrogate and victim models, the attack transferability inevitably suffers. Intuitively, if we can identify the worst-case victim model and iteratively optimize the poisoning effect specifically against it, then the generated poisoned data would be better transferred to other victim models. However, exactly identifying the worst-case victim model during the attack process is challenging due to the large space of victim models. To this end, in this work, we propose a novel attack method called Sharpness-Aware Poisoning (\textit{SharpAP}). Specifically, it employs the sharpness-aware minimization principle to seek the approximately worst-case victim model and optimizes the poisoned data specifically for this worst-case model. The poisoning attack with SharpAP is formulated as a min-max-min tri-level optimization problem. By integrating SharpAP into the iterative process for attacks, our method can generate more robust poisoned data which is less sensitive to the shift of model structure, mitigating the overfitting to the surrogate model. Comprehensive experimental comparisons on three real-world datasets demonstrate that \name~can significantly enhance the attack transferability.
- Abstract(参考訳): Recommender Systems~(RS)は、非倫理的な利益(例えば、経済的または政治的優位性)のためにターゲットアイテムの実際のユーザへの露出を促進するために、攻撃者が限定された偽ユーザープロファイルを注入する、注射攻撃に弱いことが示されている。
攻撃者は通常、ターゲットRSに配備された被害者モデルに関する知識を欠いているため、既存の方法では、潜在的な犠牲者モデルを模倣するために固定代理モデルを使用する。
かなりの進展にもかかわらず、サロゲートモデルのために生成された \textit{poisoned データが他の犠牲者モデルを攻撃するために使用できるという仮定は望ましいと論じる。
代理モデルと犠牲者モデルの間に大きな構造的相違がある場合、攻撃伝達性は必然的に苦しむ。
直感的には、最悪の犠牲者モデルを特定し、それに対して反復的に毒効果を最適化できれば、生成された毒データが他の犠牲者モデルに転送される。
しかし、攻撃過程における最悪の犠牲者モデルを特定することは、被害者モデルが多数存在するため困難である。
そこで本研究では, Sharpness-Aware Poisoning (\textit{SharpAP}) と呼ばれる新たな攻撃手法を提案する。
具体的には、シャープネスを意識した最小化原理を用いて、ほぼ最悪のケースの被害者モデルを求め、この最悪のケースモデルに特化して有毒データを最適化する。
SharpAPによる中毒攻撃は、min-max-min三レベル最適化問題として定式化されている。
SharpAPを攻撃反復処理に統合することにより、モデル構造の変化に敏感でないより堅牢な有毒なデータを生成することができ、サロゲートモデルへのオーバーフィッティングを軽減できる。
実世界の3つのデータセットの総合的な比較実験により、 \name~は攻撃伝達可能性を大幅に向上させることが示された。
関連論文リスト
- Transferable Backdoor Attacks for Code Models via Sharpness-Aware Adversarial Perturbation [37.091275561451695]
既存のコードモデルに対するバックドア攻撃は、転送可能性とステルスネスの基本的なトレードオフに直面します。
シャープネス対応トランスファー可能なバックドア(STAB)を提案する。
STABは、完全な犠牲者データを必要とすることなく、転送可能性とステルス性の両方を達成する。
論文 参考訳(メタデータ) (2026-02-11T08:26:47Z) - Towards Model Resistant to Transferable Adversarial Examples via Trigger Activation [95.3977252782181]
知覚不能な摂動によって特徴づけられる敵対的な例は、彼らの予測を誤解させることで、ディープニューラルネットワークに重大な脅威をもたらす。
本稿では,移動可能な敵例(TAE)に対して,より効率的かつ効果的に堅牢性を高めることを目的とした,新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-04-20T09:07:10Z) - CopyrightShield: Enhancing Diffusion Model Security against Copyright Infringement Attacks [61.06621533874629]
拡散モデルは、攻撃者が戦略的に修正された非侵害画像をトレーニングセットに注入する著作権侵害攻撃に弱い。
まず、上記の攻撃に対して防御するための防御フレームワーク、PhiliptyShieldを提案する。
実験により,PhiliptyShieldは2つの攻撃シナリオで有毒なサンプル検出性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-12-02T14:19:44Z) - The Victim and The Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data [4.9676716806872125]
バックドア攻撃は、ディープニューラルネットワーク(DNN)のトレーニングプロセスに深刻なセキュリティ上の脅威をもたらしている
The Victim and The Beneficiary (V&B) は有毒なモデルを利用して、余分な良性サンプルを使わずにクリーンなモデルを訓練する。
本フレームワークは,良質な試料の性能を維持しつつ,バックドア注入の防止と各種攻撃に対する堅牢化に有効である。
論文 参考訳(メタデータ) (2024-04-17T11:15:58Z) - Exploring Model Dynamics for Accumulative Poisoning Discovery [62.08553134316483]
そこで我々は,モデルレベルの情報を通して,防衛を探索するための新しい情報尺度,すなわち,記憶の離散性(Memorization Discrepancy)を提案する。
暗黙的にデータ操作の変更をモデル出力に転送することで、メモリ識別は許容できない毒のサンプルを発見することができる。
我々は、その性質を徹底的に探求し、累積中毒に対する防御のために、離散型サンプル補正(DSC)を提案する。
論文 参考訳(メタデータ) (2023-06-06T14:45:24Z) - Adversarial Transfer Attacks With Unknown Data and Class Overlap [19.901933940805684]
現在の移動攻撃の研究は、攻撃者にとって非現実的な優位性を持っている。
攻撃者および被害者が不完全な設定で利用可能なデータに着目した敵攻撃の転送に関する最初の研究について述べる。
この脅威モデルは、医学、マルウェアなどの応用に関係している。
論文 参考訳(メタデータ) (2021-09-23T03:41:34Z) - How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。
本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。
我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文 参考訳(メタデータ) (2020-12-02T15:30:21Z) - Learning to Attack: Towards Textual Adversarial Attacking in Real-world
Situations [81.82518920087175]
敵攻撃は、敵の例でディープニューラルネットワークを騙すことを目的としている。
本稿では、攻撃履歴から学習し、より効率的に攻撃を開始することができる強化学習に基づく攻撃モデルを提案する。
論文 参考訳(メタデータ) (2020-09-19T09:12:24Z) - Witches' Brew: Industrial Scale Data Poisoning via Gradient Matching [56.280018325419896]
Data Poisoning攻撃は、トレーニングデータを変更して、そのようなデータでトレーニングされたモデルを悪意を持って制御する。
我々は「スクラッチから」と「クリーンラベルから」の両方である特に悪意のある毒物攻撃を分析します。
フルサイズで有毒なImageNetデータセットをスクラッチからトレーニングした現代のディープネットワークにおいて、ターゲットの誤分類を引き起こすのは、これが初めてであることを示す。
論文 参考訳(メタデータ) (2020-09-04T16:17:54Z) - Model-Targeted Poisoning Attacks with Provable Convergence [19.196295769662186]
中毒攻撃では、トレーニングデータのごく一部を制御している敵が、破損したモデルを誘導する方法で、そのデータを選択しようとする。
我々は,凸機械学習モデルに対する中毒攻撃について検討し,特定のモデルを誘導する効率的な中毒攻撃を提案する。
論文 参考訳(メタデータ) (2020-06-30T01:56:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。