Fugu-MT 論文翻訳(概要): A Temporal-Pattern Backdoor Attack to Deep Reinforcement Learning

論文の概要: A Temporal-Pattern Backdoor Attack to Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2205.02589v1
Date: Thu, 5 May 2022 12:03:09 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-06 14:29:16.896128
Title: A Temporal-Pattern Backdoor Attack to Deep Reinforcement Learning
Title（参考訳）: 深層強化学習における時間パターンバックドア攻撃
Authors: Yinbo Yu, Jiajia Liu, Shouqing Li, Kepu Huang, Xudong Feng
Abstract要約: DRLに対する新しい時間パターンバックドアアタックを提案する。提案したバックドア攻撃を,クラウドコンピューティングにおける典型的なジョブスケジューリングタスクに検証する。我々のバックドアの平均的クリーンデータ精度と攻撃成功率は、それぞれ97.8%と97.5%に達する。
参考スコア（独自算出の注目度）: 10.162123678104917
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep reinforcement learning (DRL) has made significant achievements in many real-world applications. But these real-world applications typically can only provide partial observations for making decisions due to occlusions and noisy sensors. However, partial state observability can be used to hide malicious behaviors for backdoors. In this paper, we explore the sequential nature of DRL and propose a novel temporal-pattern backdoor attack to DRL, whose trigger is a set of temporal constraints on a sequence of observations rather than a single observation, and effect can be kept in a controllable duration rather than in the instant. We validate our proposed backdoor attack to a typical job scheduling task in cloud computing. Numerous experimental results show that our backdoor can achieve excellent effectiveness, stealthiness, and sustainability. Our backdoor's average clean data accuracy and attack success rate can reach 97.8% and 97.5%, respectively.
Abstract（参考訳）: 深層強化学習(DRL)は多くの実世界の応用において大きな成果を上げている。しかし、こうした現実世界のアプリケーションは、通常、閉塞や騒がしいセンサーによって決定される部分的な観察しか提供できない。しかし、部分状態の可観測性はバックドアの悪意のある振る舞いを隠すために使用できる。本稿では、DRLのシーケンシャルな性質を探求し、DRLに対する新たな時間的パターンのバックドア攻撃を提案する。提案するバックドア攻撃をクラウドコンピューティングの典型的なジョブスケジューリングタスクに検証する。多くの実験結果から, バックドアは優れた有効性, ステルス性, 持続性が得られることが示された。我々のバックドアの平均的クリーンデータ精度と攻撃成功率は、それぞれ97.8%と97.5%に達する。

関連論文リスト

Beyond Training-time Poisoning: Component-level and Post-training Backdoors in Deep Reinforcement Learning [2.8311497176067104]
深層強化学習(Dep Reinforcement Learning, DRL)システムは、安全クリティカルなアプリケーションでますます使われているが、そのセキュリティはいまだに過小評価されている。本研究は、特定の入力が観測空間に現れる場合にのみ悪意ある行為を引き起こす隠されたトリガーを埋め込むバックドア攻撃を調査する。 1) 完全モデル再訓練に耐える持続的バックドアを移植するためにコンポーネントレベルの欠陥を利用するTrojanentRLと,(2) トレーニングや検証,テストデータへのアクセスを必要としないトレーニング後のバックドア攻撃であるInfrectroRLである。
論文参考訳（メタデータ） (2025-07-07T11:15:54Z)
Long-Tailed Backdoor Attack Using Dynamic Data Augmentation Operations [50.1394620328318]
既存のバックドア攻撃は主にバランスの取れたデータセットに焦点を当てている。動的データ拡張操作(D$2$AO)という効果的なバックドア攻撃を提案する。本手法は,クリーンな精度を維持しつつ,最先端の攻撃性能を実現することができる。
論文参考訳（メタデータ） (2024-10-16T18:44:22Z)
Efficient Backdoor Defense in Multimodal Contrastive Learning: A Token-Level Unlearning Method for Mitigating Threats [52.94388672185062]
本稿では,機械学習という概念を用いて,バックドアの脅威に対する効果的な防御機構を提案する。これは、モデルがバックドアの脆弱性を迅速に学習するのを助けるために、小さな毒のサンプルを戦略的に作成することを必要とする。バックドア・アンラーニング・プロセスでは,新しいトークン・ベースの非ラーニング・トレーニング・システムを提案する。
論文参考訳（メタデータ） (2024-09-29T02:55:38Z)
DeCE: Deceptive Cross-Entropy Loss Designed for Defending Backdoor Attacks [26.24490960002264]
本稿では,コード言語モデルのセキュリティを高めるために,汎用的で効果的な損失関数DeCE(Deceptive Cross-Entropy)を提案する。さまざまなコード合成データセット,モデル,有毒比による実験は,DeCEの適用性と有効性を示している。
論文参考訳（メタデータ） (2024-07-12T03:18:38Z)
Revisiting Backdoor Attacks against Large Vision-Language Models [76.42014292255944]
本稿では,LVLMの命令チューニングにおけるバックドア攻撃の一般化可能性について実験的に検討する。以上に基づいて,既存のバックドア攻撃を修正した。本稿では,従来のシンプルなバックドア戦略でさえ,LVLMに深刻な脅威をもたらすことを指摘する。
論文参考訳（メタデータ） (2024-06-27T02:31:03Z)
BEEAR: Embedding-based Adversarial Removal of Safety Backdoors in Instruction-tuned Language Models [57.5404308854535]
大型言語モデル(LLM)における安全バックドア攻撃は、正常な相互作用中の検出を回避しながら、安全でない振る舞いをステルス的に引き起こすことができる。モデル埋め込み空間において,バックドアトリガーが比較的均一なドリフトを引き起こすという知見を活かした緩和手法であるBEEARを提案する。両レベル最適化手法は、不要な振る舞いを誘発する普遍的な埋め込み摂動を特定し、モデルパラメータを調整し、これらの摂動に対する安全な振舞いを強化する。
論文参考訳（メタデータ） (2024-06-24T19:29:47Z)
Backdoor Defense via Suppressing Model Shortcuts [91.30995749139012]
本稿では,モデル構造の角度からバックドア機構を探索する。攻撃成功率 (ASR) は, キースキップ接続の出力を減少させると著しく低下することを示した。
論文参考訳（メタデータ） (2022-11-02T15:39:19Z)
Confidence Matters: Inspecting Backdoors in Deep Neural Networks via Distribution Transfer [27.631616436623588]
本稿では,新しい観測結果を基にしたバックドアディフェンスDTInspectorを提案する。 DTInspectorは、ほとんどの高信頼データの予測を変える可能性のあるパッチを学び、それからバックドアの存在を決定する。
論文参考訳（メタデータ） (2022-08-13T08:16:28Z)
Invisible Backdoor Attacks Using Data Poisoning in the Frequency Domain [8.64369418938889]
周波数領域に基づく一般化されたバックドア攻撃手法を提案する。トレーニングプロセスのミスラベルやアクセスをすることなく、バックドアのインプラントを実装できる。我々は,3つのデータセットに対して,ラベルなし,クリーンラベルのケースにおけるアプローチを評価した。
論文参考訳（メタデータ） (2022-07-09T07:05:53Z)
Black-box Detection of Backdoor Attacks with Limited Information and Data [56.0735480850555]
モデルへのクエリアクセスのみを用いてバックドア攻撃を同定するブラックボックスバックドア検出(B3D)手法を提案する。バックドア検出に加えて,同定されたバックドアモデルを用いた信頼性の高い予測手法を提案する。
論文参考訳（メタデータ） (2021-03-24T12:06:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。