Fugu-MT 論文翻訳(概要): How vulnerable is my policy? Adversarial attacks on modern behavior cloning policies

論文の概要: How vulnerable is my policy? Adversarial attacks on modern behavior cloning policies

arxiv url: http://arxiv.org/abs/2502.03698v1
Date: Thu, 06 Feb 2025 01:17:39 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-07 15:30:40.585352
Title: How vulnerable is my policy? Adversarial attacks on modern behavior cloning policies
Title（参考訳）: 私の政策はどれほど脆弱か?現代の行動クローン政策に対する敵対的攻撃
Authors: Basavasagar Patil, Akansha Kalra, Guanhong Tao, Daniel S. Brown,
Abstract要約: 本稿では,LfD(Learning from Demonstration)アルゴリズムに対する敵対的攻撃の包括的研究について述べる。我々は,これらの手法の脆弱性について,標的外,標的外,普遍的摂動に対する検討を行った。いくつかのロボット操作のシミュレーション実験により、現在の手法のほとんどは敵の摂動に非常に弱いことが判明した。
参考スコア（独自算出の注目度）: 22.52780232632902
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Learning from Demonstration (LfD) algorithms have shown promising results in robotic manipulation tasks, but their vulnerability to adversarial attacks remains underexplored. This paper presents a comprehensive study of adversarial attacks on both classic and recently proposed algorithms, including Behavior Cloning (BC), LSTM-GMM, Implicit Behavior Cloning (IBC), Diffusion Policy (DP), and VQ-Behavior Transformer (VQ-BET). We study the vulnerability of these methods to untargeted, targeted and universal adversarial perturbations. While explicit policies, such as BC, LSTM-GMM and VQ-BET can be attacked in the same manner as standard computer vision models, we find that attacks for implicit and denoising policy models are nuanced and require developing novel attack methods. Our experiments on several simulated robotic manipulation tasks reveal that most of the current methods are highly vulnerable to adversarial perturbations. We also show that these attacks are transferable across algorithms, architectures, and tasks, raising concerning security vulnerabilities with potentially a white-box threat model. In addition, we test the efficacy of a randomized smoothing, a widely used adversarial defense technique, and highlight its limitation in defending against attacks on complex and multi-modal action distribution common in complex control tasks. In summary, our findings highlight the vulnerabilities of modern BC algorithms, paving way for future work in addressing such limitations.
Abstract（参考訳）: デモレーション(LfD)アルゴリズムからの学習は、ロボット操作タスクにおいて有望な結果を示しているが、敵の攻撃に対する脆弱性はまだ探索されていない。本稿では,従来のアルゴリズムと最近提案されたアルゴリズムの双方に対して,行動クローン(BC),LSTM-GMM,Implicit Behavior Cloning(IBC),Diffusion Policy(DP),VQ-Behavior Transformer(VQ-BET)を総合的に検討する。我々は,これらの手法の脆弱性について,標的外,標的外,普遍的摂動に対する検討を行った。 BC、LSTM-GMM、VQ-BETといった明示的なポリシーは、標準的なコンピュータビジョンモデルと同様の方法で攻撃することができるが、暗黙的かつ偏見的なポリシーモデルに対する攻撃はニュアンスであり、新たな攻撃方法が必要である。いくつかのロボット操作のシミュレーション実験により、現在の手法のほとんどは敵の摂動に非常に弱いことが判明した。また、これらの攻撃はアルゴリズム、アーキテクチャ、タスク間で転送可能であることを示し、潜在的にホワイトボックス脅威モデルによるセキュリティ上の脆弱性を提起する。さらに, ランダム化スムーシングの有効性を検証し, 複雑な制御タスクに共通する複雑かつ多モードな動作分布に対する攻撃に対する防御の限界を強調した。まとめると、我々の発見は現代のBCアルゴリズムの脆弱性を強調し、このような制限に対処するための今後の取り組みの道を開く。

関連論文リスト

Explainable but Vulnerable: Adversarial Attacks on XAI Explanation in Cybersecurity Applications [0.21485350418225244]
説明可能な人工知能(XAI)は、ブラックボックスモデルの決定を精査する能力を持つ機械学習(ML)研究者を支援している。 XAIメソッド自体は、説明モジュールから期待された結果を操作する、攻撃後の攻撃の犠牲になる可能性がある。
論文参考訳（メタデータ） (2025-10-04T02:07:58Z)
Algorithms for Adversarially Robust Deep Learning [58.656107500646364]
望ましいロバスト性を示すアルゴリズムの設計に向けた最近の進歩について論じる。医用画像,分子識別,画像分類における最先端の一般化を実現するアルゴリズムを提案する。我々は、堅牢な言語ベースのエージェントを設計するための進歩のフロンティアとして、新たな攻撃と防御を提案する。
論文参考訳（メタデータ） (2025-09-23T14:48:58Z)
Quantifying Loss Aversion in Cyber Adversaries via LLM Analysis [2.798191832420146]
IARPAのReSCINDプログラムは、攻撃的な認知特性を推論し、防御し、悪用しようと試みている。本稿では,大規模言語モデル(LLM)を利用して,ハッカー行動からの損失回避の認知バイアスに関する定量的知見を抽出する手法を提案する。
論文参考訳（メタデータ） (2025-08-18T05:51:30Z)
Constrained Black-Box Attacks Against Multi-Agent Reinforcement Learning [8.080255323094079]
協調型マルチエージェント強化学習(c-MARL)は急速に進化し、現実世界のアプリケーションに最先端のアルゴリズムを提供している。しかし、広く普及する上で重要な課題は、敵の攻撃に対する脆弱性の徹底的な調査がないことである。本稿では、敵が配備されたエージェントの観察のみを収集・摂動できると仮定して、より現実的で制約のある条件下で新たな脆弱性を調査する。
論文参考訳（メタデータ） (2025-08-12T18:31:15Z)
Toward Spiking Neural Network Local Learning Modules Resistant to Adversarial Attacks [2.3312335998006306]
最近の研究では、敵対的な例としてスパイキングニューラルネットワーク(SNN)の脆弱性が示されている。本稿では,敵インスタンスの転送可能性を活用するハイブリッド攻撃パラダイムを提案する。提案手法は,既存の攻撃手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2025-04-11T18:07:59Z)
Robust Intrusion Detection System with Explainable Artificial Intelligence [0.0]
逆入力は、標準インターフェイスを通じて機械学習(ML)モデルを利用することができる。敵の訓練のような従来の防御は、計算的な用語で費用がかかるため、しばしばリアルタイム検出の提供に失敗する。 eXplainable Artificial Intelligence (XAI) を用いた敵攻撃の検出と緩和のための新しい戦略を提案する。
論文参考訳（メタデータ） (2025-03-07T10:31:59Z)
MirrorCheck: Efficient Adversarial Defense for Vision-Language Models [55.73581212134293]
本稿では,視覚言語モデルにおける対角的サンプル検出のための,新しい,しかしエレガントなアプローチを提案する。本手法は,テキスト・トゥ・イメージ(T2I)モデルを用いて,ターゲットVLMが生成したキャプションに基づいて画像を生成する。異なるデータセットで実施した経験的評価により,本手法の有効性が検証された。
論文参考訳（メタデータ） (2024-06-13T15:55:04Z)
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models [111.58315434849047]
多粒性摂動を取り入れた高品質な逆数例を作成する。我々は,多粒体攻撃を逐次的意思決定プロセスに変換する。本手法は,攻撃の有効性と非受容性の両方において,一般的なベースラインを超えている。
論文参考訳（メタデータ） (2024-04-02T02:08:29Z)
Mutual-modality Adversarial Attack with Semantic Perturbation [81.66172089175346]
本稿では,相互モダリティ最適化スキームにおける敵攻撃を生成する新しい手法を提案する。我々の手法は最先端の攻撃方法より優れており、プラグイン・アンド・プレイ・ソリューションとして容易にデプロイできる。
論文参考訳（メタデータ） (2023-12-20T05:06:01Z)
Unveiling Vulnerabilities in Interpretable Deep Learning Systems with Query-Efficient Black-box Attacks [16.13790238416691]
解釈可能なディープラーニングシステム(IDLS)は、システムの透明性と説明性を高めるために設計されている。本稿では,ターゲットモデルとその解釈モデルに関する事前知識を必要としない新規な微生物遺伝アルゴリズムによるIDLSに対するブラックボックス攻撃を提案する。
論文参考訳（メタデータ） (2023-07-21T21:09:54Z)
Deep PackGen: A Deep Reinforcement Learning Framework for Adversarial Network Packet Generation [3.5574619538026044]
人工知能(AI)と機械学習(ML)アルゴリズムの最近の進歩は、サイバーセキュリティ運用センター(ディフェンダー)のセキュリティ姿勢を高めている。近年の研究では、フローベースとパケットベースの特徴の摂動がMLモデルを欺くことが報告されているが、これらのアプローチには限界がある。我々のフレームワークであるDeep PackGenは、逆パケットを生成するために深層強化学習を採用し、文献におけるアプローチの限界を克服することを目的としている。
論文参考訳（メタデータ） (2023-05-18T15:32:32Z)
Toward Evaluating Robustness of Reinforcement Learning with Adversarial Policy [32.1138935956272]
強化学習エージェントは、デプロイ中に回避攻撃を受けやすい。本稿では,効率的なブラックボックス対応政策学習のための本質的なモチベーション付き適応政策(IMAP)を提案する。
論文参考訳（メタデータ） (2023-05-04T07:24:12Z)
Adv-Bot: Realistic Adversarial Botnet Attacks against Network Intrusion Detection Systems [0.7829352305480285]
最近、機械学習ベースのセキュリティシステムに対する攻撃の可能性について調査する研究者が増えている。本研究では,ネットワークによる侵入検知システムに対する敵攻撃,特に回避攻撃の実現可能性について検討した。私たちのゴールは、意図した悪意のある機能をすべて実行しながら、検出を回避できる敵ボットネットトラフィックを作ることです。
論文参考訳（メタデータ） (2023-03-12T14:01:00Z)
Towards Adversarial Realism and Robust Learning for IoT Intrusion Detection and Classification [0.0]
IoT(Internet of Things)は、重大なセキュリティ上の課題に直面している。敵の攻撃による脅威の増大は、信頼できる防衛戦略の必要性を回復させる。本研究は、敵のサイバー攻撃事例が現実的であるために必要な制約の種類について述べる。
論文参考訳（メタデータ） (2023-01-30T18:00:28Z)
Resisting Deep Learning Models Against Adversarial Attack Transferability via Feature Randomization [17.756085566366167]
本研究では,ディープラーニングモデルを対象とした8つの敵攻撃に抵抗する特徴ランダム化に基づく手法を提案する。本手法は,標的ネットワークを確保でき,敵の攻撃伝達可能性に対して60%以上抵抗することができる。
論文参考訳（メタデータ） (2022-09-11T20:14:12Z)
Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文参考訳（メタデータ） (2021-11-23T23:42:16Z)
Balancing detectability and performance of attacks on the control channel of Markov Decision Processes [77.66954176188426]
マルコフ決定過程(MDPs)の制御チャネルにおける最適ステルス毒素攻撃の設計問題について検討する。この研究は、MDPに適用された敵国・毒殺攻撃や強化学習(RL)手法に対する研究コミュニティの最近の関心に動機づけられている。
論文参考訳（メタデータ） (2021-09-15T09:13:10Z)
Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文参考訳（メタデータ） (2021-06-21T21:42:08Z)
A black-box adversarial attack for poisoning clustering [78.19784577498031]
本稿では,クラスタリングアルゴリズムのロバスト性をテストするために,ブラックボックス対逆攻撃法を提案する。我々の攻撃は、SVM、ランダムフォレスト、ニューラルネットワークなどの教師付きアルゴリズムに対しても転送可能であることを示す。
論文参考訳（メタデータ） (2020-09-09T18:19:31Z)
Adversarial EXEmples: A Survey and Experimental Evaluation of Practical Attacks on Machine Learning for Windows Malware Detection [67.53296659361598]
EXEmplesは、比較的少ない入力バイトを摂動することで、機械学習に基づく検出をバイパスすることができる。我々は、機械学習モデルに対する過去の攻撃を包含し、一般化するだけでなく、3つの新たな攻撃を含む統一フレームワークを開発する。これらの攻撃はFull DOS、Extended、Shiftと呼ばれ、DOSヘッダをそれぞれ操作し、拡張し、第1セクションの内容を変更することで、敵のペイロードを注入する。
論文参考訳（メタデータ） (2020-08-17T07:16:57Z)
Adversarial Machine Learning Attacks and Defense Methods in the Cyber Security Domain [58.30296637276011]
本稿では,機械学習技術に基づくセキュリティソリューションに対する敵攻撃に関する最新の研究を要約する。サイバーセキュリティドメインでエンドツーエンドの敵攻撃を実装するという、ユニークな課題を議論するのは、これが初めてである。
論文参考訳（メタデータ） (2020-07-05T18:22:40Z)
Adversarial vs behavioural-based defensive AI with joint, continual and active learning: automated evaluation of robustness to deception, poisoning and concept drift [62.997667081978825]
人工知能(AI)の最近の進歩は、サイバーセキュリティのための行動分析(UEBA)に新たな能力をもたらした。本稿では、検出プロセスを改善し、人間の専門知識を効果的に活用することにより、この攻撃を効果的に軽減するソリューションを提案する。
論文参考訳（メタデータ） (2020-01-13T13:54:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。