論文の概要: When Critics Disagree: Adaptive Reward Poisoning Attacks in RIS-Aided Wireless Control System
- arxiv url: http://arxiv.org/abs/2605.20037v1
- Date: Tue, 19 May 2026 15:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.505764
- Title: When Critics Disagree: Adaptive Reward Poisoning Attacks in RIS-Aided Wireless Control System
- Title(参考訳): RIS支援無線制御システムにおけるアダプティブ・リワードの攻撃
- Authors: Deemah H. Tashman, Soumaya Cherkaoui,
- Abstract要約: 本稿では,ソフトアクター・クリティカル (SAC) エージェントに対するアダプティブアタック(アダプティブアタック)を提案する。
Reconfigurable Intelligent Surfaces (RIS) によって支援された認知無線ネットワーク(CRN) 環境では、SACエージェントは長期二次ユーザ(SU)率を最大化する。
DGRPは報酬を腐敗させ、特にSACのデュアル批評家がかなりの意見の相違を示したときである。
- 参考スコア(独自算出の注目度): 7.546882801190319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reward-poisoning attacks present a significant risk to learning-based wireless control systems. Given this, we propose a Disagreement-Guided Reward Poisoning (DGRP) adaptive attack on a Soft Actor-Critic (SAC) agent. In a Cognitive Radio Network (CRN) environment assisted by Reconfigurable Intelligent Surfaces (RIS), the SAC agent is tasked with maximizing the long-term secondary users' (SUs) rate by simultaneously optimizing the transmission power of the SU transmitter and the RIS phase shifts. DGRP corrupts rewards, particularly when the SAC dual critics exhibit substantial disagreement-especially in high-leverage, high-uncertainty states-resulting in distorted value estimations and guiding the policy towards suboptimal actions. Our findings demonstrate that DGRP substantially diminishes the performance improvements typically provided by RIS and degrades transmission quality. We further investigate key attack parameters and determine their impact on learning. In comparison to periodic-timing and exploration-triggered baselines, DGRP consistently causes greater damage, highlighting the necessity of considering disagreement-aware threats when evaluating the robustness of Deep Reinforcement Learning (DRL) in RIS-assisted networks.
- Abstract(参考訳): Reward-poisoning攻撃は、学習ベースの無線制御システムに重大なリスクをもたらす。
そこで本研究では,Soft Actor-Critic (SAC) エージェントに対するDGRP適応攻撃を提案する。
SACエージェントは、再構成可能なインテリジェントサーフェス(RIS)によって支援された認知無線ネットワーク(CRN)環境において、SU送信機の送信電力とRIS位相シフトを同時に最適化し、長期二次ユーザ(SUs)レートを最大化する。
DGRPは報酬を損なうが、特にSACのデュアル批評家は、特に高水準、高不確かさの国家が歪んだ値の推定をし、準最適行動への政策を導くことで、かなりの意見の相違を示す。
以上の結果から,DGRPはRISが典型的に提供する性能改善を著しく低下させ,伝送品質を低下させることが明らかとなった。
さらに、主要な攻撃パラメータを調査し、学習への影響を判定する。
DGRPは周期的刺激と探索トリガーベースラインと比較して、RIS支援ネットワークにおけるDeep Reinforcement Learning(DRL)のロバスト性を評価する際に、不一致を意識した脅威を考慮する必要性を強調した。
関連論文リスト
- Action-Conditioned Risk Gating for Safety-Critical Control under Partial Observability [79.08785366532287]
部分観測可能性下でのリスク感応制御のための軽量なリスクゲート強化学習近似を提案する。
安全クリティカルな部分観測可能な2つの領域 – 自動グルコース調節と安全制約ナビゲーション – でアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-14T01:23:09Z) - Trustworthy AI-Driven Dynamic Hybrid RIS: Joint Optimization and Reward Poisoning-Resilient Control in Cognitive MISO Networks [7.546882801190319]
認知無線ネットワーク(CRN)は、二次使用者(SU)が一次使用者(PU)に有害な干渉を伴わずに許可された周波数帯域にアクセスできるようにすることにより、スペクトル不足を軽減するための重要なメカニズムである。
この研究は、MISO(Multiple-Input Single-output) CRNをアンダーレイする適応的、エネルギー対応のハイブリッド再構成可能なインテリジェントサーフェス(RIS)を導入する。
論文 参考訳(メタデータ) (2026-03-27T22:21:33Z) - Connect the Dots: Knowledge Graph-Guided Crawler Attack on Retrieval-Augmented Generation Systems [14.028345839891855]
Retrieval-augmented Generation (RAG) システムは、文書検索と大きな言語モデルを統合する。
RAGは新たなプライバシーリスクを導入している: 敵は慎重に構築されたクエリを発行し、センシティブなコンテンツを徐々に流出させる。
RAGCRAWLERは,情報公開のための知識グラフを構築し,未検索領域を対象としたセマンティック空間でのクエリを計画する。
論文 参考訳(メタデータ) (2026-01-22T05:59:42Z) - The Silent Saboteur: Imperceptible Adversarial Attacks against Black-Box Retrieval-Augmented Generation Systems [101.68501850486179]
本稿では,RAGシステムに対する敵攻撃について検討し,その脆弱性を同定する。
このタスクは、ターゲット文書を検索する非知覚的な摂動を見つけることを目的としており、もともとはトップ$k$の候補セットから除外されていた。
本稿では、攻撃者とターゲットRAG間の相互作用を追跡する強化学習ベースのフレームワークであるReGENTを提案する。
論文 参考訳(メタデータ) (2025-05-24T08:19:25Z) - On the Potential of Re-configurable Intelligent Surface (RIS)-assisted Physical Layer Authentication (PLA) [0.0]
再構成可能なインテリジェントサーフェス(RIS)技術は、次世代無線ネットワークの潜在的なコンポーネントになりつつある。
しかし、RIS支援無線通信のブロードキャスト特性は、物理的層における悪意のある攻撃に対して脆弱である。
本稿では、RISを利用した物理層認証(PLA)の可能性を確保するためのRIS支援無線通信システムについて検討する。
論文 参考訳(メタデータ) (2024-05-01T10:17:24Z) - Provably Efficient Risk-Sensitive Reinforcement Learning: Iterated CVaR
and Worst Path [40.4378338001229]
本稿では,各段階における報酬対ゴーのテールを最大化することを目的とした,反復型CVaR RL(Iterated CVaR RL)という,新たなエピソード型リスク感応型強化学習(RL)問題について検討する。
この定式化は、意思決定プロセスを通して強いリスク回避を要求する現実世界のタスクに適用できる。
論文 参考訳(メタデータ) (2022-06-06T15:24:06Z) - Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。
我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文 参考訳(メタデータ) (2021-06-21T21:42:08Z) - Ultra-Reliable Indoor Millimeter Wave Communications using Multiple
Artificial Intelligence-Powered Intelligent Surfaces [115.85072043481414]
複数人工知能(AI)対応再構成可能なインテリジェントサーフェス(RIS)を用いた超信頼性ミリ波(mmW)通信を保証する新しいフレームワークを提案する。
複数のAI駆動RISを使用することで、mmWアクセスポイント(AP)から送信される信号の伝搬方向を変更できます。
mmW APとRISのポリシーを制御するために、2つの集中型および分散コントローラが提案されている。
論文 参考訳(メタデータ) (2021-03-31T19:15:49Z) - Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。
敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文 参考訳(メタデータ) (2020-08-05T07:49:42Z) - Robust Deep Reinforcement Learning against Adversarial Perturbations on
State Observations [88.94162416324505]
深部強化学習(DRL)エージェントは、自然な測定誤差や対向雑音を含む観測を通して、その状態を観察する。
観測は真の状態から逸脱するので、エージェントを誤解させ、準最適行動を起こすことができる。
本研究は, 従来の手法を, 対人訓練などの分類タスクの堅牢性向上に応用することは, 多くのRLタスクには有効でないことを示す。
論文 参考訳(メタデータ) (2020-03-19T17:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。