Fugu-MT 論文翻訳(概要): Automated Security Response through Online Learning with Adaptive Conjectures

論文の概要: Automated Security Response through Online Learning with Adaptive Conjectures

arxiv url: http://arxiv.org/abs/2402.12499v1
Date: Mon, 19 Feb 2024 20:06:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 18:25:27.509483
Title: Automated Security Response through Online Learning with Adaptive Conjectures
Title（参考訳）: Adaptive Conjecturesを用いたオンライン学習によるセキュリティ応答の自動生成
Authors: Kim Hammar, Tao Li, Rolf Stadler, Quanyan Zhu
Abstract要約: 我々はITインフラに対する自動セキュリティ対応について研究する。我々は攻撃者とディフェンダーとの相互作用を部分的に観察された非静止ゲームとして定式化する。
参考スコア（独自算出の注目度）: 14.5729517924905
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: We study automated security response for an IT infrastructure and formulate the interaction between an attacker and a defender as a partially observed, non-stationary game. We relax the standard assumption that the game model is correctly specified and consider that each player has a probabilistic conjecture about the model, which may be misspecified in the sense that the true model has probability 0. This formulation allows us to capture uncertainty about the infrastructure and the intents of the players. To learn effective game strategies online, we design a novel method where a player iteratively adapts its conjecture using Bayesian learning and updates its strategy through rollout. We prove that the conjectures converge to best fits, and we provide a bound on the performance improvement that rollout enables with a conjectured model. To characterize the steady state of the game, we propose a variant of the Berk-Nash equilibrium. We present our method through an advanced persistent threat use case. Simulation studies based on testbed measurements show that our method produces effective security strategies that adapt to a changing environment. We also find that our method enables faster convergence than current reinforcement learning techniques.
Abstract（参考訳）: 筆者らは,ITインフラの自動セキュリティ対応について検討し,攻撃者と守備者のインタラクションを部分的に観察された非静止ゲームとして定式化する。ゲームモデルが正しく指定されているという標準的な仮定を緩和し、各プレイヤーがモデルに関する確率的予想を持っていることを考慮し、真のモデルが確率 0 を持つという意味では誤特定されるかもしれない。この定式化によって,プレーヤのインフラストラクチャや意図に関する不確実性が把握できます。効果的なゲーム戦略をオンラインで学ぶために,ベイズ学習を用いてプレイヤーが反復的にその予想に適応し,ロールアウトによって戦略を更新する新しい手法を考案する。我々は、予想が最適に収束することを証明し、ロールアウトが予想モデルで実現する性能改善の限界を提供する。ゲームの定常状態を特徴付けるために,バーク・ナッシュ均衡の変種を提案する。本手法は先進的な持続的脅威ユースケースを通じて提案する。テストベッド測定に基づくシミュレーション研究により, 環境変化に対応する効果的なセキュリティ戦略が得られた。また,本手法は現在の強化学習手法よりも高速な収束を可能にする。

関連論文リスト

MAGIC: A Co-Evolving Attacker-Defender Adversarial Game for Robust LLM Safety [28.246225272659917]
本稿では,新しいマルチターンマルチエージェント強化学習フレームワークであるtextbfMAGICを紹介する。大規模言語モデルの安全性アライメントを敵非対称ゲームとして定式化する。本フレームワークは, モデルの有用性を損なうことなく, 優れた防衛成功率を示す。
論文参考訳（メタデータ） (2026-02-02T02:12:28Z)
Attacking and Securing Community Detection: A Game-Theoretic Framework [22.20017945724223]
逆グラフは、ディープグラフモデルが分類タスクで失敗する可能性がある。本稿では,コミュニティ検出問題に対する新たな攻撃・防御手法を提案する。これらの技術は、ソーシャルネットワークにおける個人のプライバシーを保護するなど、現実世界のシナリオに多くの応用がある。
論文参考訳（メタデータ） (2025-12-12T08:17:33Z)
FedStrategist: A Meta-Learning Framework for Adaptive and Robust Aggregation in Federated Learning [0.10241134756773229]
フェデレートラーニング(FL)は、プライバシ保護のための協調AIのパラダイムを提供するが、その分散された性質は、毒殺攻撃をモデル化するための重大な脆弱性を生み出している。本稿では、ロバストアグリゲーションをリアルタイムでコストを意識した制御問題として再編成する新しいメタラーニングフレームワークであるFedStrategistを紹介する。
論文参考訳（メタデータ） (2025-07-18T18:53:26Z)
Chasing Moving Targets with Online Self-Play Reinforcement Learning for Safer Language Models [55.28518567702213]
従来の言語モデル(LM)の安全性アライメントは、リアクティブで非結合な手順に依存している。このシーケンシャルなアプローチはミスマッチを生み出し、攻撃者は時代遅れの防御に過度に適合する一方、守備側は出現する脅威に常に遅れをとどめている。我々は,攻撃者と防御エージェントが継続的なインタラクションを通じて共進化するオンラインセルフプレイ強化学習アルゴリズムであるSelf-RedTeamを提案する。
論文参考訳（メタデータ） (2025-06-09T06:35:12Z)
Preference-based opponent shaping in differentiable games [3.373994463906893]
そこで我々は,エージェントの嗜好を協調に向けて形作ることによって,戦略学習プロセスを強化するためのPBOS法を提案する。様々な異なるゲームにおいてPBOSアルゴリズムの性能を検証する。
論文参考訳（メタデータ） (2024-12-04T06:49:21Z)
In-Context Exploiter for Extensive-Form Games [38.24471816329584]
In-Context Exploiter (ICE) という新しい手法を導入し、ゲーム内の任意のプレイヤーとして動作し、コンテキスト内学習によって完全に対戦相手を適応的に活用できる単一モデルを訓練する。我々のICEアルゴリズムは、多様な相手戦略の生成、強化学習アルゴリズムによる対話的履歴データの収集、そしてよく設計されたカリキュラム学習フレームワークにおけるトランスフォーマーベースのエージェントの訓練を含む。
論文参考訳（メタデータ） (2024-08-10T14:59:09Z)
Adversarial Robustification via Text-to-Image Diffusion Models [56.37291240867549]
アドリラルロバスト性は、ニューラルネットワークをエンコードする難しい性質として伝統的に信じられてきた。データを使わずに敵の堅牢性を実現するために,スケーラブルでモデルに依存しないソリューションを開発した。
論文参考訳（メタデータ） (2024-07-26T10:49:14Z)
Towards a Game-theoretic Understanding of Explanation-based Membership Inference Attacks [8.06071340190569]
ブラックボックス機械学習(ML)モデルは、メンバーシップ推論攻撃(MIA)のようなプライバシ脅威を実行するために利用することができる。既存の作業は、敵とターゲットMLモデルの間の単一の"What if"相互作用シナリオにおいてのみ、MIAを分析している。このような最適しきい値が存在することを証明し、MIAの起動に使用できる音響数学的定式化を提案する。
論文参考訳（メタデータ） (2024-04-10T16:14:05Z)
Conjectural Online Learning with First-order Beliefs in Asymmetric Information Stochastic Games [13.33996350474556]
非対称情報ゲーム(AISG)は多くの複雑な社会技術システムで発生する。本稿では,AISGにおける汎用情報構造に基づくオンライン学習手法であるConjectural Online Learning (COL)を提案する。
論文参考訳（メタデータ） (2024-02-29T01:07:29Z)
Mutual-modality Adversarial Attack with Semantic Perturbation [81.66172089175346]
本稿では,相互モダリティ最適化スキームにおける敵攻撃を生成する新しい手法を提案する。我々の手法は最先端の攻撃方法より優れており、プラグイン・アンド・プレイ・ソリューションとして容易にデプロイできる。
論文参考訳（メタデータ） (2023-12-20T05:06:01Z)
Scalable Learning of Intrusion Responses through Recursive Decomposition [0.0]
本稿では,ITインフラへの自動侵入応答と,攻撃者と防御者との相互作用を部分的に観察されたゲームとして検討する。この問題を解決するために、我々は、強化学習と均衡に向けた自己プレイを通じて、攻撃戦略と防衛戦略が共進化するアプローチに従う。近似により平衡を学習するDFSP(Decompositional Fictitious Self-Play)アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-09-06T18:12:07Z)
Avoid Adversarial Adaption in Federated Learning by Multi-Metric Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。 FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。 MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文参考訳（メタデータ） (2023-06-06T11:44:42Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
FLIP: A Provable Defense Framework for Backdoor Mitigation in Federated Learning [66.56240101249803]
我々は,クライアントの強固化がグローバルモデル(および悪意のあるクライアント)に与える影響について検討する。本稿では, 逆エンジニアリングによる防御手法を提案するとともに, 堅牢性を保証して, 改良を実現できることを示す。競合する8つのSOTA防御法について, 単発および連続のFLバックドア攻撃に対して, 提案手法の実証的優位性を示した。
論文参考訳（メタデータ） (2022-10-23T22:24:03Z)
Nash Equilibria and Pitfalls of Adversarial Training in Adversarial Robustness Games [51.90475640044073]
本研究では,2プレイヤゼロサムゲームにおける最適応答戦略の交互化として,対戦訓練について検討する。一方、ゲームのユニークな純粋なナッシュ均衡が存在し、確実に堅牢である。
論文参考訳（メタデータ） (2022-10-23T03:21:01Z)
Resisting Deep Learning Models Against Adversarial Attack Transferability via Feature Randomization [17.756085566366167]
本研究では,ディープラーニングモデルを対象とした8つの敵攻撃に抵抗する特徴ランダム化に基づく手法を提案する。本手法は,標的ネットワークを確保でき,敵の攻撃伝達可能性に対して60%以上抵抗することができる。
論文参考訳（メタデータ） (2022-09-11T20:14:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。