論文の概要: Adversarial Knapsack and Secondary Effects of Common Information for Cyber Operations
- arxiv url: http://arxiv.org/abs/2403.10789v1
- Date: Sat, 16 Mar 2024 03:41:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 21:45:00.600110
- Title: Adversarial Knapsack and Secondary Effects of Common Information for Cyber Operations
- Title(参考訳): サイバー作戦における対人クナプサックと共通情報の二次的効果
- Authors: Jon Goohs, Georgel Savin, Lucas Starks, Josiah Dykstra, William Casey,
- Abstract要約: 本稿では,CTF(Capture the Flag)コンペティションのための動的ネットワーク制御ゲームを形式化し,各タイムステップごとに静的ゲームの詳細を示す。
我々は、重み付きKnapsack問題を相互作用するシステムとして、Adversarial Knapsack最適化問題を定義する。
シナリオ、報酬、コストに対する一般的な認識は、非協力的なゲームのステージにつくでしょう。
- 参考スコア(独自算出の注目度): 0.9378911615939924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variations of the Flip-It game have been applied to model network cyber operations. While Flip-It can accurately express uncertainty and loss of control, it imposes no essential resource constraints for operations. Capture the flag (CTF) style competitive games, such as Flip-It , entail uncertainties and loss of control, but also impose realistic constraints on resource use. As such, they bear a closer resemblance to actual cyber operations. We formalize a dynamical network control game for CTF competitions and detail the static game for each time step. The static game can be reformulated as instances of a novel optimization problem called Adversarial Knapsack (AK) or Dueling Knapsack (DK) when there are only two players. We define the Adversarial Knapsack optimization problems as a system of interacting Weighted Knapsack problems, and illustrate its applications to general scenarios involving multiple agents with conflicting optimization goals, e.g., cyber operations and CTF games in particular. Common awareness of the scenario, rewards, and costs will set the stage for a non-cooperative game. Critically, rational players may second guess that their AK solution -- with a better response and higher reward -- is possible if opponents predictably play their AK optimal solutions. Thus, secondary reasoning which such as belief modeling of opponents play can be anticipated for rational players and will introduce a type of non-stability where players maneuver for slight reward differentials. To analyze this, we provide the best-response algorithms and simulation software to consider how rational agents may heuristically search for maneuvers. We further summarize insights offered by the game model by predicting that metrics such as Common Vulnerability Scoring System (CVSS) may intensify the secondary reasoning in cyber operations.
- Abstract(参考訳): Flip-Itゲームのバリエーションは、ネットワークサイバー操作のモデル化に応用されている。
Flip-Itは不確実性と制御の損失を正確に表現できるが、操作に不可欠なリソース制約は課さない。
フラッグ(CTF)スタイルの競争ゲーム、例えばFlip-Itは、不確実性と制御の喪失を伴いますが、リソース使用に現実的な制約を課します。
そのため、実際のサイバー操作とよく似ている。
我々は,CTFコンペティションのための動的ネットワーク制御ゲームを形式化し,各タイムステップの静的ゲームを詳細に述べる。
静的ゲームは、プレイヤーが2人しかいない場合、Adversarial Knapsack (AK) または Dueling Knapsack (DK) と呼ばれる新しい最適化問題のインスタンスとして再構成することができる。
そこで我々は,Adversarial Knapsack最適化問題を,重み付きKnapsack問題と相互作用するシステムとして定義し,特にサイバー操作やCTFゲームなど,競合する最適化目標を持つ複数のエージェントを含む一般的なシナリオへの応用について説明する。
シナリオ、報酬、コストに対する一般的な認識は、非協力的なゲームのステージにつくでしょう。
批判的に言えば、合理的なプレイヤーは、AKのソリューション -- より良い応答とより高い報酬 -- が、AKの最適解を予想できるならば、その解が可能であると仮定するかもしれない。
したがって、相手の信念モデリングのような二次推論は、合理的なプレイヤーには期待でき、プレイヤーが微妙な報酬差の操作を行うような不安定なタイプを導入することができる。
これを分析するために、我々は、合理的エージェントがいかにヒューリスティックに操作を探索できるかを検討するために、最良の応答アルゴリズムとシミュレーションソフトウェアを提供する。
さらに,CVSS(Common Vulnerability Scoring System)のようなメトリクスが,サイバー操作における二次的推論を強化する可能性を予測して,ゲームモデルが提供する洞察を要約する。
関連論文リスト
- Data-Scarce Identification of Game Dynamics via Sum-of-Squares Optimization [29.568222003322344]
マルチプレイヤーの正規形式ゲームにおけるゲームダイナミクスを識別するためのサイドインフォーム支援回帰(SIAR)フレームワークを提案する。
SIARは、SOS(sum-of-squares)最適化を用いて解決され、その結果、システムの真の力学に確実に収束する近似の階層となる。
SIARフレームワークは,未知のシステムがカオスであっても,通常のゲーム,広く知られているゲームダイナミクスのファミリー,強力なベンチマークの範囲で,プレーヤの挙動を正確に予測する。
論文 参考訳(メタデータ) (2023-07-13T09:14:48Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - Adversarial Online Learning with Variable Plays in the Pursuit-Evasion
Game: Theoretical Foundations and Application in Connected and Automated
Vehicle Cybersecurity [5.9774834479750805]
対戦型・非確率型マルチアームバンディット(MPMAB)は,演奏するアームの数が変動している場合に拡張する。
この作業は、相互接続された輸送システムにおいて、異なる重要な場所をスキャンするために割り当てられたリソースが、時間とともに、環境によって動的に変化するという事実によって動機付けられている。
論文 参考訳(メタデータ) (2021-10-26T23:09:42Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - Visibility Optimization for Surveillance-Evasion Games [4.454557728745761]
監視回避差分ゲームでは,追跡者が常に移動中の回避者の視認性を維持する必要がある。
本研究では,ゲーム終了時間に対応するフィードバック値関数をアップウインド方式で計算する。
モンテカルロ木探索と自己再生強化学習が深層ニューラルネットワークをトレーニングし,オンラインゲームプレイのための合理的な戦略を生成することを示す。
論文 参考訳(メタデータ) (2020-10-18T15:02:41Z) - Complexity and Algorithms for Exploiting Quantal Opponents in Large
Two-Player Games [16.43565579998679]
伝統的なゲーム理論の解の概念は、完全に合理的なプレイヤーを前提としており、従って、従属的な相手を活用できる能力は限られている。
本稿では,通常のゲームや広角ゲームにおいて,量子的対戦相手に対する効果的で堅牢な戦略を計算するためのスケーラブルなアルゴリズムを解析し,提案することを目的とする。
論文 参考訳(メタデータ) (2020-09-30T09:14:56Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z) - Signaling in Bayesian Network Congestion Games: the Subtle Power of
Symmetry [66.82463322411614]
本論文は, 最適遠点透過型シグナリング方式の問題点に焦点をあて, 対称性がその解法において重要な性質であることを示す。
プレイヤーが対称でアフィンコスト関数を持つとき,最適なエクアント説得スキームが計算可能であることを示す。
論文 参考訳(メタデータ) (2020-02-12T19:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。