論文の概要: VISER: A Tractable Solution Concept for Games with Information Asymmetry
- arxiv url: http://arxiv.org/abs/2307.09652v1
- Date: Tue, 18 Jul 2023 21:51:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 16:05:44.933544
- Title: VISER: A Tractable Solution Concept for Games with Information Asymmetry
- Title(参考訳): VISER:情報非対称性を持つゲームのためのトラクタブルソリューションコンセプト
- Authors: Jeremy McMahan, Young Wu, Yudong Chen, Xiaojin Zhu, Qiaomin Xie
- Abstract要約: 我々はVISER(Victim Is Secure, Exploiter Best-Responds)と呼ばれる新しいソリューション概念を提案する。
VISERは、外部オブザーバがそのようなゲームの結果を予測することを可能にする。
本稿では,各プレイヤーのVISER戦略を線形プログラミングを用いて独立に計算可能であることを示す。
- 参考スコア(独自算出の注目度): 22.29425773648108
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many real-world games suffer from information asymmetry: one player is only
aware of their own payoffs while the other player has the full game
information. Examples include the critical domain of security games and
adversarial multi-agent reinforcement learning. Information asymmetry renders
traditional solution concepts such as Strong Stackelberg Equilibrium (SSE) and
Robust-Optimization Equilibrium (ROE) inoperative. We propose a novel solution
concept called VISER (Victim Is Secure, Exploiter best-Responds). VISER enables
an external observer to predict the outcome of such games. In particular, for
security applications, VISER allows the victim to better defend itself while
characterizing the most damaging attacks available to the attacker. We show
that each player's VISER strategy can be computed independently in polynomial
time using linear programming (LP). We also extend VISER to its Markov-perfect
counterpart for Markov games, which can be solved efficiently using a series of
LPs.
- Abstract(参考訳): 多くの現実世界のゲームは情報非対称性に悩まされており、一方のプレイヤーは自分の支払いのみを認識し、もう一方のプレイヤーは完全なゲーム情報を持っている。
例えば、セキュリティゲームの重要な領域や、敵のマルチエージェント強化学習がある。
情報非対称性は、SSE(Strong Stackelberg Equilibrium)やROE(Robust-Optimization Equilibrium)といった従来のソリューション概念を非機能的に表現する。
本稿では,VISER(Victim Is Secure, Exploiter best-Responds)という新しいソリューション概念を提案する。
VISERは、外部オブザーバがそのようなゲームの結果を予測することを可能にする。
特にセキュリティアプリケーションの場合、viserは攻撃者に最もダメージを与える攻撃を特徴付けながら、被害者の身を守るのに役立ちます。
各プレイヤーのバイザー戦略は線形計画 (lp) を用いて多項式時間で独立に計算できることを示す。
また,VISER を Markov ゲーム用の Markov 完全対応に拡張し,一連の LP を用いて効率よく解けるようにした。
関連論文リスト
- Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - White-box Multimodal Jailbreaks Against Large Vision-Language Models [61.97578116584653]
本稿では,テキストと画像のモダリティを併用して,大規模視覚言語モデルにおけるより広範な脆弱性のスペクトルを利用する,より包括的戦略を提案する。
本手法は,テキスト入力がない場合に,逆画像プレフィックスをランダムノイズから最適化し,有害な応答を多様に生成することから始める。
様々な有害な指示に対する肯定的な反応を誘発する確率を最大化するために、対向テキスト接頭辞を、対向画像接頭辞と統合し、共最適化する。
論文 参考訳(メタデータ) (2024-05-28T07:13:30Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Optimal Attack and Defense for Reinforcement Learning [11.36770403327493]
敵RLでは、外部攻撃者は、環境との相互作用を操作できる。
我々は、攻撃者が予想される報酬を最大化するステルス攻撃を設計する際の問題を示す。
被害者に対する最適な防衛方針は,Stackelbergゲームに対する解決策として計算できる,と我々は主張する。
論文 参考訳(メタデータ) (2023-11-30T21:21:47Z) - Multi-defender Security Games with Schedules [42.32444288821052]
セキュリティゲームは、しばしば高いセキュリティ設定で戦略的相互作用をモデル化するために使用される。
現実的なシナリオの多くは、より複雑なシステムに埋め込まれた独自の関心と優先順位を持つ複数の異質なディフェンダーを特徴としている。
マルチディフェンダーのセキュリティゲームとは異なり、スケジュールの導入は均衡の非存在を引き起こす可能性があることを示す。
論文 参考訳(メタデータ) (2023-11-28T00:39:02Z) - Baseline Defenses for Adversarial Attacks Against Aligned Language
Models [109.75753454188705]
最近の研究は、テキストのモデレーションが防御をバイパスするジェイルブレイクのプロンプトを生み出すことを示している。
検出(複雑度に基づく)、入力前処理(言い換えと再帰化)、対人訓練の3種類の防衛について検討する。
テキストに対する既存の離散化の弱点と比較的高いコストの最適化が組み合わさって、標準適応攻撃をより困難にしていることがわかった。
論文 参考訳(メタデータ) (2023-09-01T17:59:44Z) - Data-Scarce Identification of Game Dynamics via Sum-of-Squares Optimization [29.568222003322344]
マルチプレイヤーの正規形式ゲームにおけるゲームダイナミクスを識別するためのサイドインフォーム支援回帰(SIAR)フレームワークを提案する。
SIARは、SOS(sum-of-squares)最適化を用いて解決され、その結果、システムの真の力学に確実に収束する近似の階層となる。
SIARフレームワークは,未知のシステムがカオスであっても,通常のゲーム,広く知られているゲームダイナミクスのファミリー,強力なベンチマークの範囲で,プレーヤの挙動を正確に予測する。
論文 参考訳(メタデータ) (2023-07-13T09:14:48Z) - A Game-theoretic Framework for Privacy-preserving Federated Learning [46.479165992905166]
そこで我々は,それぞれの支払額の観点から,守備側と攻撃側の両方を考慮に入れた最初のゲーム理論フレームワークを提案する。
我々はこのゲームをFLPG(Federated Learning Privacy Game)と名付け、ディフェンダーもアタッカーもすべての参加者の報酬を意識していない。
論文 参考訳(メタデータ) (2023-04-11T14:20:31Z) - Learning Correlated Stackelberg Equilibrium in General-Sum
Multi-Leader-Single-Follower Games [16.810700878778007]
本研究では、非対称な役割を持つプレイヤーをリーダーとフォロワーに分けることができる階層型マルチプレイヤーゲーム構造について検討する。
特に、複数のリーダーと1人のフォロワーがいるStackelbergのゲームシナリオに焦点を当てています。
我々は、CSE(Correlated Stackelberg Equilibrium)と呼ばれるMLSFゲームのための新しい非対称平衡概念を提案する。
論文 参考訳(メタデータ) (2022-10-22T15:05:44Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Adversarial Online Learning with Variable Plays in the Pursuit-Evasion
Game: Theoretical Foundations and Application in Connected and Automated
Vehicle Cybersecurity [5.9774834479750805]
対戦型・非確率型マルチアームバンディット(MPMAB)は,演奏するアームの数が変動している場合に拡張する。
この作業は、相互接続された輸送システムにおいて、異なる重要な場所をスキャンするために割り当てられたリソースが、時間とともに、環境によって動的に変化するという事実によって動機付けられている。
論文 参考訳(メタデータ) (2021-10-26T23:09:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。