論文の概要: Who's Gaming the System? A Causally-Motivated Approach for Detecting Strategic Adaptation
- arxiv url: http://arxiv.org/abs/2412.02000v1
- Date: Mon, 02 Dec 2024 22:07:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:49:16.918188
- Title: Who's Gaming the System? A Causally-Motivated Approach for Detecting Strategic Adaptation
- Title(参考訳): 誰がシステムに賭けているのか? -戦略的適応検出のための因果的動機付けアプローチ-
- Authors: Trenton Chang, Lindsay Warrenburg, Sae-Hwan Park, Ravi B. Parikh, Maggie Makar, Jenna Wiens,
- Abstract要約: 我々は、最も積極的なゲーミングを行う「悪質な犯罪者:」エージェントを特定することを目標とするマルチエージェント設定について検討する。
本稿では,各エージェントのゲーム傾向をスカラーでパラメータ化するフレームワークを提案する。
異なるエージェントが異なる「処理」を表現している因果効果推定問題として問題を再キャストすることにより、ゲームパラメータによる全てのエージェントのランキングが特定可能であることを証明した。
- 参考スコア(独自算出の注目度): 12.528928000871405
- License:
- Abstract: In many settings, machine learning models may be used to inform decisions that impact individuals or entities who interact with the model. Such entities, or agents, may game model decisions by manipulating their inputs to the model to obtain better outcomes and maximize some utility. We consider a multi-agent setting where the goal is to identify the "worst offenders:" agents that are gaming most aggressively. However, identifying such agents is difficult without knowledge of their utility function. Thus, we introduce a framework in which each agent's tendency to game is parameterized via a scalar. We show that this gaming parameter is only partially identifiable. By recasting the problem as a causal effect estimation problem where different agents represent different "treatments," we prove that a ranking of all agents by their gaming parameters is identifiable. We present empirical results in a synthetic data study validating the usage of causal effect estimation for gaming detection and show in a case study of diagnosis coding behavior in the U.S. that our approach highlights features associated with gaming.
- Abstract(参考訳): 多くの設定では、機械学習モデルを使用して、モデルと対話する個人やエンティティに影響を与える決定を通知することができる。
このようなエンティティやエージェントは、モデルに対して入力を操作することで、より良い結果を得て、いくつかのユーティリティを最大化することで、モデル決定をゲームすることができる。
我々は、最も積極的なゲーミングを行う「悪質な犯罪者:」エージェントを特定することを目標とするマルチエージェント設定について検討する。
しかし,そのようなエージェントの同定は実用機能を知ることなしには困難である。
そこで本研究では,各エージェントのゲーム傾向をスカラーでパラメータ化するフレームワークを提案する。
このゲームパラメータは部分的にのみ識別可能であることを示す。
異なるエージェントが異なる「処理」を表現している因果効果推定問題として問題を再キャストすることにより、ゲームパラメータによる全てのエージェントのランキングが特定可能であることを証明した。
本研究では,ゲーム検出における因果効果推定の有効利用を検証した合成データ研究において経験的な結果を示し,本手法がゲームに関連する特徴を強調した米国における診断符号化行動のケーススタディを示す。
関連論文リスト
- Causes and Strategies in Multiagent Systems [4.1415148956390935]
並列ゲーム構造として表現されたマルチエージェントシステムモデルを,所定の構造因果モデルに対して体系的に構築する手法を提案する。
得られたいわゆる因果同時ゲーム構造では、遷移は与えられた因果モデルのエージェント変数に対する介入に対応する。
因果ゲーム構造はエージェントの戦略決定による因果的影響の分析と推論を可能にする。
論文 参考訳(メタデータ) (2025-02-19T13:18:42Z) - Expectation vs. Reality: Towards Verification of Psychological Games [18.30789345402813]
心理学ゲーム(PG)は、信念に依存した動機を持つエージェントをモデル化し分析する方法として開発された。
本稿では,ゲームの公式検証ツールであるPRISM-gamesでPGを解き,実装する手法を提案する。
論文 参考訳(メタデータ) (2024-11-08T14:41:52Z) - Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Generation of Games for Opponent Model Differentiation [2.164100958962259]
これまでの結果から,人間の振る舞いをモデル化することで,アルゴリズムの性能が大幅に向上することが示唆された。
本研究では、悪意ある行為を行う可能性を高める人格タイプを特定する心理学者によって収集されたデータを用いる。
私たちはそのパラメータと心理的特徴を結びつける新しいモデルを作成しました。
論文 参考訳(メタデータ) (2023-11-28T13:45:03Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - On Imperfect Recall in Multi-Agent Influence Diagrams [57.21088266396761]
マルチエージェント・インフルエンス・ダイアグラム(MAID)はベイズネットワークに基づくゲーム理論モデルとして人気がある。
混合ポリシと2種類の相関平衡を用いて, 忘れ易いエージェントと不注意なエージェントでMAIDを解く方法を示す。
また,不完全なリコールがしばしば避けられないマルコフゲームやチーム状況へのMAIDの適用についても述べる。
論文 参考訳(メタデータ) (2023-07-11T07:08:34Z) - Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は,競争行動の社会的影響に基づく新しい強化学習機構を提案する。
提案モデルでは, 人工エージェントの学習を調節するための競合スコアを導出するために, 客観的, 社会的認知的メカニズムを集約する。
論文 参考訳(メタデータ) (2022-08-22T14:06:06Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - Approximate exploitability: Learning a best response in large games [31.066412349285994]
我々は,エージェントに対する最良の応答を学習するための,スケーラブルな検索ベース深層強化学習アルゴリズムISMCTS-BRを紹介する。
本手法は,複数のエージェントに対する2プレイヤーゼロサムゲームにおいて実演する。
論文 参考訳(メタデータ) (2020-04-20T23:36:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。