論文の概要: Reinforcement Learning for Efficient Toxicity Detection in Competitive Online Video Games
- arxiv url: http://arxiv.org/abs/2503.20968v1
- Date: Wed, 26 Mar 2025 20:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:51:51.057667
- Title: Reinforcement Learning for Efficient Toxicity Detection in Competitive Online Video Games
- Title(参考訳): 競争型オンラインゲームにおける効率的な毒性検出のための強化学習
- Authors: Jacob Morrier, Rafal Kocielnik, R. Michael Alvarez,
- Abstract要約: 本稿では,競合するオンラインゲームにおける毒性検出のための効率的なサンプリングの問題点について考察する。
本稿では,有害な行動に関連する変数に基づいて,モニタリング決定を行うコンテキスト的帯域幅アルゴリズムを提案する。
人気のファーストパーソンアクションゲームCall of Duty: Modern Warfare IIIのデータを用いて、我々のアルゴリズムがベースラインアルゴリズムを一貫して上回っていることを示す。
- 参考スコア(独自算出の注目度): 1.9201314880477047
- License:
- Abstract: Online platforms take proactive measures to detect and address undesirable behavior, aiming to focus these resource-intensive efforts where such behavior is most prevalent. This article considers the problem of efficient sampling for toxicity detection in competitive online video games. To make optimal monitoring decisions, video game service operators need estimates of the likelihood of toxic behavior. If no model is available for these predictions, one must be estimated in real time. To close this gap, we propose a contextual bandit algorithm that makes monitoring decisions based on a small set of variables that, according to domain expertise, are associated with toxic behavior. This algorithm balances exploration and exploitation to optimize long-term outcomes and is deliberately designed for easy deployment in production. Using data from the popular first-person action game Call of Duty: Modern Warfare III, we show that our algorithm consistently outperforms baseline algorithms that rely solely on players' past behavior. This finding has substantive implications for the nature of toxicity. It also illustrates how domain expertise can be harnessed to help video game service operators identify and mitigate toxicity, ultimately fostering a safer and more enjoyable gaming experience.
- Abstract(参考訳): オンラインプラットフォームは、望ましくない行動を検出し、対処するための積極的な対策を講じ、そのような行動が最も多いこれらのリソース集約的な取り組みに集中することを目的としている。
本稿では,競合するオンラインゲームにおける毒性検出のための効率的なサンプリングの問題点について考察する。
最適な監視判断を行うには、ビデオゲームサービスオペレーターは有害な行動の可能性を見積もる必要がある。
これらの予測にモデルがない場合は、リアルタイムで見積もる必要がある。
このギャップを埋めるために、ドメインの専門知識によれば、有害な振る舞いに関連する小さな変数セットに基づいて監視決定を行うコンテキスト的帯域幅アルゴリズムを提案する。
このアルゴリズムは長期的成果を最適化するために探索と利用のバランスをとり、本番環境への展開を容易にするために意図的に設計されている。
人気のファーストパーソンアクションゲームCall of Duty: Modern Warfare IIIのデータを用いて、我々のアルゴリズムはプレイヤーの過去の行動にのみ依存するベースラインアルゴリズムを一貫して上回っていることを示す。
この発見は毒性の性質に実質的な意味を持つ。
また、ドメインの専門知識を活用して、ビデオゲームサービスのオペレーターが毒性を特定して軽減し、最終的により安全で楽しいゲーム体験を育む方法も説明している。
関連論文リスト
- Who's Gaming the System? A Causally-Motivated Approach for Detecting Strategic Adaptation [12.528928000871405]
我々は、最も積極的なゲーミングを行う「悪質な犯罪者:」エージェントを特定することを目標とするマルチエージェント設定について検討する。
本稿では,各エージェントのゲーム傾向をスカラーでパラメータ化するフレームワークを提案する。
異なるエージェントが異なる「処理」を表現している因果効果推定問題として問題を再キャストすることにより、ゲームパラメータによる全てのエージェントのランキングが特定可能であることを証明した。
論文 参考訳(メタデータ) (2024-12-02T22:07:48Z) - Uncovering the Viral Nature of Toxicity in Competitive Online Video Games [0.4681661603096334]
フリー・ツー・プレイのアクションゲーム『Call of Duty: Warzone』のプロプライエタリなデータを分析した。
選手のチームメイトが有毒なスピーチを行う確率は、平均的な選手が有毒なスピーチを行う確率の26.1倍から30.3倍になる。
論文 参考訳(メタデータ) (2024-10-01T18:07:06Z) - Challenges for Real-Time Toxicity Detection in Online Games [1.2289361708127877]
有害な行為や悪意のあるプレイヤーは経験を台無しにし、プレイヤーベースを減らし、ゲームやスタジオの成功を損なう可能性がある。
本稿では,テキスト,音声および画像処理問題,行動毒性の観点から,有害なコンテンツ検出に直面する課題について概説する。
論文 参考訳(メタデータ) (2024-07-05T09:38:58Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Discovering Imperfectly Observable Adversarial Actions using Anomaly
Detection [0.24244694855867271]
異常検出は異常で不審な振る舞いを発見する方法である。
このようなゲームを解くためのアルゴリズムを2つ提案する。
実験により、両方のアルゴリズムが低特徴空間次元の場合に適用可能であることが示された。
論文 参考訳(メタデータ) (2020-04-22T15:31:53Z) - Approximate exploitability: Learning a best response in large games [31.066412349285994]
我々は,エージェントに対する最良の応答を学習するための,スケーラブルな検索ベース深層強化学習アルゴリズムISMCTS-BRを紹介する。
本手法は,複数のエージェントに対する2プレイヤーゼロサムゲームにおいて実演する。
論文 参考訳(メタデータ) (2020-04-20T23:36:40Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z) - Exploration Based Language Learning for Text-Based Games [72.30525050367216]
本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
論文 参考訳(メタデータ) (2020-01-24T03:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。