論文の概要: Unified Game Moderation: Soft-Prompting and LLM-Assisted Label Transfer for Resource-Efficient Toxicity Detection
- arxiv url: http://arxiv.org/abs/2506.06347v1
- Date: Sun, 01 Jun 2025 20:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.207613
- Title: Unified Game Moderation: Soft-Prompting and LLM-Assisted Label Transfer for Resource-Efficient Toxicity Detection
- Title(参考訳): 統一ゲームモデレーション:資源効率の良い毒性検出のためのソフトプロンピングとLCM支援ラベル転送
- Authors: Zachary Yang, Domenico Tullo, Reihaneh Rabbany,
- Abstract要約: ゲームコミュニティにおける毒性の検出は、複数のゲームや言語にまたがる拡張において、大きなスケーリング上の課題に直面している。
BERTベースのリアルタイム毒性検出システムであるToxBusterに関するこれまでの研究に基づいて,これらの課題に対処するための2つの重要な知見を提示する。
- 参考スコア(独自算出の注目度): 4.779196219827507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Toxicity detection in gaming communities faces significant scaling challenges when expanding across multiple games and languages, particularly in real-time environments where computational efficiency is crucial. We present two key findings to address these challenges while building upon our previous work on ToxBuster, a BERT-based real-time toxicity detection system. First, we introduce a soft-prompting approach that enables a single model to effectively handle multiple games by incorporating game-context tokens, matching the performance of more complex methods like curriculum learning while offering superior scalability. Second, we develop an LLM-assisted label transfer framework using GPT-4o-mini to extend support to seven additional languages. Evaluations on real game chat data across French, German, Portuguese, and Russian achieve macro F1-scores ranging from 32.96% to 58.88%, with particularly strong performance in German, surpassing the English benchmark of 45.39%. In production, this unified approach significantly reduces computational resources and maintenance overhead compared to maintaining separate models for each game and language combination. At Ubisoft, this model successfully identifies an average of 50 players, per game, per day engaging in sanctionable behavior.
- Abstract(参考訳): ゲームコミュニティにおける毒性検出は、特に計算効率が不可欠なリアルタイム環境において、複数のゲームや言語にまたがる拡張において、大きなスケーリング課題に直面している。
BERTベースのリアルタイム毒性検出システムであるToxBusterに関するこれまでの研究に基づいて,これらの課題に対処するための2つの重要な知見を提示する。
まず,ゲームコンテキストトークンを組み込むことで,単一モデルを効果的に複数のゲームを扱うことが可能なソフトプロンプト手法を提案する。
第2に,GPT-4o-mini を用いた LLM 支援ラベル転送フレームワークを開発し,サポートを7言語に拡張した。
フランス、ドイツ、ポルトガル、ロシアでの実際のゲームチャットデータの評価は32.96%から58.88%の範囲でマクロF1スコアを獲得し、特にドイツ語のパフォーマンスは45.39%を上回った。
プロダクションにおいて、この統一されたアプローチは、各ゲームと言語の組み合わせごとに別々のモデルを維持するよりも、計算資源とメンテナンスのオーバーヘッドを著しく削減する。
Ubisoftでは、このモデルは1試合あたり平均50人のプレイヤーを1日に1回、制裁可能な行動で識別することに成功した。
関連論文リスト
- Cross-Lingual Pitfalls: Automatic Probing Cross-Lingual Weakness of Multilingual Large Language Models [55.14276067678253]
本稿では,Large Language Models (LLMs) における言語間関係の弱点を効率的に同定するための新しい手法を提案する。
この手法を用いて16言語で6,000以上のバイリンガルペアからなる新しいデータセットを構築し、最先端のモデルにおいても弱点を明らかにする効果を実証した。
さらに,言語的類似性と言語間の弱点との関係について検討し,言語的関連言語が類似した演奏パターンを共有することを明らかにした。
論文 参考訳(メタデータ) (2025-05-24T12:31:27Z) - Multi-agent KTO: Reinforcing Strategic Interactions of Large Language Model in Language Game [32.791648070823776]
本稿では,言語エージェントがコンテキスト内相互作用を通じて学習できることを提案する。
マルチエージェントKahneman & Tversky's Optimization (MaKTO) を開発した。
MaKTOは様々なモデルの平均勝利率を61%達成している。
論文 参考訳(メタデータ) (2025-01-24T04:09:03Z) - Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and Observations [59.056367787688146]
本稿では, マルチリンガル数学推論 (xMR) LLM の探索と学習の先駆者である。
我々は10の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
翻訳を利用して、10個の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
論文 参考訳(メタデータ) (2023-10-31T08:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。