論文の概要: Efficient Toxicity Detection in Gaming Chats: A Comparative Study of Embeddings, Fine-Tuned Transformers and LLMs
- arxiv url: http://arxiv.org/abs/2510.17924v1
- Date: Mon, 20 Oct 2025 08:03:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.354375
- Title: Efficient Toxicity Detection in Gaming Chats: A Comparative Study of Embeddings, Fine-Tuned Transformers and LLMs
- Title(参考訳): ゲームチェットの高効率毒性検出:埋め込み, 微調整トランス, LLMの比較検討
- Authors: Yehor Tereshchenko, Mika Hämäläinen,
- Abstract要約: 本稿では,オンラインゲームチャットにおける毒性の自動検出のための自然言語処理(NLP)手法の比較分析を行う。
埋め込みを伴う従来の機械学習モデル、大型言語モデル(LLM)、ゼロショットおよび少数ショットプロンプト、微調整トランスフォーマーモデル、検索拡張生成アプローチの評価を行う。
この結果は,動的オンラインゲーム環境において,費用対効果の高い効率的なコンテンツモデレーションシステムを展開するための実証的な証拠を提供する。
- 参考スコア(独自算出の注目度): 0.18907108368038214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a comprehensive comparative analysis of Natural Language Processing (NLP) methods for automated toxicity detection in online gaming chats. Traditional machine learning models with embeddings, large language models (LLMs) with zero-shot and few-shot prompting, fine-tuned transformer models, and retrieval-augmented generation (RAG) approaches are evaluated. The evaluation framework assesses three critical dimensions: classification accuracy, processing speed, and computational costs. A hybrid moderation system architecture is proposed that optimizes human moderator workload through automated detection and incorporates continuous learning mechanisms. The experimental results demonstrate significant performance variations across methods, with fine-tuned DistilBERT achieving optimal accuracy-cost trade-offs. The findings provide empirical evidence for deploying cost-effective, efficient content moderation systems in dynamic online gaming environments.
- Abstract(参考訳): 本稿では,オンラインゲームチャットにおける毒性の自動検出のための自然言語処理(NLP)手法の総合的比較分析を行う。
埋め込みを伴う従来の機械学習モデル、ゼロショットおよび少数ショットプロンプト付き大言語モデル(LLM)、微調整トランスフォーマーモデル、検索拡張生成(RAG)アプローチを評価する。
評価フレームワークは、分類精度、処理速度、計算コストの3つの重要な次元を評価する。
自動検出による人間のモデレーター負荷を最適化し,連続学習機構を取り入れたハイブリッドモデレーションシステムアーキテクチャを提案する。
実験結果から,DistilBERTを微調整し,高精度で高精度なトレードオフを実現する方法が得られた。
この結果は,動的オンラインゲーム環境において,費用対効果の高い効率的なコンテンツモデレーションシステムを展開するための実証的な証拠を提供する。
関連論文リスト
- Leveraging VAE-Derived Latent Spaces for Enhanced Malware Detection with Machine Learning Classifiers [0.0]
本稿では,決定木,ナイーブベイズ,ライトGBM,ロジスティック回帰,ランダムフォレストという5つの機械学習分類器の性能を評価する。
異なるランダムシードで異なるトレーニングテストスプリットで実施された実験の結果、すべてのモデルがマルウェアの検出において良好に機能していることが判明した。
論文 参考訳(メタデータ) (2025-03-24T14:44:55Z) - Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - Human Evaluation of English--Irish Transformer-Based NMT [2.648836772989769]
ベストパフォーマンスのTransformerシステムは、RNNベースのモデルと比較して精度と誤差を著しく低減する。
Google Translateに対してベンチマークを行ったところ、我々の翻訳エンジンは大幅に改善された。
論文 参考訳(メタデータ) (2024-03-04T11:45:46Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Improving Surrogate Model Robustness to Perturbations for Dynamical Systems Through Machine Learning and Data Assimilation [0.0789257770465417]
本稿では,機械学習とデータ同化技術を組み合わせてサロゲートモデルを改善する新しいフレームワークを提案する。
本研究では,入力摂動下でのサロゲートモデルの精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-07-19T05:45:05Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - MM-KTD: Multiple Model Kalman Temporal Differences for Reinforcement
Learning [36.14516028564416]
本稿では、最適制御ポリシーを学習するための革新的マルチモデルカルマン時間差分(MM-KTD)フレームワークを提案する。
システムのサンプリング効率を高めるために,能動的学習法を提案する。
実験の結果, MM-KTDフレームワークは最先端のフレームワークに比べて優れていた。
論文 参考訳(メタデータ) (2020-05-30T06:39:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。