論文の概要: Multi-Stage Training for Abusive Comment Detection in Indic Languages
- arxiv url: http://arxiv.org/abs/2605.22380v1
- Date: Thu, 21 May 2026 12:09:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.24783
- Title: Multi-Stage Training for Abusive Comment Detection in Indic Languages
- Title(参考訳): インデックス言語における虐待的コメント検出のための多段階学習
- Authors: Pranshu Rastogi, Madhav Mathur, Ramaneswaran S, Kshitij Mohan,
- Abstract要約: 言語に基づく事前処理と複数のモデルのアンサンブルを用いて、虐待的コメント検出の性能を解析する。
本研究では, 表現の自由を損なうことなく, 悪質なコメントを検知できるように, 偽陽性率を最小限に抑えるパイプラインを提案する。
- 参考スコア(独自算出の注目度): 3.096122718690278
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years social media has become an increasingly popular tool for communication. People use it to share their ideas, exchange information, and discuss thoughts. Given its prevalence and widespread reach, social media must remain a safe space for people. Content generated on social media can be abusive and it has become increasingly important to detect such content. In this paper, we use a language-based preprocessing and an ensemble of several models and analyze their performance of abusive comment detection. Through extensive experimentation, we propose a pipeline that minimizes the false-positive rate (marking non-abusive as abusive) so that these systems can detect abusive comments without undermining the freedom of expression.
- Abstract(参考訳): 近年、ソーシャルメディアはコミュニケーションのツールとしてますます人気が高まっている。
人々は自分の考えを共有し、情報を交換し、考えを議論するためにそれを使う。
その流行と幅広いリーチを考えると、ソーシャルメディアは人々にとって安全な場所であり続けなければならない。
ソーシャルメディア上で生成されたコンテンツは悪用され、そのようなコンテンツを検出することがますます重要になっている。
本稿では,言語に基づく事前処理と複数のモデルのアンサンブルを用いて,虐待的コメント検出の性能を解析する。
広範にわたる実験を通じて, 表現の自由を損なうことなく, 悪質なコメントを検出できるように, 偽陽性率を最小限に抑えるパイプラインを提案する。
関連論文リスト
- Will I Get Hate Speech Predicting the Volume of Abusive Replies before Posting in Social Media [0.0]
テキスト、テキストメタデータ、ツイートメタデータ、アカウント機能という4種類の機能を調べます。
これにより、ユーザやコンテンツが、虐待的な返信の数を予測するのにどの程度役立つかを理解するのに役立ちます。
私たちの目的の1つは、ツイートが受ける虐待的な反応の量が、ツイートの内容や、それを投稿するユーザのアイデンティティによって動機付けられる範囲を決定することです。
論文 参考訳(メタデータ) (2025-03-04T21:04:21Z) - A survey of textual cyber abuse detection using cutting-edge language models and large language models [0.0]
ソーシャルメディアで広く普及している様々な乱用形態を包括的に分析する。
我々は,言語モデル (LM) や大規模言語モデル (LLM) といった新興技術が,乱用コンテンツの検出と生成を両立させていることに注目した。
論文 参考訳(メタデータ) (2025-01-09T18:55:50Z) - Analyzing Norm Violations in Live-Stream Chat [49.120561596550395]
本研究は,ライブストリーミングプラットフォーム上での会話における規範違反を検出することを目的とした,最初のNLP研究である。
ライブストリームチャットにおける標準違反カテゴリを定義し、Twitchから4,583のコメントを注釈付けします。
以上の結果から,適切なコンテキスト情報がモデレーション性能を35%向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-18T05:58:27Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Explainable Abuse Detection as Intent Classification and Slot Filling [66.80201541759409]
我々は、システムがデータ検査だけで乱用を構成する事象を確実に学習できるという非現実的な期待を捨て、政策対応による悪用検出の概念を導入する。
目的分類とスロットフィリングのためのアーキテクチャは、モデル決定の根拠を提供しながら、悪用検出にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2022-10-06T03:33:30Z) - Enriching Abusive Language Detection with Community Context [0.3708656266586145]
叙述表現の使用は、良心的または活発な権限を与えることができる。
乱用検出のモデルは、これらの表現を軽蔑的で不注意に、疎外されたグループが持つ生産的な会話を検閲するものとして誤分類する。
本稿では,コミュニティの文脈が乱用言語検出における分類結果をどのように改善するかを強調した。
論文 参考訳(メタデータ) (2022-06-16T20:54:02Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - The User behind the Abuse: A Position on Ethics and Explainability [25.791014642037585]
ユーザとオンラインコミュニティのモデリングが乱用検知に果たす役割について論じる。
その後、ユーザー情報とコミュニティ情報を取り入れる倫理的課題を探求します。
説明可能な方法が示すべき特性について提案する。
論文 参考訳(メタデータ) (2021-03-31T16:20:37Z) - AbuseAnalyzer: Abuse Detection, Severity and Target Prediction for Gab
Posts [19.32095911241636]
本稿では, 虐待, 重大さ, 虐待行為のターゲットの観点から, オンライン虐待に着目した 7601 投稿を Gab から提供した。
また,これらの課題に対処するシステムを提案し,乱用の有無を80%,虐待対象予測を82%,虐待重症度予測を65%とした。
論文 参考訳(メタデータ) (2020-09-30T18:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。