論文の概要: Hate Content Detection via Novel Pre-Processing Sequencing and Ensemble Methods
- arxiv url: http://arxiv.org/abs/2409.05134v1
- Date: Sun, 8 Sep 2024 15:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 19:06:48.451777
- Title: Hate Content Detection via Novel Pre-Processing Sequencing and Ensemble Methods
- Title(参考訳): 新規プレプロシークエンシング法とアンサンブル法によるヘイトコンテンツ検出
- Authors: Anusha Chhabra, Dinesh Kumar Vishwakarma,
- Abstract要約: ソーシャルメディア、特にTwitterは、トロールやヘイトスピーチといったインシデントが大幅に増加した。
本稿では,ウェブ上のヘイトコンテンツを抑制するための計算フレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.647035299476894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media, particularly Twitter, has seen a significant increase in incidents like trolling and hate speech. Thus, identifying hate speech is the need of the hour. This paper introduces a computational framework to curb the hate content on the web. Specifically, this study presents an exhaustive study of pre-processing approaches by studying the impact of changing the sequence of text pre-processing operations for the identification of hate content. The best-performing pre-processing sequence, when implemented with popular classification approaches like Support Vector Machine, Random Forest, Decision Tree, Logistic Regression and K-Neighbor provides a considerable boost in performance. Additionally, the best pre-processing sequence is used in conjunction with different ensemble methods, such as bagging, boosting and stacking to improve the performance further. Three publicly available benchmark datasets (WZ-LS, DT, and FOUNTA), were used to evaluate the proposed approach for hate speech identification. The proposed approach achieves a maximum accuracy of 95.14% highlighting the effectiveness of the unique pre-processing approach along with an ensemble classifier.
- Abstract(参考訳): ソーシャルメディア、特にTwitterは、トロールやヘイトスピーチといったインシデントが大幅に増加した。
したがって、ヘイトスピーチを特定することが時間の必要性である。
本稿では,ウェブ上のヘイトコンテンツを抑制するための計算フレームワークを提案する。
具体的には、ヘイトコンテンツ識別のためのテキスト前処理操作のシーケンス変更の影響について、前処理アプローチの徹底的な研究を行った。
Support Vector Machine、Random Forest、Decision Tree、Logistic Regression、K-Neighborといった一般的な分類手法で実装された、最高のパフォーマンスの事前処理シーケンスは、パフォーマンスを大幅に向上させる。
さらに、最高の前処理シーケンスは、バッグング、ブースティング、スタックングなどの異なるアンサンブルメソッドと組み合わせて、パフォーマンスをさらに向上するために使用される。
3つの公開ベンチマークデータセット(WZ-LS、DT、FOUNTA)を用いて、ヘイトスピーチ識別のための提案手法の評価を行った。
提案手法は95.14%の最大精度を達成し、アンサンブル分類器とともに独自の前処理手法の有効性を強調した。
関連論文リスト
- AggregHate: An Efficient Aggregative Approach for the Detection of Hatemongers on Social Platforms [4.649475179575046]
ヘイト・モンガーの検出には,ヘイトフルテキストやユーザ・アクティビティ,ユーザ・ネットワークを考慮し,マルチモーダル・アグリゲーティブ・アプローチを検討する。
本手法は, コーデックメッセージの分類, ドッグホイストリング, 人種的ガスライティングの改善, 介入対策の通知に有効である。
論文 参考訳(メタデータ) (2024-09-22T14:29:49Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - Diffusion Action Segmentation [63.061058214427085]
本稿では,このような反復的洗練の本質的な精神を共用した拡散モデルによる新しい枠組みを提案する。
このフレームワークでは、入力された映像の特徴を条件としてランダムノイズから行動予測を反復的に生成する。
論文 参考訳(メタデータ) (2023-03-31T10:53:24Z) - Encoder-Decoder Model for Suffix Prediction in Predictive Monitoring [0.0]
接尾辞予測問題に対するほとんどのアプローチは、次の活動のみを予測する方法を学ぶことによって接尾辞を予測することを学ぶ。
本稿では,プレフィックスの表現学習を推論フェーズから分離するアテンション機構を備えたエンコーダ・デコーダモデルに基づく新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-29T11:27:29Z) - Speech Enhancement and Dereverberation with Diffusion-based Generative
Models [14.734454356396157]
本稿では,微分方程式に基づく拡散過程について概説する。
提案手法により,30段階の拡散しか行わず,高品質なクリーン音声推定が可能であることを示す。
大規模なクロスデータセット評価では、改良された手法が近年の識別モデルと競合することを示す。
論文 参考訳(メタデータ) (2022-08-11T13:55:12Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Query-Efficient and Scalable Black-Box Adversarial Attacks on Discrete
Sequential Data via Bayesian Optimization [10.246596695310176]
ブラックボックス設定における離散的な逐次データに基づくモデルに対する敵攻撃の問題に焦点をあてる。
我々はベイジアン最適化を用いたクエリ効率の良いブラックボックス攻撃を提案し、重要な位置を動的に計算する。
そこで我々は,摂動サイズを小さくした逆例を求めるポスト最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-06-17T06:11:36Z) - FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality
Assessment [93.09267863425492]
競争力のあるスポーツビデオにおける行動の高レベル意味論と内部時間構造の両方を理解することが、予測を正確かつ解釈可能なものにする鍵である、と我々は主張する。
本研究では,多様なダイビングイベントに対して,アクションプロシージャに関する詳細なアノテーションを付加した,ファインディビングと呼ばれる詳細なデータセットを構築した。
論文 参考訳(メタデータ) (2022-04-07T17:59:32Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。