論文の概要: Comparative Analysis of Machine Learning and Deep Learning Algorithms
for Detection of Online Hate Speech
- arxiv url: http://arxiv.org/abs/2108.01063v1
- Date: Fri, 23 Apr 2021 04:19:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-02 14:51:31.115268
- Title: Comparative Analysis of Machine Learning and Deep Learning Algorithms
for Detection of Online Hate Speech
- Title(参考訳): オンラインヘイトスピーチ検出のための機械学習とディープラーニングアルゴリズムの比較分析
- Authors: Tashvik Dhamija, Anjum, Rahul Katarya
- Abstract要約: 機械学習を用いてヘイトスピーチを分類する試みはいくつかあるが、最先端のモデルは実用的な応用には不十分である。
本稿では,様々な埋め込みから従来のNLPアルゴリズムまで,さまざまな特徴工学手法について検討する。
BERTをベースとした埋め込みは、この問題に最も有用な機能を提供し、実用的な堅牢なモデルにできる能力を持っていると結論付けている。
- 参考スコア(独自算出の注目度): 5.543220407902113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the day and age of social media, users have become prone to online hate
speech. Several attempts have been made to classify hate speech using machine
learning but the state-of-the-art models are not robust enough for practical
applications. This is attributed to the use of primitive NLP feature
engineering techniques. In this paper, we explored various feature engineering
techniques ranging from different embeddings to conventional NLP algorithms. We
also experimented with combinations of different features. From our
experimentation, we realized that roBERTa (robustly optimized BERT approach)
based sentence embeddings classified using decision trees gives the best
results of 0.9998 F1 score. In our paper, we concluded that BERT based
embeddings give the most useful features for this problem and have the capacity
to be made into a practical robust model.
- Abstract(参考訳): ソーシャルメディアの日々と時代において、ユーザーはオンラインヘイトスピーチの傾向が強まっている。
機械学習を用いてヘイトスピーチを分類する試みはいくつかあるが、最先端のモデルは実用的な応用には不十分である。
これはプリミティブNLP機能エンジニアリング技術の使用によるものである。
本稿では,様々な埋め込みから従来のNLPアルゴリズムまで,さまざまな特徴工学手法について検討する。
さまざまな機能の組み合わせも実験しました。
実験の結果,roBERTa (robustly optimized BERT approach) を用いた文の埋め込みが0.9998 F1スコアの最良の結果をもたらすことがわかった。
本稿では,BERTをベースとした埋め込みがこの問題に最も有用な特徴を与え,実用的堅牢なモデルにできる能力を有することを結論付けた。
関連論文リスト
- Comparative Analysis of Libraries for the Sentimental Analysis [0.0]
この研究は、機械学習手法を用いたライブラリの比較を行うことが主な目的である。
PythonとRの5つのライブラリ、NLTK、Textlob Vader、Transformer(GPTとBERTの事前トレーニング)、Tidytextを使って感情分析技術を適用する。
論文 参考訳(メタデータ) (2023-07-26T17:21:53Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - A Context-Sensitive Word Embedding Approach for The Detection of Troll
Tweets [0.0]
本研究では,トロルツイートの自動検出のためのモデルアーキテクチャの開発と評価を行う。
BERT,ELMo,GloVeの埋め込み法はGloVe法よりも優れた性能を示した。
CNNおよびGRUエンコーダも同様にF1スコアとAUCで実行された。
AUCスコア0.929のGRU分類器を用いたELMoベースのアーキテクチャが最適であることがわかった。
論文 参考訳(メタデータ) (2022-07-17T17:12:16Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - On the Efficiency of Integrating Self-supervised Learning and
Meta-learning for User-defined Few-shot Keyword Spotting [51.41426141283203]
ユーザ定義キーワードスポッティングは、ユーザが定義する新しい音声用語を検出するタスクである。
これまでの研究は、自己教師付き学習モデルを取り入れたり、メタ学習アルゴリズムを適用しようとするものだった。
この結果から,HuBERTとMatching Networkを組み合わせることで,最適な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-04-01T10:59:39Z) - Nearest neighbour approaches for Emotion Detection in Tweets [1.7581155313656314]
我々は、簡単な実装が容易で説明可能な機械学習モデルであるkNN(Nearest Neighbours)を重み付けしたアプローチを提案する。
特に、SemEval-2018のツイートにおける共有感情検出タスクに重み付きkNNモデルを適用する。
論文 参考訳(メタデータ) (2021-07-08T13:00:06Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Comparing BERT against traditional machine learning text classification [0.0]
BERTモデルは近年、最先端の機械学習モデルとして人気を博している。
本研究の目的は,NLPタスクのデフォルトとしてBERTの使用を支持するか拒否する経験的エビデンスを追加することである。
論文 参考訳(メタデータ) (2020-05-26T20:14:39Z) - Leveraging End-to-End Speech Recognition with Neural Architecture Search [0.0]
ニューラルネットワーク最適化により,ディープスピーチモデルの精度を大幅に向上できることを示す。
提案手法は, TIMITコーパスにおける単語誤り率(WER)の7%, TIMITコーパスにおける13%の電話誤り率(PER)の検定誤差を, 最先端の結果と同等に達成する。
論文 参考訳(メタデータ) (2019-12-11T08:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。