論文の概要: Old wine in old glasses: Comparing computational and qualitative methods in identifying incivility on Persian Twitter during the #MahsaAmini movement
- arxiv url: http://arxiv.org/abs/2602.08688v1
- Date: Mon, 09 Feb 2026 14:10:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.269175
- Title: Old wine in old glasses: Comparing computational and qualitative methods in identifying incivility on Persian Twitter during the #MahsaAmini movement
- Title(参考訳): 古いグラスの古いワイン:#MahsaAmini運動におけるペルシャのTwitterの市民性同定における計算的および定性的手法の比較
- Authors: Hossein Kermani, Fatemeh Oudlajani, Pardis Yarahmadi, Hamideh Mahdi Soltani, Mohammad Makki, Zahra HosseiniKhoo,
- Abstract要約: 本稿では,ペルシャ語ツイートの市民性を検出するための3つのアプローチを比較した。
イランの#MahsaAmini運動の47,278のツイートを用いて、各手法の精度と効率を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper compares three approaches to detecting incivility in Persian tweets: human qualitative coding, supervised learning with ParsBERT, and large language models (ChatGPT). Using 47,278 tweets from the #MahsaAmini movement in Iran, we evaluate the accuracy and efficiency of each method. ParsBERT substantially outperforms seven evaluated ChatGPT models in identifying hate speech. We also find that ChatGPT struggles not only with subtle cases but also with explicitly uncivil content, and that prompt language (English vs. Persian) does not meaningfully affect its outputs. The study provides a detailed comparison of these approaches and clarifies their strengths and limitations for analyzing hate speech in a low-resource language context.
- Abstract(参考訳): 本稿では,ペルシャ語ツイートにおいて,人間の質的コーディング,ParsBERTによる教師付き学習,および大規模言語モデル(ChatGPT)の3つの手法を比較した。
イランの#MahsaAmini運動の47,278のツイートを用いて、各手法の精度と効率を評価した。
ParsBERTは、ヘイトスピーチの識別において、評価済みのChatGPTモデルよりも大幅に優れている。
また、ChatGPTは微妙なケースだけでなく、明らかに非シビルなコンテンツでも苦労しており、プロンプト言語(英語対ペルシア語)がそのアウトプットに意味のある影響を与えていないこともわかりました。
この研究は、これらのアプローチを詳細に比較し、低リソース言語コンテキストにおけるヘイトスピーチの分析の強みと限界を明らかにする。
関連論文リスト
- Digital Guardians: Can GPT-4, Perspective API, and Moderation API reliably detect hate speech in reader comments of German online newspapers? [36.636686462749275]
GPT-4oはGoogleのパースペクティブAPIとOpenAIのモデレーションAPIと比較される。
GPT-4oでは、ゼロショット(Zero-Shot)、ワンショット(One-Shot)、フューショット(Few-Shot)の3つの異なるプロンプトが使用される。
論文 参考訳(メタデータ) (2025-01-02T13:48:56Z) - The BS-meter: A ChatGPT-Trained Instrument to Detect Sloppy Language-Games [41.94295877935867]
シュロッピーブルッシャーの統計モデルは,フランクフルト人造ブルッシャーのChatGPTと,自然言語に見られるようなブルッシャーの政治的・職場的機能とを確実に関連付けることができることを示す。
論文 参考訳(メタデータ) (2024-11-22T18:55:21Z) - HateGPT: Unleashing GPT-3.5 Turbo to Combat Hate Speech on X [0.0]
マクロF1スコアを用いた分類モデルの性能評価を行った。
その結果,ラン1が最高性能を示し,精度とリコールの点でモデルが一貫して良好に動作していることが示唆された。
論文 参考訳(メタデータ) (2024-11-14T06:20:21Z) - In Generative AI we Trust: Can Chatbots Effectively Verify Political
Information? [39.58317527488534]
本稿では,2つの大規模言語モデル(LLM)ベースのチャットボットであるChatGPTとBing Chatの比較分析を行い,政治的情報の正確性を検出する。
AI監査手法を使用して、新型コロナウイルス、ロシアによるウクライナに対する攻撃、ホロコースト、気候変動、LGBTQ+関連の議論の5つのトピックについて、チャットボットが真、偽、および境界線をどう評価するかを調査する。
その結果, ベースライン精度評価タスクにおけるChatGPTの性能が向上し, 72%のケースが事前学習なしで言語平均で正しく評価された。
論文 参考訳(メタデータ) (2023-12-20T15:17:03Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Leveraging Transformers for Hate Speech Detection in Conversational
Code-Mixed Tweets [36.29939722039909]
本稿では,HASOC 2021サブタスク2のためのMIDAS-IIITDチームによって提案されたシステムについて述べる。
これは、Hindi- Englishのコードミキシングされた会話からヘイトスピーチを検出することに焦点を当てた最初の共有タスクの1つである。
Indic-BERT,XLM-RoBERTa,Multilingual BERTのハード投票アンサンブルがマクロF1スコア0.7253を達成した。
論文 参考訳(メタデータ) (2021-12-18T19:27:33Z) - Ceasing hate withMoH: Hate Speech Detection in Hindi-English
Code-Switched Language [2.9926023796813728]
本研究はヒンディー語・英語のコードスイッチング言語におけるヘイトスピーチの分析に焦点をあてる。
データ構造を含むため、Hindi の "Love" を意味する MoH または Map Only Hindi を開発した。
MoHパイプラインは言語識別で構成され、ローマ語からデヴァナガリ・ヒンディー語への翻訳は、ローマ語のヒンディー語の知識ベースを用いて行われる。
論文 参考訳(メタデータ) (2021-10-18T15:24:32Z) - Hate Speech Detection in Roman Urdu [1.6436293069942314]
この研究は、ローマ・ウルドゥー語文におけるヘイトスピーチ検出の研究を初めて行った。
われわれは9万件以上のツイートを削除し、手動で解析して5000件のローマ・ウルドゥーのツイートを特定した。
我々は,ガイドライン開発に反復的アプローチを採用し,Hate Speech Roman Urdu 2020 corpus の生成に利用した。
論文 参考訳(メタデータ) (2021-08-05T19:49:46Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。