論文の概要: Textual Toxicity in Social Media: Understanding the Bangla Toxic
Language Expressed in Facebook Comment
- arxiv url: http://arxiv.org/abs/2312.05467v1
- Date: Sat, 9 Dec 2023 05:04:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 20:32:53.606586
- Title: Textual Toxicity in Social Media: Understanding the Bangla Toxic
Language Expressed in Facebook Comment
- Title(参考訳): ソーシャルメディアにおけるテキストの毒性:Facebookコメントで表現されたBangla Toxic言語を理解する
- Authors: Mohammad Mamun Or Rashid
- Abstract要約: バングラデシュや西ベンガルのソーシャルメディア文化において、ベンガルのコミュニティがサイバーいじめ、ヘイトスピーチ、道徳的警察として用いている有毒な言語や文書が大きなトレンドとなった。
この分析は、ソーシャルメディアで使用されているバングラの有害な言語の検出を強化し、この仮想疾患を治療すると考えられる。
- 参考スコア(独自算出の注目度): 0.6798775532273751
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Social Media is a repository of digital literature including user-generated
content. The users of social media are expressing their opinion with diverse
mediums such as text, emojis, memes, and also through other visual and textual
mediums. A major portion of these media elements could be treated as harmful to
others and they are known by many words including Cyberbullying and Toxic
Language . The goal of this research paper is to analyze a curated and
value-added dataset of toxic language titled ToxLex_bn . It is an exhaustive
wordlist that can be used as classifier material to detect toxicity in social
media. The toxic language/script used by the Bengali community as
cyberbullying, hate speech and moral policing became major trends in social
media culture in Bangladesh and West Bengal. The toxicity became so high that
the victims has to post as a counter or release explanation video for the
haters. Most cases are pointed to women celebrity and their relation, dress,
lifestyle are became trolled and toxicity flooded in comments boxes. Not only
celebrity bashing but also hates occurred between Hindu Muslims,
India-Bangladesh, Two opponents of 1971 and these are very common for virtual
conflict in the comment thread. Even many times facebook comment causes sue and
legal matters in Bangladesh and thus it requires more study. In this study, a
Bangla toxic language dataset has been analyzed which was inputted by the user
in Bengali script & language. For this, about 1968 unique bigrams or phrases as
wordlists have been analyzed which are derived from 2207590 comments. It is
assumed that this analysis will reinforce the detection of Bangla's toxic
language used in social media and thus cure this virtual disease.
- Abstract(参考訳): ソーシャルメディアは、ユーザー生成コンテンツを含むデジタル文学のリポジトリである。
ソーシャルメディアのユーザーは、テキスト、絵文字、ミーム、その他の視覚的およびテキスト的媒体を通じて、さまざまなメディアで意見を表明している。
これらのメディア要素の大部分は他人にとって有害なものとして扱われ、CyberbullyingやToxic Languageなど多くの単語で知られている。
本研究の目的は,毒性言語toxlex_bnのキュレーションおよび付加価値データセットを分析することである。
ソーシャルメディアで毒性を検出するために分類材料として使用できる、徹底的な単語リストである。
バングラデシュと西ベンガルのソーシャルメディア文化では、サイバーいじめ、ヘイトスピーチ、モラルポリシングとしてベンガルのコミュニティが使う有毒な言語/スクリプトが主要なトレンドとなった。
毒性は非常に高くなり、被害者は憎悪者の説明ビデオのカウンターとして投稿しなければならなかった。
ほとんどのケースは女性有名人を指しており、その関係、服装、ライフスタイルは混乱し、コメントボックスに毒性が溢れている。
著名人のバッシングだけでなく、ヒンドゥー教徒、インド・バングラデシュ、1971年の2人の反対者の間でも憎悪が相次いだ。
facebookのコメントがバングラデシュで訴訟や法的な問題を引き起こすことすらあるので、もっと研究が必要だ。
本研究では,バングラの有害言語データセットを解析し,ベンガル文字および言語を用いて利用者が入力した。
このため、1968年ごろには2207590のコメントから派生した単語リストとしてのユニークなビッグラムやフレーズが分析されている。
この分析は、ソーシャルメディアで使用されているバングラの有害言語の検出を強化し、この仮想疾患を治療すると考えられる。
関連論文リスト
- Analyzing Toxicity in Deep Conversations: A Reddit Case Study [0.0]
この研究は、公開会話設定における毒性に関するユーザがどのように振る舞うかを理解するために、ツリーベースのアプローチを採用する。
Redditの8つのコミュニティから上位100件の投稿とコメントのセクションを収集し、100万件以上の回答を得た。
有毒なコメントは、その後の有毒なコメントがオンライン会話で生み出される可能性を高める。
論文 参考訳(メタデータ) (2024-04-11T16:10:44Z) - An Image is Worth a Thousand Toxic Words: A Metamorphic Testing
Framework for Content Moderation Software [64.367830425115]
ソーシャルメディアプラットフォームは、ヘイトスピーチ、悪意のある広告、ポルノなど、有害なコンテンツを拡散するためにますます悪用されている。
コンテンツモデレーション手法の開発と展開に多大な努力を払っているにもかかわらず、悪意のあるユーザは、テキストを画像に埋め込むことでモデレーションを回避することができる。
コンテンツモデレーションソフトウェアのためのメタモルフィックテストフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-18T20:33:06Z) - Analyzing Norm Violations in Live-Stream Chat [49.120561596550395]
本研究は,ライブストリーミングプラットフォーム上での会話における規範違反を検出することを目的とした,最初のNLP研究である。
ライブストリームチャットにおける標準違反カテゴリを定義し、Twitchから4,583のコメントを注釈付けします。
以上の結果から,適切なコンテキスト情報がモデレーション性能を35%向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-18T05:58:27Z) - Classification of social media Toxic comments using Machine learning
models [0.0]
この要約は、ソーシャルメディアプラットフォームにおける有害なコメントの問題を概説している。
この行動は反社会的行動と呼ばれ、オンライン討論、コメント、戦いの間に起こる。
明示的な言語を含むコメントは、有毒、重篤な有毒、わいせつ、脅迫、侮辱、同一性嫌悪など、様々なカテゴリに分類される。
ユーザーを不快な言葉から守るために、企業はコメントを掲示し、ユーザーをブロックし始めた。
論文 参考訳(メタデータ) (2023-04-14T05:40:11Z) - Automated Sentiment and Hate Speech Analysis of Facebook Data by
Employing Multilingual Transformer Models [15.823923425516078]
我々は、Facebookの代表的なデータセットの中で、憎悪とネガティブな感情内容の統計的分布を分析する。
我々は、感情分析やヘイトスピーチ分析を行うために、最先端のオープンソースのXLM-T多言語変換言語モデルを用いている。
論文 参考訳(メタデータ) (2023-01-31T14:37:04Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Annotators with Attitudes: How Annotator Beliefs And Identities Bias
Toxic Language Detection [75.54119209776894]
本研究では,アノテータのアイデンティティ(誰)と信念(なぜ)が有害な言語アノテーションに与える影響について検討する。
我々は、アンチブラック言語、アフリカ系アメリカ人の英語方言、俗語という3つの特徴を持つポストを考察する。
以上の結果から,アノテータのアイデンティティと信念と毒性評価の相関が強く示唆された。
論文 参考訳(メタデータ) (2021-11-15T18:58:20Z) - Detecting Harmful Content On Online Platforms: What Platforms Need Vs.
Where Research Efforts Go [44.774035806004214]
オンラインプラットフォーム上の有害コンテンツには、ヘイトスピーチ、攻撃的言語、いじめとハラスメント、誤情報、スパム、暴力、グラフィックコンテンツ、性的虐待、自己被害など、さまざまな形態がある。
オンラインプラットフォームは、そのようなコンテンツを、社会的危害を抑えるため、法律に従うために、ユーザーのためにより包括的な環境を作るために、緩和しようとしている。
現在、オンラインプラットフォームが抑制しようとしている有害なコンテンツの種類と、そのようなコンテンツを自動的に検出する研究努力との間には、隔たりがある。
論文 参考訳(メタデータ) (2021-02-27T08:01:10Z) - Bangla Text Dataset and Exploratory Analysis for Online Harassment
Detection [0.0]
この記事でアクセス可能になったデータは、有名人、政府高官、そしてFacebook上のアスリートによる公開投稿の人々のコメントから収集され、マークされている。
データセットは、コメントがいじめの表現であるか否かを区別するマシンの開発を目的としてコンパイルされる。
論文 参考訳(メタデータ) (2021-02-04T08:35:18Z) - Hate Speech detection in the Bengali language: A dataset and its
baseline evaluation [0.8793721044482612]
本稿では,クラウドソーシングによってタグ付けされ,専門家によって検証された3万のユーザコメントのデータセットを提案する。
コメントはすべてYouTubeとFacebookのコメントセクションから収集され、7つのカテゴリに分類される。
合計50人の注釈家が各コメントに3回注釈を付け、多数決が最終注釈として採決された。
論文 参考訳(メタデータ) (2020-12-17T15:53:54Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。