論文の概要: Mapping Violence: Developing an Extensive Framework to Build a Bangla Sectarian Expression Dataset from Social Media Interactions
- arxiv url: http://arxiv.org/abs/2404.11752v1
- Date: Wed, 17 Apr 2024 21:09:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-19 20:00:41.806865
- Title: Mapping Violence: Developing an Extensive Framework to Build a Bangla Sectarian Expression Dataset from Social Media Interactions
- Title(参考訳): 暴力のマッピング:ソーシャルメディアのインタラクションからバングラディアン表現データセットを構築するための拡張フレームワークの開発
- Authors: Nazia Tasnim, Sujan Sen Gupta, Md. Istiak Hossain Shihab, Fatiha Islam Juee, Arunima Tahsin, Pritom Ghum, Kanij Fatema, Marshia Haque, Wasema Farzana, Prionti Nasir, Ashique KhudaBukhsh, Farig Sadeque, Asif Sushmit,
- Abstract要約: オンラインバングラコンテンツにおける共犯マーカーの自動検出のための,初の包括的枠組みを開発した。
私たちのワークフローでは、社会科学者、言語学者、心理学者の洞察を取り入れた7段階の専門家アノテーションプロセスを導入しています。
このデータセットを用いてデータ統計とベンチマーク性能を提示することにより、非コミュニケーション暴力のカテゴリ以外では、リグリゴ・コミュニティ暴力は特にバングラ文字で広く普及していると判断した。
- 参考スコア(独自算出の注目度): 1.2618555186247333
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Communal violence in online forums has become extremely prevalent in South Asia, where many communities of different cultures coexist and share resources. These societies exhibit a phenomenon characterized by strong bonds within their own groups and animosity towards others, leading to conflicts that frequently escalate into violent confrontations. To address this issue, we have developed the first comprehensive framework for the automatic detection of communal violence markers in online Bangla content accompanying the largest collection (13K raw sentences) of social media interactions that fall under the definition of four major violence class and their 16 coarse expressions. Our workflow introduces a 7-step expert annotation process incorporating insights from social scientists, linguists, and psychologists. By presenting data statistics and benchmarking performance using this dataset, we have determined that, aside from the category of Non-communal violence, Religio-communal violence is particularly pervasive in Bangla text. Moreover, we have substantiated the effectiveness of fine-tuning language models in identifying violent comments by conducting preliminary benchmarking on the state-of-the-art Bangla deep learning model.
- Abstract(参考訳): オンラインフォーラムにおけるコミュニティの暴力は、異なる文化の多くのコミュニティが共存し、資源を共有している南アジアで非常に広まっている。
これらの社会は、自身のグループ内の強い結合と他者に対する敵意によって特徴づけられる現象を示し、しばしば暴力的な対立へとエスカレートする紛争を引き起こす。
この問題に対処するため、我々は、4つの主要な暴力クラスと16の粗い表現の定義に該当するソーシャルメディアインタラクションの最大コレクション(13Kの原文)に付随するオンラインバングラコンテンツにおける共犯マーカーの自動検出のための、初めての包括的枠組みを開発した。
私たちのワークフローでは、社会科学者、言語学者、心理学者の洞察を取り入れた7段階の専門家アノテーションプロセスを導入しています。
このデータセットを用いてデータ統計とベンチマーク性能を提示することにより、非コミュニケーション暴力のカテゴリ以外では、リグリゴ・コミュニティ暴力は特にバングラ文字で広く普及していると判断した。
さらに,現在最先端のバングラディープラーニングモデルを用いて,事前ベンチマークを行うことで,暴力的コメントの識別における微調整言語モデルの有効性を実証した。
関連論文リスト
- Exploring Boundaries and Intensities in Offensive and Hate Speech: Unveiling the Complex Spectrum of Social Media Discourse [16.99659597567309]
本稿では,3つのタスクに対して8,258のツイートをアノテートしたAmharicのベンチマークデータセットを提案する。
私たちの研究は、ほとんどのツイートが攻撃的でない、憎悪の度合いの低いレベルに属することを強調しています。
民族的および政治的憎悪の対象の出現は、我々のデータセットに顕著に重複しており、エチオピアの社会政治の景観における複雑な関係を強調している。
論文 参考訳(メタデータ) (2024-04-18T09:52:50Z) - HarmPot: An Annotation Framework for Evaluating Offline Harm Potential of Social Media Text [1.304892050913381]
我々は「ハームポテンシャル」を、現実世界の物理的損害(暴力)を引き起こすオンラインの公共のポストの可能性として定義する。
本稿では、テキストの異なる側面でデータに注釈を付けるフレームワーク/アノテーションスキーマの開発について論じる。
論文 参考訳(メタデータ) (2024-03-17T06:23:25Z) - Into the crossfire: evaluating the use of a language model to
crowdsource gun violence reports [0.21485350418225244]
我々は、通常のポルトガル語のテキストと銃暴力の報告を区別するために、Twitterテキストで訓練された細調整BERTベースのモデルを提案する。
我々は、新たな銃暴力イベントを特定するために、ソーシャルメディアのテキストを継続的に事実チェックしているブラジルのアナリストを調査、インタビューする。
論文 参考訳(メタデータ) (2024-01-16T14:40:54Z) - Mavericks at BLP-2023 Task 1: Ensemble-based Approach Using Language
Models for Violence Inciting Text Detection [0.0]
ソーシャルメディアは、社会における憎しみや暴力的な発言の伝播を加速させてきた。
少ない研究と少ないデータにより、低リソース環境では、暴力を誘発するテキストを検出する問題がさらに悪化する。
本稿では,バングラ語処理に関する第1回ワークショップにおいて,Volence Inciting Text Detection共有タスクについて紹介する。
論文 参考訳(メタデータ) (2023-11-30T18:23:38Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Understanding Lexical Biases when Identifying Gang-related Social Media
Communications [18.301221486244263]
シカゴのギャング関連ツイートを識別するために、バイナリロジスティック分類器を使用します。
ツイートの言語は非常に関連性が高く、ビッグデータのメソッドや機械学習モデルを使用することで、言語がモデルのパフォーマンスに与える影響をよりよく理解する必要があります。
論文 参考訳(メタデータ) (2023-04-22T21:51:49Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Towards Identifying Social Bias in Dialog Systems: Frame, Datasets, and
Benchmarks [95.29345070102045]
本稿では,ダイアログの安全性問題に対する社会的バイアス検出に焦点をあてる。
まず,会話における社会的バイアスを現実的に分析する新しいダイアルバイアスフレームを提案する。
中国初の社会バイアスダイアログデータセットであるCDail-Biasデータセットを紹介する。
論文 参考訳(メタデータ) (2022-02-16T11:59:29Z) - This Must Be the Place: Predicting Engagement of Online Communities in a
Large-scale Distributed Campaign [70.69387048368849]
我々は、何百万人ものアクティブメンバーを持つコミュニティの行動について研究する。
テキストキュー,コミュニティメタデータ,構造的特性を組み合わせたハイブリッドモデルを構築した。
Redditのr/placeを通じて、大規模なオンライン実験を通じて、私たちのモデルの適用性を実証します。
論文 参考訳(メタデータ) (2022-01-14T08:23:16Z) - Fragments of the Past: Curating Peer Support with Perpetrators of
Domestic Violence [88.37416552778178]
我々は,過去フラグメントの設計と展開において,6人の支援労働者と18人の加害者とともに働いた10ヶ月の研究を報告した。
私たちは、暴力から脱却した経験をデジタルで強化された成果物、すなわち「フラグメント」を作ることが、メッセージのモチベーションと仲間間のラッピングをいかに翻訳するかを共有します。
これらの知見は、挑戦的な人口を持つ将来のネットワーク設計の実践的考察の基礎となる。
論文 参考訳(メタデータ) (2021-07-09T22:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。