論文の概要: Understanding Lexical Biases when Identifying Gang-related Social Media
Communications
- arxiv url: http://arxiv.org/abs/2304.11485v1
- Date: Sat, 22 Apr 2023 21:51:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 18:11:03.937188
- Title: Understanding Lexical Biases when Identifying Gang-related Social Media
Communications
- Title(参考訳): ギャング関連ソーシャルメディア通信の識別における語彙バイアスの理解
- Authors: Dhiraj Murthy, Constantine Caramanis, Koustav Rudra
- Abstract要約: シカゴのギャング関連ツイートを識別するために、バイナリロジスティック分類器を使用します。
ツイートの言語は非常に関連性が高く、ビッグデータのメソッドや機械学習モデルを使用することで、言語がモデルのパフォーマンスに与える影響をよりよく理解する必要があります。
- 参考スコア(独自算出の注目度): 18.301221486244263
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Individuals involved in gang-related activity use mainstream social media
including Facebook and Twitter to express taunts and threats as well as grief
and memorializing. However, identifying the impact of gang-related activity in
order to serve community member needs through social media sources has a unique
set of challenges. This includes the difficulty of ethically identifying
training data of individuals impacted by gang activity and the need to account
for a non-standard language style commonly used in the tweets from these
individuals. Our study provides evidence of methods where natural language
processing tools can be helpful in efficiently identifying individuals who may
be in need of community care resources such as counselors, conflict mediators,
or academic/professional training programs. We demonstrate that our binary
logistic classifier outperforms baseline standards in identifying individuals
impacted by gang-related violence using a sample of gang-related tweets
associated with Chicago. We ultimately found that the language of a tweet is
highly relevant and that uses of ``big data'' methods or machine learning
models need to better understand how language impacts the model's performance
and how it discriminates among populations.
- Abstract(参考訳): ギャング関連の活動に関わる個人は、FacebookやTwitterなどの主流のソーシャルメディアを使って、お化けや脅し、悲しみや追悼を表現している。
しかし、コミュニティメンバーのニーズに応えるために、ソーシャルメディアソースを通じてギャング関連活動の影響を特定することは、独特の課題である。
これには、ギャング活動によって影響を受ける個人のトレーニングデータを倫理的に識別することの難しさや、これらの個人からのツイートで一般的に使用される非標準言語スタイルを説明する必要性が含まれる。
本研究は,カウンセラーやコンフリクトメディエーター,学術・専門訓練プログラムなど,地域医療資源を必要とする個人を効率的に識別する上で,自然言語処理ツールが有効であることを示す。
当社のバイナリロジスティック分類器は,シカゴに関連するギャング関連ツイートのサンプルを用いて,ギャング関連暴力の影響を受ける個人を特定する上で,基準を上回っていることを実証する。
最終的に、ツイートの言語は極めて関連性が高く、‘ビッグデータ’メソッドや機械学習モデルを使用することで、言語がモデルのパフォーマンスにどう影響するか、集団間でどのように差別化されるのかをよりよく理解する必要があります。
関連論文リスト
- Assessing the Level of Toxicity Against Distinct Groups in Bangla Social Media Comments: A Comprehensive Investigation [0.0]
本研究は, トランスジェンダー, 先住民, 移民の3つの特定のグループを対象として, ベンガル語における有毒なコメントを同定することに焦点を当てた。
この方法論は、データセット、手動のアノテーションの作成と、Bangla-BERT、bangla-bert-base、distil-BERT、Bert-base-multilingual-casedといったトレーニング済みのトランスフォーマーモデルの使用を含む。
実験の結果、Bangla-BERTは代替モデルを超え、F1スコアは0.8903に達した。
論文 参考訳(メタデータ) (2024-09-25T17:48:59Z) - Unveiling Social Media Comments with a Novel Named Entity Recognition System for Identity Groups [2.5849042763002426]
我々はアイデンティティグループのための名前付きエンティティ認識(NER)システムを開発した。
我々のツールは、文が攻撃を含むかどうかを検知するだけでなく、上記のグループに対応する文トークンもタグ付けする。
ソーシャルメディアに関するケーススタディで,Facebookのコメントを注釈付けし,IDグループに言及するニュースに関連するコメントと比較し,ツールの有用性を検証した。
論文 参考訳(メタデータ) (2024-05-13T19:33:18Z) - MetaHate: A Dataset for Unifying Efforts on Hate Speech Detection [2.433983268807517]
ヘイトスピーチは、標的となる個人やコミュニティに対して、社会的、心理的、時には身体的脅威を生じさせる。
この現象に対処するための現在の計算言語学的アプローチは、トレーニングのためのラベル付きソーシャルメディアデータセットに依存している。
我々は60以上のデータセットを精査し、その関連するものをMetaHateに選択的に統合しました。
我々の発見は、既存のデータセットのより深い理解に寄与し、より堅牢で適応可能なモデルをトレーニングするための道を開いた。
論文 参考訳(メタデータ) (2024-01-12T11:54:53Z) - Developing Linguistic Patterns to Mitigate Inherent Human Bias in
Offensive Language Detection [1.6574413179773761]
本稿では,ラベル付けプロセスにおけるバイアスを低減するための言語データ拡張手法を提案する。
このアプローチは、複数の言語にわたる攻撃的な言語分類タスクを改善する可能性がある。
論文 参考訳(メタデータ) (2023-12-04T10:20:36Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Fragments of the Past: Curating Peer Support with Perpetrators of
Domestic Violence [88.37416552778178]
我々は,過去フラグメントの設計と展開において,6人の支援労働者と18人の加害者とともに働いた10ヶ月の研究を報告した。
私たちは、暴力から脱却した経験をデジタルで強化された成果物、すなわち「フラグメント」を作ることが、メッセージのモチベーションと仲間間のラッピングをいかに翻訳するかを共有します。
これらの知見は、挑戦的な人口を持つ将来のネットワーク設計の実践的考察の基礎となる。
論文 参考訳(メタデータ) (2021-07-09T22:57:43Z) - Learning Language and Multimodal Privacy-Preserving Markers of Mood from
Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。
人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。
本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文 参考訳(メタデータ) (2021-06-24T17:46:03Z) - Can You be More Social? Injecting Politeness and Positivity into
Task-Oriented Conversational Agents [60.27066549589362]
人間エージェントが使用する社会言語は、ユーザーの応答性の向上とタスク完了に関連しています。
このモデルは、ソーシャル言語理解要素で拡張されたシーケンスからシーケンスまでのディープラーニングアーキテクチャを使用する。
人的判断と自動言語尺度の両方を用いたコンテンツ保存と社会言語レベルの評価は,エージェントがより社会的に適切な方法でユーザの問題に対処できる応答を生成できることを示している。
論文 参考訳(メタデータ) (2020-12-29T08:22:48Z) - Analysing Social Media Network Data with R: Semi-Automated Screening of
Users, Comments and Communication Patterns [0.0]
ソーシャルメディアプラットフォーム上でのコミュニケーションは、社会に広まりつつある。
フェイクニュース、ヘイトスピーチ、急進的要素は、この現代的なコミュニケーションの一部です。
これらのメカニズムとコミュニケーションパターンの基本的な理解は、負のコミュニケーション形態に対抗するのに役立つ。
論文 参考訳(メタデータ) (2020-11-26T14:52:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。