論文の概要: A Dataset of State-Censored Tweets
- arxiv url: http://arxiv.org/abs/2101.05919v3
- Date: Fri, 19 Mar 2021 18:40:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-15 03:08:08.354624
- Title: A Dataset of State-Censored Tweets
- Title(参考訳): 国別つぶやきのデータセット
- Authors: Tu\u{g}rulcan Elmas, Rebekah Overdorf, Karl Aberer
- Abstract要約: 2012年から2020年7月までに検閲された155,715人のツイート583,437件のデータセットをリリースしました。
また、検閲された4,301のアカウントもリリースしました。
我々のデータセットは政府の検閲の研究に役立つだけでなく、ヘイトスピーチの検出やソーシャルメディアユーザーに対する検閲の効果の研究にも役立ちます。
- 参考スコア(独自算出の注目度): 3.0254442724635173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many governments impose traditional censorship methods on social media
platforms. Instead of removing it completely, many social media companies,
including Twitter, only withhold the content from the requesting country. This
makes such content still accessible outside of the censored region, allowing
for an excellent setting in which to study government censorship on social
media. We mine such content using the Internet Archive's Twitter Stream Grab.
We release a dataset of 583,437 tweets by 155,715 users that were censored
between 2012-2020 July. We also release 4,301 accounts that were censored in
their entirety. Additionally, we release a set of 22,083,759 supplemental
tweets made up of all tweets by users with at least one censored tweet as well
as instances of other users retweeting the censored user. We provide an
exploratory analysis of this dataset. Our dataset will not only aid in the
study of government censorship but will also aid in studying hate speech
detection and the effect of censorship on social media users. The dataset is
publicly available at https://doi.org/10.5281/zenodo.4439509
- Abstract(参考訳): 多くの政府はソーシャルメディアプラットフォームに伝統的な検閲手法を課している。
完全に削除する代わりに、twitterを含む多くのソーシャルメディア企業は、要求国からのコンテンツのみを保留している。
これにより、そのようなコンテンツは検閲地域以外でも引き続きアクセス可能となり、ソーシャルメディア上で政府の検閲を研究できる優れた設定が可能になる。
インターネットアーカイブのTwitter Stream Grabを使って、そのようなコンテンツをマイニングします。
2012年から2020年7月までに検閲された155,715人のツイート583,437件のデータセットをリリースしました。
また、検閲された4,301のアカウントもリリースしました。
さらに、少なくとも1つの検閲ツイートを持つユーザーによる全ツイートからなる22,083,759個の追加ツイートと、検閲されたユーザーをリツイートする他のユーザーの例を公開する。
このデータセットを探索的に分析する。
我々のデータセットは政府の検閲の研究に役立つだけでなく、ヘイトスピーチの検出やソーシャルメディアユーザーに対する検閲の効果の研究にも役立ちます。
データセットはhttps://doi.org/10.5281/zenodo.4439509で公開されている。
関連論文リスト
- Russo-Ukrainian War: Prediction and explanation of Twitter suspension [47.61306219245444]
本研究は、Twitterのサスペンション機構と、これにつながる可能性のあるユーザアカウントの共有コンテンツと機能の分析に焦点を当てる。
Twitter APIを使って、980万人のユーザーから生まれた107.7万のツイートを含むデータセットを入手しました。
この結果から、Bitcoin詐欺、スパム、広告キャンペーンに対するロシアとウクライナの紛争に関するトレンドを生かした詐欺キャンペーンが明らかになった。
論文 参考訳(メタデータ) (2023-06-06T08:41:02Z) - Detecting and Reasoning of Deleted Tweets before they are Posted [5.300190188468289]
削除されたツイート、特にアラビアの文脈内で識別し、それに対応するきめ細かい偽情報カテゴリにラベル付けします。
次に、削除されるツイートの可能性を予測できるモデルを開発します。
論文 参考訳(メタデータ) (2023-05-05T08:25:07Z) - Predicting Hate Intensity of Twitter Conversation Threads [26.190359413890537]
DRAGNET++は、将来、ツイートが返信チェーンを通じてもたらす憎悪の強さを予測することを目的としている。
ツイートスレッドのセマンティックな構造と伝播構造を利用して、続く各ツイートにおけるヘイトインテンシティの低下につながるコンテキスト情報を最大化する。
DRAGNET++は最先端のすべてのベースラインを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-06-16T18:51:36Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Retweet communities reveal the main sources of hate speech [0.6999740786886536]
高度なディープラーニングを導入し,高品質なヘイトスピーチ分類モデルを構築した。
リツイートネットワークを作成し、コミュニティを検出し、時間を通してその進化を監視します。
ヘイトスピーチは、政治的、イデオロギー的な問題に関連する攻撃的なツイートによって支配されている。
受け入れがたいツイートの約60%は、中程度のサイズの1つの右翼コミュニティによって生成される。
論文 参考訳(メタデータ) (2021-05-31T11:43:19Z) - "I Won the Election!": An Empirical Analysis of Soft Moderation
Interventions on Twitter [0.9391375268580806]
ツイートをTwitter上で警告ラベルで共有するユーザとその政治的傾向について検討する。
警告ラベル付きツイートの72%が共和党員、1%が民主党員だ。
論文 参考訳(メタデータ) (2021-01-18T17:39:58Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - Whose Tweets are Surveilled for the Police: An Audit of Social-Media
Monitoring Tool via Log Files [69.02688684221265]
我々はCorvallis (Oregon) Police DepartmentによるDigitalStakeoutというソーシャルメディア監視ソフトウェアの使用からログファイルを入手した。
これらのログファイルには、DigitalStakeoutによるプロプライエタリな検索の結果が含まれている。
ツイートがDigitalStakeoutによってフラグ付けされているユーザーの人口統計と、地域のTwitterユーザーの人口統計との差異を観察する。
論文 参考訳(メタデータ) (2020-01-23T19:35:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。