論文の概要: "I Can't Keep It Up." A Dataset from the Defunct Voat.co News Aggregator
- arxiv url: http://arxiv.org/abs/2201.05933v3
- Date: Fri, 22 Apr 2022 17:06:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 02:32:32.395080
- Title: "I Can't Keep It Up." A Dataset from the Defunct Voat.co News Aggregator
- Title(参考訳): 「私はそれを維持できない。」
Voat.coニュースアグリゲータのデータ
- Authors: Amin Mekacher, Antonis Papasavva
- Abstract要約: Voat.coは、2020年12月25日に閉鎖されたニュース集約サイトである。
本稿では、7.1Kサブバースで113Kユーザから230万以上の投稿と16.2Mコメントを投稿したデータセットを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Voat.co was a news aggregator website that shut down on December 25, 2020.
The site had a troubled history and was known for hosting various banned
subreddits. This paper presents a dataset with over 2.3M submissions and 16.2M
comments posted from 113K users in 7.1K subverses (the equivalent of subreddit
for Voat). Our dataset covers the whole lifetime of Voat, from its developing
period starting on November 8, 2013, the day it was founded, April 2014, up
until the day it shut down (December 25, 2020). This work presents the largest
and most complete publicly available Voat dataset, to the best of our
knowledge. Along with the release of this dataset, we present a preliminary
analysis covering posting activity and daily user and subverse registration on
the platform so that researchers interested in our dataset can know what to
expect. Our data may prove helpful to false news dissemination studies as we
analyze the links users share on the platform, finding that many communities
rely on alternative news press, like Breitbart and GatewayPundit, for their
daily discussions. In addition, we perform network analysis on user
interactions finding that many users prefer not to interact with subverses
outside their narrative interests, which could be helpful to researchers
focusing on polarization and echo chambers. Also, since Voat was one of the
platforms banned Reddit communities migrated to, we are confident our dataset
will motivate and assist researchers studying deplatforming. Finally, many
hateful and conspiratorial communities were very popular on Voat, which makes
our work valuable for researchers focusing on toxicity, conspiracy theories,
cross-platform studies of social networks, and natural language processing.
- Abstract(参考訳): Voat.coは、2020年12月25日に閉鎖されたニュース集約サイトである。
サイトは問題のある歴史を持ち、様々な禁止されたサブredditをホストしたことで知られている。
本稿では、7.1Kサブバース(Voatのsubredditに相当する)で1,3Kユーザから2,3M以上の投稿と16.2Mコメントを投稿したデータセットを提案する。
我々のデータセットはVoatの生涯をカバーしており、2013年11月8日から、創業日である2014年4月、終了日(2020年12月25日)まで、開発期間をカバーしています。
この研究は、私たちの知る限りでは最大かつ最も完全なvoatデータセットを提供します。
このデータセットのリリースとともに、プラットフォーム上での投稿アクティビティと日々のユーザおよびサブバースの登録に関する予備的な分析を行い、データセットに関心のある研究者が何を期待すべきかを把握できるようにします。
私たちのデータは、ユーザーがプラットフォーム上で共有するリンクを分析し、多くのコミュニティが毎日の議論のために、Breitbartや GatewayPunditといった代替のニュースメディアに依存していることから、誤ったニュース拡散研究に役立ちます。
さらに,ユーザインタラクションのネットワーク分析を行い,多くのユーザが物語の関心事以外のサブバースと対話することを好まないことを見出し,偏光やエコーチャンバーに注目する研究者にとって有用であると考えられる。
また、VoatはRedditコミュニティの移行を禁止したプラットフォームの1つなので、私たちのデータセットがデプラットフォームの研究を動機付け、支援してくれると確信しています。
最後に、多くの憎悪と共謀的なコミュニティがVoatで非常に人気があり、毒性、陰謀論、ソーシャルネットワークのクロスプラットフォーム研究、自然言語処理に焦点をあてた研究者にとって、我々の研究は価値のあるものとなった。
関連論文リスト
- iDRAMA-Scored-2024: A Dataset of the Scored Social Media Platform from 2020 to 2023 [22.685953309889825]
Redditの代替プラットフォームであるScoredから大規模なデータセットをリリースしています。
少なくとも58のコミュニティがRedditから移住し、プラットフォームが誕生して以来950以上のコミュニティが誕生した。
私たちは、最先端のモデルによって生成されたデータセットに、すべてのポストの文埋め込みを提供します。
論文 参考訳(メタデータ) (2024-05-16T16:34:03Z) - Online conspiracy communities are more resilient to deplatforming [2.9767849911461504]
Reddit, GreatAwakening, FatPeopleHateの2つの大きなコミュニティの禁止によって影響を受けるユーザの行動の変化を比較した。
われわれの推計によると、陰謀コミュニティのユーザーはRedditを離れ、Voatに加わる可能性がずっと高い。
移住するゼアロットはほとんどなく、新たな大覚醒コミュニティがVoatで成長する一方、この効果はFatPeopleHateにとって欠落している。
論文 参考訳(メタデータ) (2023-03-21T18:08:51Z) - Reaching the bubble may not be enough: news media role in online
political polarization [58.720142291102135]
分極を減らす方法は、異なる政治的指向を持つ個人に党間のニュースを分配することである。
本研究は、ブラジルとカナダにおける全国選挙の文脈において、これが成立するかどうかを考察する。
論文 参考訳(メタデータ) (2021-09-18T11:34:04Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - The Rise and Fall of Fake News sites: A Traffic Analysis [62.51737815926007]
偽ニュースサイトのオンラインプレゼンスを調査し、実際のニュースサイトと比較してその行動を特徴づけます。
そこで本研究では,偽ニュースサイトを自動的に検出するコンテンツ非依存のMLを構築した。
論文 参考訳(メタデータ) (2021-03-16T18:10:22Z) - A Multi-Platform Analysis of Political News Discussion and Sharing on
Web Communities [13.364612995946876]
1,073のニュースサイトのリストを作成し、これらのソースからURLを含む4つのWebコミュニティから投稿を抽出する。
これにより、約3年にわたる1500万のニュースURLを含む3800万の投稿のデータセットが得られる。
いくつかの軸に沿ったデータを調査し、共有ニュースの信頼性を評価し、ニュース記事をストーリーにまとめる手法を設計し、これらのストーリーを分析し、様々なWebコミュニティが持つ影響を評価した。
論文 参考訳(メタデータ) (2021-03-05T12:27:28Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - Measuring and Characterizing Hate Speech on News Websites [13.289076063197466]
われわれは19ヶ月の間に412万件のニュース記事に投稿された1億125万件のコメントを分析した。
シャーロッツビルでの「統一右派」集会のような現実世界の分裂イベントに関するヘイトフルなコメント活動の統計学的に顕著な増加が見られる。
ヘイトフルコメントを惹きつける記事は、ヘイトフルコメントを惹きつけない記事に比べ、言語的特徴が異なることがわかった。
論文 参考訳(メタデータ) (2020-05-16T09:59:01Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z) - Raiders of the Lost Kek: 3.5 Years of Augmented 4chan Posts from the
Politically Incorrect Board [12.14455026524814]
本稿では,3.3M以上のスレッドと134.5Mのポストを持つデータセットを,画像掲示板フォーラム4chanから提示する。
私たちの知る限りでは、これは公開可能な4chanデータセットとしては最大である。
このデータセットがソーシャルメディアのクロスプラットフォーム研究に使われ、自然言語処理などの他の研究にも役立つことを願っている。
論文 参考訳(メタデータ) (2020-01-21T12:52:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。