論文の概要: Just Another Day on Twitter: A Complete 24 Hours of Twitter Data
- arxiv url: http://arxiv.org/abs/2301.11429v1
- Date: Thu, 26 Jan 2023 21:28:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 13:53:44.250371
- Title: Just Another Day on Twitter: A Complete 24 Hours of Twitter Data
- Title(参考訳): twitterにまた1日:24時間分のtwitterデータ
- Authors: Juergen Pfeffer, Daniel Matter, Kokil Jaidka, Onur Varol, Afra
Mashhadi, Jana Lasser, Dennis Assenmacher, Siqi Wu, Diyi Yang, Cornelia
Brantner, Daniel M. Romero, Jahna Otterbacher, Carsten Schwemmer, Kenneth
Joseph, David Garcia, Fred Morstatter
- Abstract要約: われわれは2022年9月21日から24時間以内に3億7500万件のツイートを収集した。
これは、研究コミュニティで利用可能な24時間Twitterデータセットの最初のものである。
- 参考スコア(独自算出の注目度): 39.98744837726886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: At the end of October 2022, Elon Musk concluded his acquisition of Twitter.
In the weeks and months before that, several questions were publicly discussed
that were not only of interest to the platform's future buyers, but also of
high relevance to the Computational Social Science research community. For
example, how many active users does the platform have? What percentage of
accounts on the site are bots? And, what are the dominating topics and
sub-topical spheres on the platform? In a globally coordinated effort of 80
scholars to shed light on these questions, and to offer a dataset that will
equip other researchers to do the same, we have collected all 375 million
tweets published within a 24-hour time period starting on September 21, 2022.
To the best of our knowledge, this is the first complete 24-hour Twitter
dataset that is available for the research community. With it, the present work
aims to accomplish two goals. First, we seek to answer the aforementioned
questions and provide descriptive metrics about Twitter that can serve as
references for other researchers. Second, we create a baseline dataset for
future research that can be used to study the potential impact of the
platform's ownership change.
- Abstract(参考訳): 2022年10月末、イーロン・マスクはTwitterの買収を完了した。
その前の数週間と数ヶ月の間に、プラットフォームの将来的な購入者にとって関心があるだけでなく、計算社会科学研究コミュニティに高い関連性を持ついくつかの質問が公に議論された。
例えば、このプラットフォームにはアクティブユーザー数がありますか?
サイト上のアカウントの何%がボットか?
そして、プラットフォームで主要なトピックとサブトピックの球体は何ですか?
世界中に80人の学者が協力してこれらの疑問に光を当て、他の研究者に同じことをするデータセットを提供するために、私たちは2022年9月21日から24時間以内に3億7500万件のツイートを収集しました。
私たちの知る限りでは、これは研究コミュニティで利用可能な最初の24時間twitterデータセットです。
本研究は2つの目標を達成することを目的としている。
まず、上記の質問に答え、他の研究者の参考となるTwitterに関する説明的な指標を提供しようとしています。
第二に、将来の研究のためのベースラインデータセットを作成し、プラットフォームのオーナシップ変更による潜在的影響を研究するために使用します。
関連論文リスト
- RIP Twitter API: A eulogy to its vast research contributions [1.1687067206676627]
この研究は、2006年から2023年の間にTwitterのデータを使用した研究、引用数、日付、主要な規律、および主要なトピック領域を収集し、集計する。
2006年以降、14の分野にまたがる合計27,453の論文が7,432の出版会場で出版され、1,303,142の引用がある。
主なトピックは、情報拡散、ツイートの信頼性の評価、データ研究の戦略、主要な出来事の検出と分析、人間の行動の研究である。
論文 参考訳(メタデータ) (2024-04-10T20:39:24Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Twitter Big Data as a Resource for Exoskeleton Research: A Large-Scale
Dataset of about 140,000 Tweets and 100 Research Questions [0.0]
エクソスケルトン市場は、今後2年間で現在の価値の倍増すると予想されている。
ユーザの関心、見解、意見、視点、態度、受け入れ、フィードバック、エンゲージメント、購入行動、満足度について、その程度と傾向を研究することが不可欠である。
この研究は、2017年5月21日から2022年5月21日までの5年間に投稿された、約14万件のExoskeletonsに関するオープンアクセスデータセットを提示する。
論文 参考訳(メタデータ) (2021-11-04T19:36:01Z) - CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information [0.0]
CML-COVID(CML-COVID)は、新型コロナウイルス(COVID-19)による5,977,653人のツイート19,298,967万件のTwitterデータセットである。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
論文 参考訳(メタデータ) (2021-01-28T18:59:10Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。