論文の概要: "I'm in the Bluesky Tonight": Insights from a Year Worth of Social Data
- arxiv url: http://arxiv.org/abs/2404.18984v1
- Date: Mon, 29 Apr 2024 16:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-01 18:29:43.311754
- Title: "I'm in the Bluesky Tonight": Insights from a Year Worth of Social Data
- Title(参考訳): I'm in the Bluesky Tonight: Insights from a Year Worth of Social Data
- Authors: Andrea Failla, Giulio Rossetti,
- Abstract要約: 本稿では,Bluesky Socialのソーシャルインタラクションとユーザ生成コンテンツの大規模かつ高包括的データセットを提案する。
データセットには400万以上のユーザ(すべての登録アカウントの81%)の完全なポスト履歴が含まれており、総投稿数は235万である。
- 参考スコア(独自算出の注目度): 0.18416014644193066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pollution of online social spaces caused by rampaging d/misinformation is a growing societal concern. However, recent decisions to reduce access to social media APIs are causing a shortage of publicly available, recent, social media data, thus hindering the advancement of computational social science as a whole. We present a large, high-coverage dataset of social interactions and user-generated content from Bluesky Social to address this pressing issue. The dataset contains the complete post history of over 4M users (81% of all registered accounts), totalling 235M posts. We also make available social data covering follow, comment, repost, and quote interactions. Since Bluesky allows users to create and bookmark feed generators (i.e., content recommendation algorithms), we also release the full output of several popular algorithms available on the platform, along with their timestamped ``like'' interactions and time of bookmarking. This dataset allows unprecedented analysis of online behavior and human-machine engagement patterns. Notably, it provides ground-truth data for studying the effects of content exposure and self-selection and performing content virality and diffusion analysis.
- Abstract(参考訳): d/misinformationの増大によるオンラインソーシャルスペースの汚染は、社会的な懸念が高まっている。
しかし、ソーシャルメディアAPIへのアクセスを減らすという最近の決定は、一般に公開されている最近のソーシャルメディアデータ不足を招き、計算社会科学全体の進歩を妨げている。
本稿では,Bluesky Socialのソーシャルインタラクションとユーザ生成コンテンツの大規模かつ高包括的データセットを提示し,このプレス問題に対処する。
データセットには400万以上のユーザ(すべての登録アカウントの81%)の完全なポスト履歴が含まれており、総投稿数は235万である。
また、フォロー、コメント、再投稿、引用などのソーシャルデータを公開しています。
Blueskyはユーザーがフィードジェネレータ(例えばコンテンツレコメンデーションアルゴリズム)を作成してブックマークできるので、プラットフォーム上で利用可能ないくつかの人気のあるアルゴリズムの完全なアウトプットもリリースします。
このデータセットは、オンラインの振る舞いと人間と機械のエンゲージメントパターンを前例のない分析を可能にする。
特に、コンテンツ露出と自己選択の効果を研究し、コンテンツのバイラル性や拡散分析を行うための基盤的データを提供する。
関連論文リスト
- Easy-access online social media metrics can effectively identify misinformation sharing users [41.94295877935867]
高いツイート頻度は共有コンテンツの事実性の低さと正に関連しているのに対し、アカウント年齢はそれと負に関連していることがわかった。
以上の結果から,これらのソーシャル・ネットワークの指標を頼りにすることで,誤情報を拡散しやすいユーザを早期に識別する,低障壁なアプローチが実現する可能性が示唆された。
論文 参考訳(メタデータ) (2024-08-27T16:41:13Z) - BlueTempNet: A Temporal Multi-network Dataset of Social Interactions in Bluesky Social [14.829021021698349]
ユーザ主導型ソーシャルインタラクションの時間的ダイナミクスの最初のコレクションを提示する。
既存のBluesky Feedsを収集し、これらのフィードを気に入ったユーザーを含む。
このデータ収集戦略は過去のユーザの振る舞いを捉え、将来のユーザの振る舞いのデータ収集をサポートする。
論文 参考訳(メタデータ) (2024-07-24T17:31:48Z) - SODA: Million-scale Dialogue Distillation with Social Commonsense
Contextualization [129.1927527781751]
初となる,100万規模の社会対話データセットであるSODAを提示する。
知識グラフから社会的コモンセンス知識を文脈化することにより、社会的相互作用の非常に幅広いスペクトルを蒸留することができる。
人間による評価は、SODAにおける会話は、以前の人間によるデータセットよりも一貫性があり、特異であり、そして(当然のことながら)自然であることを示している。
論文 参考訳(メタデータ) (2022-12-20T17:38:47Z) - Cross-Network Social User Embedding with Hybrid Differential Privacy
Guarantees [81.6471440778355]
プライバシー保護方式でユーザを包括的に表現するために,ネットワーク横断型ソーシャルユーザ埋め込みフレームワークDP-CroSUEを提案する。
特に、各異種ソーシャルネットワークに対して、異種データ型に対するプライバシー期待の変化を捉えるために、まずハイブリッドな差分プライバシーの概念を導入する。
ユーザ埋め込みをさらに強化するため、新しいネットワーク間GCN埋め込みモデルは、それらの整列したユーザを介して、ネットワーク間で知識を伝達するように設計されている。
論文 参考訳(メタデータ) (2022-09-04T06:22:37Z) - Federated Social Recommendation with Graph Neural Network [69.36135187771929]
本稿では,ソーシャル情報とユーザ・イテムの相互作用を融合させることにより,ソーシャル・レコメンデーションの問題であるソーシャル・リコメンデーションの緩和を提案する。
我々は textbfGraph Neural Network (FeSoG) を用いた textbfFedrated textbfSocial 推薦フレームワークを考案した。
論文 参考訳(メタデータ) (2021-11-21T09:41:39Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - A Large-scale Dataset for Hate Speech Detection on Vietnamese Social
Media Texts [0.32228025627337864]
ViHSDは、ソーシャルネットワーク上でヘイトスピーチを自動的に検出する人間アノテーション付きデータセットである。
このデータセットには30,000以上のコメントが含まれており、データセットの各コメントにはCLEAN、OFENSIVE、HATEの3つのラベルの1つが含まれている。
論文 参考訳(メタデータ) (2021-03-22T00:55:47Z) - Exposure to Social Engagement Metrics Increases Vulnerability to
Misinformation [12.737240668157424]
ソーシャルエンゲージメント(ソーシャルエンゲージメント)への露出は、ユーザの誤情報に対する脆弱性を増大させる。
誤報の拡散を減らすため、われわれはソーシャルエンゲージメント指標の表示を再考するよう技術プラットフォームに求めている。
論文 参考訳(メタデータ) (2020-05-10T14:55:50Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z) - Curating Social Media Data [0.0]
本稿では,ソーシャルデータのクリーン化とキュレーションを可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
論文 参考訳(メタデータ) (2020-02-21T10:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。