論文の概要: Birdspotter: A Tool for Analyzing and Labeling Twitter Users
- arxiv url: http://arxiv.org/abs/2012.02370v2
- Date: Tue, 23 Feb 2021 00:24:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-22 03:12:14.686821
- Title: Birdspotter: A Tool for Analyzing and Labeling Twitter Users
- Title(参考訳): Birdspotter: Twitterユーザーの分析とラベル付けのためのツール
- Authors: Rohit Ram, Quyu Kong, Marian-Andrei Rizoiu
- Abstract要約: BirdspotterはTwitterユーザーの分析とラベル付けを行うツールだ。
Birdspotter.mlは、計算されたメトリクスの探索的なビジュアライゼーションである。
我々は、完全なボット検出器に鳥のポッターを訓練する方法を示します。
- 参考スコア(独自算出の注目度): 12.558187319452657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The impact of online social media on societal events and institutions is
profound; and with the rapid increases in user uptake, we are just starting to
understand its ramifications. Social scientists and practitioners who model
online discourse as a proxy for real-world behavior, often curate large social
media datasets. A lack of available tooling aimed at non-data science experts
frequently leaves this data (and the insights it holds) underutilized. Here, we
propose birdspotter -- a tool to analyze and label Twitter users --, and
birdspotter.ml -- an exploratory visualizer for the computed metrics.
birdspotter provides an end-to-end analysis pipeline, from the processing of
pre-collected Twitter data, to general-purpose labeling of users, and
estimating their social influence, within a few lines of code. The package
features tutorials and detailed documentation. We also illustrate how to train
birdspotter into a fully-fledged bot detector that achieves better than
state-of-the-art performances without making any Twitter API online calls, and
we showcase its usage in an exploratory analysis of a topical COVID-19 dataset.
- Abstract(参考訳): オンラインソーシャルメディアが社会的な出来事や制度に与える影響は深刻であり、ユーザー獲得の急速な増加に伴い、私たちはその影響を理解し始めています。
オンライン言論を現実の行動のプロキシとしてモデル化する社会科学者や実践者は、しばしば大規模なソーシャルメディアデータセットをキュレートする。
非データサイエンスの専門家を対象とするツールが不足しているため、このデータ(およびそれが保持する洞察)は利用されていないことが多い。
ここでは,twitterユーザの分析とラベル付けを行うツールであるbirdspotterと,算出されたメトリクスの探索可視化ツールであるbirdspotter.mlを提案する。
birdspotterは、事前に収集したtwitterデータの処理から、ユーザの汎用的なラベル付け、そして数行のコード内でその社会的影響を見積もる、エンドツーエンドの分析パイプラインを提供する。
このパッケージにはチュートリアルと詳細なドキュメントがある。
また、TwitterのAPIをオンライン呼び出しすることなく、最先端のパフォーマンスよりも優れた、本格的なボット検出装置に鳥のポッターをトレーニングする方法についても説明し、その使用法をトピックのCOVID-19データセットの探索分析で示す。
関連論文リスト
- Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - PyRCA: A Library for Metric-based Root Cause Analysis [66.72542200701807]
PyRCAは、AIOps(AIOps)のためのRoot Cause Analysis(RCA)のオープンソースの機械学習ライブラリである。
複雑なメトリクス因果依存性を明らかにし、インシデントの根本原因を自動的に特定する、包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-06-20T09:55:10Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Twitter-Demographer: A Flow-based Tool to Enrich Twitter Data [31.19059013571499]
Twitter-Demographerは、Twitterのデータにツイートやユーザーに関する追加情報を加えるフローベースのツールだ。
フローベースのプログラミングパラダイムにインスパイアされた設計選択を議論し、容易にチェーン化して拡張可能なブラックボックスコンポーネントの使用について論じる。
論文 参考訳(メタデータ) (2022-01-26T14:59:17Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Explainable Patterns: Going from Findings to Insights to Support Data
Analytics Democratization [60.18814584837969]
我々は,データストーリテリングの探索と作成において,レイユーザをサポートする新しいフレームワークであるExplainable Patterns (ExPatt)を提示する。
ExPattは、外部(テキスト)の情報ソースを使用して、観察または選択された発見の実用的な説明を自動的に生成します。
論文 参考訳(メタデータ) (2021-01-19T16:13:44Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Evently: Modeling and Analyzing Reshare Cascades with Hawkes Processes [12.558187319452657]
Eventlyは、オンラインのリシェアカスケード、特にリツイートカスケードをモデリングするためのツールである。
Twitterの公開APIから生データを処理するための、包括的な機能セットを提供する。
コンテンツがオンラインにどのように広がるかに基づいてユーザーを特徴づけることによって、影響力のあるユーザーやオンラインボットを混乱させることが示される。
論文 参考訳(メタデータ) (2020-06-11T03:13:35Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z) - Curating Social Media Data [0.0]
本稿では,ソーシャルデータのクリーン化とキュレーションを可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
論文 参考訳(メタデータ) (2020-02-21T10:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。