論文の概要: Twitter-Demographer: A Flow-based Tool to Enrich Twitter Data
- arxiv url: http://arxiv.org/abs/2201.10986v1
- Date: Wed, 26 Jan 2022 14:59:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 13:22:23.331173
- Title: Twitter-Demographer: A Flow-based Tool to Enrich Twitter Data
- Title(参考訳): Twitter-Demographer: Twitterデータを強化するフローベースのツール
- Authors: Federico Bianchi, Vincenzo Cutrona, Dirk Hovy
- Abstract要約: Twitter-Demographerは、Twitterのデータにツイートやユーザーに関する追加情報を加えるフローベースのツールだ。
フローベースのプログラミングパラダイムにインスパイアされた設計選択を議論し、容易にチェーン化して拡張可能なブラックボックスコンポーネントの使用について論じる。
- 参考スコア(独自算出の注目度): 31.19059013571499
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Twitter data have become essential to Natural Language Processing (NLP) and
social science research, driving various scientific discoveries in recent
years. However, the textual data alone are often not enough to conduct studies:
especially social scientists need more variables to perform their analysis and
control for various factors. How we augment this information, such as users'
location, age, or tweet sentiment, has ramifications for anonymity and
reproducibility, and requires dedicated effort. This paper describes
Twitter-Demographer, a simple, flow-based tool to enrich Twitter data with
additional information about tweets and users. Twitter-Demographer is aimed at
NLP practitioners and (computational) social scientists who want to enrich
their datasets with aggregated information, facilitating reproducibility, and
providing algorithmic privacy-by-design measures for pseudo-anonymity. We
discuss our design choices, inspired by the flow-based programming paradigm, to
use black-box components that can easily be chained together and extended. We
also analyze the ethical issues related to the use of this tool, and the
built-in measures to facilitate pseudo-anonymity.
- Abstract(参考訳): twitterのデータは自然言語処理(nlp)や社会科学研究に不可欠なものとなり、近年様々な科学的発見を駆り立てている。
しかし、テキストデータだけでは研究を行うには不十分な場合が多く、特に社会科学者は様々な要因の分析と制御を行うためにより多くの変数が必要である。
ユーザの位置情報、年齢、ツイート感情などの情報をどのように強化するかは、匿名性や再現性に影響を及ぼし、専用の努力を要する。
本稿は、Twitter-Demographerについて説明する。これはシンプルなフローベースのツールで、Twitterのデータをツイートやユーザーに関する追加情報で強化する。
Twitter-DemographerはNLPの実践者や(計算的な)社会科学者を対象とし、データセットを集約された情報で強化し、再現性を促進し、疑似匿名のためのアルゴリズムによるプライバシ・バイ・デザインの手段を提供する。
フローベースのプログラミングパラダイムにインスパイアされた設計選択を議論し、容易にチェーン化して拡張可能なブラックボックスコンポーネントを使用する。
また、このツールの使用に関する倫理的問題や、疑似匿名性を促進するための組み込み対策についても分析した。
関連論文リスト
- Do We Trust What They Say or What They Do? A Multimodal User Embedding Provides Personalized Explanations [35.77028281332307]
ソーシャルネットワークのためのコントリビューション対応マルチモーダルユーザ埋め込み(CAMUE)を提案する。
提案手法は,信頼できない情報の影響を自動的に軽減し,パーソナライズ可能な予測を提供する。
私たちの仕事は、より説明しやすく、信頼性があり、効果的なソーシャルメディアユーザー埋め込みの道を開く。
論文 参考訳(メタデータ) (2024-09-04T02:17:32Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Harnessing Explanations: LLM-to-LM Interpreter for Enhanced
Text-Attributed Graph Representation Learning [51.90524745663737]
重要なイノベーションは、機能として説明を使用することで、下流タスクにおけるGNNのパフォーマンス向上に利用できます。
提案手法は、確立されたTAGデータセットの最先端結果を実現する。
本手法はトレーニングを著しく高速化し,ogbn-arxivのベースラインに最も近い2.88倍の改善を実現した。
論文 参考訳(メタデータ) (2023-05-31T03:18:03Z) - Use of social media and Natural Language Processing (NLP) in natural
hazard research [0.0]
The work of Sasaki et al. (2010) and Earle et al. (2011)では、自然災害を検出するためにTwitter上でのリアルタイムインタラクションについて検討している。
このようなアプリケーションに固有の課題は自然言語処理(NLP)である。
本稿では,高度な分類と分類を応用したNLP機械学習プロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T15:03:05Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - The emojification of sentiment on social media: Collection and analysis
of a longitudinal Twitter sentiment dataset [5.528896840956628]
TM-Sentiは、Twitterの感情データセットを大規模に管理し、ツイート数は1億1400万を超えている。
我々は,大規模なエモティコンと絵文字に基づくラベル付き感情分析データセットを組み立てるための方法論を記述し,評価する。
私たちの分析では絵文字のエモティコンへの利用の増加など、興味深い時間的変化が強調されている。
論文 参考訳(メタデータ) (2021-08-31T14:54:46Z) - Birdspotter: A Tool for Analyzing and Labeling Twitter Users [12.558187319452657]
BirdspotterはTwitterユーザーの分析とラベル付けを行うツールだ。
Birdspotter.mlは、計算されたメトリクスの探索的なビジュアライゼーションである。
我々は、完全なボット検出器に鳥のポッターを訓練する方法を示します。
論文 参考訳(メタデータ) (2020-12-04T02:25:07Z) - TIMME: Twitter Ideology-detection via Multi-task Multi-relational
Embedding [26.074367752142198]
我々は、人々のイデオロギーや政治的傾向を予測する問題を解決することを目的としている。
我々は、Twitterデータを用いてそれを推定し、分類問題として定式化する。
論文 参考訳(メタデータ) (2020-06-02T00:00:39Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。