論文の概要: Curating Social Media Data
- arxiv url: http://arxiv.org/abs/2002.09202v1
- Date: Fri, 21 Feb 2020 10:07:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:47:29.423883
- Title: Curating Social Media Data
- Title(参考訳): ソーシャルメディアデータのキュレーション
- Authors: Kushal Vaghani
- Abstract要約: 本稿では,ソーシャルデータのクリーン化とキュレーションを可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media platforms have empowered the democratization of the pulse of
people in the modern era. Due to its immense popularity and high usage, data
published on social media sites (e.g., Twitter, Facebook and Tumblr) is a rich
ocean of information. Therefore data-driven analytics of social imprints has
become a vital asset for organisations and governments to further improve their
products and services. However, due to the dynamic and noisy nature of social
media data, performing accurate analysis on raw data is a challenging task. A
key requirement is to curate the raw data before fed into analytics pipelines.
This curation process transforms the raw data into contextualized data and
knowledge. We propose a data curation pipeline, namely CrowdCorrect, to enable
analysts cleansing and curating social data and preparing it for reliable
analytics. Our pipeline provides an automatic feature extraction from a corpus
of social media data using existing in-house tools. Further, we offer a
dual-correction mechanism using both automated and crowd-sourced approaches.
The implementation of this pipeline also includes a set of tools for
automatically creating micro-tasks to facilitate the contribution of crowd
users in curating the raw data. For the purposes of this research, we use
Twitter as our motivational social media data platform due to its popularity.
- Abstract(参考訳): ソーシャルメディアプラットフォームは、現代の人々の脈動の民主化に力を入れている。
ソーシャルメディアサイト(例えば、Twitter、Facebook、Tumblr)で公表されたデータは、膨大な人気と高い利用率のため、豊富な情報の海である。
したがって、ソーシャルインプリントのデータ駆動分析は、企業や政府にとって、製品やサービスをさらに改善するための重要な資産となっている。
しかし、ソーシャルメディアデータのダイナミックでノイズの多い性質のため、生データを正確に分析することは難しい課題である。
重要な要件は、分析パイプラインに投入する前に生データをキュレートすることだ。
このキュレーションプロセスは、生データをコンテキスト化されたデータと知識に変換する。
本稿では,ソーシャルデータのクリーン化とキュレーション,信頼性の高い分析のための準備を可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
さらに,自動とクラウドソースの両方のアプローチを用いて,二重修正機構を提供する。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
この研究の目的のために、私たちはtwitterをその人気のためにモチベーションの高いソーシャルメディアデータプラットフォームとして使用しています。
関連論文リスト
- Social Intelligence Data Infrastructure: Structuring the Present and Navigating the Future [59.78608958395464]
私たちは、包括的な社会AI分類と480のNLPデータセットからなるデータライブラリで構成される、ソーシャルAIデータインフラストラクチャを構築しています。
インフラストラクチャにより、既存のデータセットの取り組みを分析し、異なるソーシャルインテリジェンスの観点から言語モデルのパフォーマンスを評価することができます。
多面的なデータセットの必要性、言語と文化の多様性の向上、より長期にわたる社会的状況、そして将来のソーシャルインテリジェンスデータ活動におけるよりインタラクティブなデータの必要性が示されている。
論文 参考訳(メタデータ) (2024-02-28T00:22:42Z) - Countering Misinformation via Emotional Response Generation [15.383062216223971]
ソーシャルメディアプラットフォーム(SMP)における誤情報拡散は、公衆衛生、社会的結束、民主主義に重大な危険をもたらす。
これまでの研究では、社会的訂正が誤情報を抑制する効果的な方法であることが示された。
約1万のクレーム応答対からなる最初の大規模データセットであるVerMouthを提案する。
論文 参考訳(メタデータ) (2023-11-17T15:37:18Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Dynamic Datasets and Market Environments for Financial Reinforcement
Learning [68.11692837240756]
FinRL-Metaは、現実世界の市場からジムスタイルの市場環境へ動的データセットを処理するライブラリである。
我々は,ユーザが新しい取引戦略を設計するための足場として,人気のある研究論文を例示し,再現する。
また、ユーザが自身の結果を視覚化し、相対的なパフォーマンスを評価するために、このライブラリをクラウドプラットフォームにデプロイします。
論文 参考訳(メタデータ) (2023-04-25T22:17:31Z) - Analyzing social media with crowdsourcing in Crowd4SDG [1.1403672224109254]
本研究は,ソーシャルメディアの分析,特に緊急時におけるフレキシブルな支援を提供するアプローチを提案する。
焦点は、ソーシャルメディア投稿に含まれる画像やテキストを分析し、コンテンツのフィルタリング、分類、位置決めのための一連の自動データ処理ツールである。
このようなサポートには、自動ツールを設定するためのフィードバックと提案、市民からのインプットを集めるためのクラウドソーシングの両方が含まれる。
論文 参考訳(メタデータ) (2022-08-04T14:42:20Z) - Designing a Social Media Analytics Dashboard for Government Agency
Crisis Communications [0.0]
政府機関は、危機時にソーシャルメディアを口コミとして利用するために、ますますソーシャルメディアに目を向けている。
政府機関は、公共の利益のためにソーシャルメディアデータを分析するためのツールを必要としている。
本稿では,地方自治体向けのソーシャルメディア分析ダッシュボードの開発を指導するデザインサイエンス研究手法を提案する。
論文 参考訳(メタデータ) (2022-02-11T10:41:01Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Birdspotter: A Tool for Analyzing and Labeling Twitter Users [12.558187319452657]
BirdspotterはTwitterユーザーの分析とラベル付けを行うツールだ。
Birdspotter.mlは、計算されたメトリクスの探索的なビジュアライゼーションである。
我々は、完全なボット検出器に鳥のポッターを訓練する方法を示します。
論文 参考訳(メタデータ) (2020-12-04T02:25:07Z) - Knowledge Discovery from Social Media using Big Data provided Sentiment
Analysis (SoMABiT) [2.218042861844671]
本稿では,ビッグデータ技術を用いたソーシャルメディア分析プラットフォームであるSoMABiTの技術的・科学的焦点について論じる。
MapReduceの使用と、任意のデータボリュームをスケールし、ソーシャルメディア駆動の知識を提供する統合プラットフォームに向けた分散アルゴリズムの開発が、提案されたコンセプトの目新しいところである。
論文 参考訳(メタデータ) (2020-01-16T18:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。