論文の概要: Reliable and Efficient Long-Term Social Media Monitoring
- arxiv url: http://arxiv.org/abs/2005.02442v3
- Date: Mon, 16 Nov 2020 18:56:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-21 02:40:10.137221
- Title: Reliable and Efficient Long-Term Social Media Monitoring
- Title(参考訳): ソーシャルメディアモニタリングの信頼性と効率性
- Authors: Jian Cao, Nicholas Adams-Cohen, R. Michael Alvarez
- Abstract要約: このテクニカルレポートは、クラウドベースのデータ収集、前処理、およびアーカイブインフラストラクチャを提示する。
このアプローチがさまざまなクラウドコンピューティングアーキテクチャでどのように機能するか、他のソーシャルメディアプラットフォームからストリーミングデータを収集する方法にどのように適応するかを示す。
- 参考スコア(独自算出の注目度): 4.389610557232119
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media data is now widely used by many academic researchers. However,
long-term social media data collection projects, which most typically involve
collecting data from public-use APIs, often encounter issues when relying on
local-area network servers (LANs) to collect high-volume streaming social media
data over long periods of time. In this technical report, we present a
cloud-based data collection, pre-processing, and archiving infrastructure, and
argue that this system mitigates or resolves the problems most typically
encountered when running social media data collection projects on LANs at
minimal cloud-computing costs. We show how this approach works in different
cloud computing architectures, and how to adapt the method to collect streaming
data from other social media platforms.
- Abstract(参考訳): ソーシャルメディアデータは、現在多くの学術研究者によって広く使われている。
しかし、一般的には公開apiからのデータ収集を伴う長期的なソーシャルメディアデータ収集プロジェクトは、長期間にわたって大量のソーシャルメディアデータを収集するためにローカルエリアネットワークサーバ(lan)に依存する場合、しばしば問題に直面する。
本技術報告では,クラウドベースのデータ収集,事前処理,アーカイブインフラストラクチャを提示し,このシステムは,最小のクラウド計算コストで,LAN上でソーシャルメディアデータ収集プロジェクトを運用する場合に最も多く発生する問題を緩和あるいは解決するものである,と論じる。
このアプローチがさまざまなクラウドコンピューティングアーキテクチャでどのように機能するか、他のソーシャルメディアプラットフォームからストリーミングデータを収集する方法にどのように適応するかを示す。
関連論文リスト
- Labeled Datasets for Research on Information Operations [71.34999856621306]
ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。
データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文 参考訳(メタデータ) (2024-11-15T22:15:01Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Urban Crowdsensing using Social Media: An Empirical Study on Transformer
and Recurrent Neural Networks [0.7090165638014329]
我々は、利用可能なソーシャルメディアデータセットを活用し、これらを2つの都市センシング問題の基盤として利用する。
この研究の主な貢献の1つは、TwitterとFlickrから収集したデータセットです。
2つの予備的な教師付き学習手法を用いて,本データセットの有用性を示す。
論文 参考訳(メタデータ) (2020-12-05T15:36:50Z) - Post or Tweet: Lessons from a Study of Facebook and Twitter Usage [9.888864336862385]
このワークショップでは、FacebookとTwitterという、おそらく最も人気のある2つのソーシャルネットワークサイトについて、現在進行中の混合調査についてレポートする。
この研究の目的は、参加者のモチベーションに関する調査データとAPI抽出を通じて収集された利用データを組み合わせることで、ソーシャルメディアの選択とクロスプラットフォーム利用のニュアンスに光を当てることである。
論文 参考訳(メタデータ) (2020-11-27T15:55:02Z) - AMUSED: An Annotation Framework of Multi-modal Social Media Data [0.0]
このフレームワークは、ソーシャルメディアデータの収集と注釈付けの問題を緩和するために設計されている。
AMUSEDは複数のアプリケーションドメインに適用可能で、ユースケースとして、新型コロナウイルスの誤情報収集のためのフレームワークを実装した。
論文 参考訳(メタデータ) (2020-10-01T15:50:41Z) - Wide-Area Data Analytics [4.080171822768553]
私たちはますます、さまざまな種類のデータが多くの場所に分散している、データ駆動の世界に住んでいます。
コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。
本報告では,ワークショップで議論された課題と結論について要約する。
論文 参考訳(メタデータ) (2020-06-17T22:44:33Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - Xtreaming: an incremental multidimensional projection technique and its
application to streaming data [58.92615359254597]
Xtreamingは、視覚表現を連続的に更新して新しい構造やパターンを反映し、複数の多次元データにアクセスすることなく、新たなインクリメンタルプロジェクション技術である。
実験の結果,Xtreamingは,他のストリーミングやインクリメンタル技術と比較して,グローバルな距離保存の点で競争力があることがわかった。
論文 参考訳(メタデータ) (2020-03-08T04:53:16Z) - Curating Social Media Data [0.0]
本稿では,ソーシャルデータのクリーン化とキュレーションを可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
論文 参考訳(メタデータ) (2020-02-21T10:07:15Z) - I Know Where You Are Coming From: On the Impact of Social Media Sources
on AI Model Performance [79.05613148641018]
我々は、異なるソーシャルネットワークのマルチモーダルデータから学習する際、異なる機械学習モデルの性能について検討する。
最初の実験結果から,ソーシャルネットワークの選択がパフォーマンスに影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2020-02-05T11:10:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。