論文の概要: AMUSED: An Annotation Framework of Multi-modal Social Media Data
- arxiv url: http://arxiv.org/abs/2010.00502v2
- Date: Tue, 10 Aug 2021 11:41:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:38:36.364789
- Title: AMUSED: An Annotation Framework of Multi-modal Social Media Data
- Title(参考訳): amused:マルチモーダルソーシャルメディアデータのアノテーションフレームワーク
- Authors: Gautam Kishore Shahi
- Abstract要約: このフレームワークは、ソーシャルメディアデータの収集と注釈付けの問題を緩和するために設計されている。
AMUSEDは複数のアプリケーションドメインに適用可能で、ユースケースとして、新型コロナウイルスの誤情報収集のためのフレームワークを実装した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a semi-automated framework called AMUSED for
gathering multi-modal annotated data from the multiple social media platforms.
The framework is designed to mitigate the issues of collecting and annotating
social media data by cohesively combining machine and human in the data
collection process. From a given list of the articles from professional news
media or blog, AMUSED detects links to the social media posts from news
articles and then downloads contents of the same post from the respective
social media platform to gather details about that specific post. The framework
is capable of fetching the annotated data from multiple platforms like Twitter,
YouTube, Reddit. The framework aims to reduce the workload and problems behind
the data annotation from the social media platforms. AMUSED can be applied in
multiple application domains, as a use case, we have implemented the framework
for collecting COVID-19 misinformation data from different social media
platforms.
- Abstract(参考訳): 本稿では,複数のソーシャルメディアプラットフォームからマルチモーダルアノテートデータを収集する,AMUSEDという半自動フレームワークを提案する。
このフレームワークは、データ収集プロセスにおいて、機械と人間の結合によってソーシャルメディアデータの収集と注釈付けの問題を緩和するように設計されている。
プロのニュースメディアまたはブログから与えられた記事のリストから、amusedはニュース記事からのソーシャルメディア投稿へのリンクを検出し、それぞれのソーシャルメディアプラットフォームから同じ記事のコンテンツをダウンロードして、特定の記事の詳細を収集する。
このフレームワークは、twitter、youtube、redditなど複数のプラットフォームから注釈付きデータを取得することができる。
このフレームワークは、ソーシャルメディアプラットフォームからデータアノテーションの背後にあるワークロードと問題を削減することを目的としている。
amusedは複数のアプリケーションドメインに適用可能ですが、ユースケースとして、さまざまなソーシャルメディアプラットフォームからcovid-19の誤情報を収集するためのフレームワークを実装しました。
関連論文リスト
- Labeled Datasets for Research on Information Operations [71.34999856621306]
ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。
データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文 参考訳(メタデータ) (2024-11-15T22:15:01Z) - SocialQuotes: Learning Contextual Roles of Social Media Quotes on the Web [9.130915550141337]
我々は、ソーシャルメディアの埋め込みを引用に例え、ページコンテキストを構造化された自然言語信号として形式化し、ページコンテキスト内の引用に対する役割の分類を識別する。
われわれはSocialQuotesをリリースした。SocialQuotesは3200万以上のソーシャル引用と8.3kのクラウドソースによる引用アノテーションからなるCommon Crawlから構築された新しいデータセットだ。
論文 参考訳(メタデータ) (2024-07-22T19:21:01Z) - Robust Domain Misinformation Detection via Multi-modal Feature Alignment [49.89164555394584]
マルチモーダルな誤情報検出のための頑健なドメインとクロスモーダルなアプローチを提案する。
テキストと視覚の共役分布を整列させることにより、ドメインシフトを低減する。
また,ドメイン一般化のアプリケーションシナリオを同時に検討するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-24T07:06:16Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Decay No More: A Persistent Twitter Dataset for Learning Social Meaning [10.227026799075215]
社会意味のための英語Twitterデータセット(PTSM)を提案する。
PTSMは17ドルのソーシャル意味データセットと10ドルのタスクカテゴリで構成されている。
我々は2つのSOTA事前訓練言語モデルを用いて実験を行い、PTSMが実際のツイートをパラフレーズに置換し、性能損失を極端に抑えることを示した。
論文 参考訳(メタデータ) (2022-04-10T06:07:54Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z) - I-AID: Identifying Actionable Information from Disaster-related Tweets [0.0]
ソーシャルメディアは、被災者、寄付、支援要請に関する貴重なデータを提供することによって、災害管理において重要な役割を担っている。
ツイートを自動的にマルチラベル情報タイプに分類するマルチモデルアプローチであるI-AIDを提案する。
以上の結果から,I-AIDはTREC-ISデータセットおよびCOVID-19 Tweetsにおいて,平均F1得点の6%,+4%において最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-08-04T19:07:50Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Reliable and Efficient Long-Term Social Media Monitoring [4.389610557232119]
このテクニカルレポートは、クラウドベースのデータ収集、前処理、およびアーカイブインフラストラクチャを提示する。
このアプローチがさまざまなクラウドコンピューティングアーキテクチャでどのように機能するか、他のソーシャルメディアプラットフォームからストリーミングデータを収集する方法にどのように適応するかを示す。
論文 参考訳(メタデータ) (2020-05-05T19:04:56Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。