論文の概要: ViralBERT: A User Focused BERT-Based Approach to Virality Prediction
- arxiv url: http://arxiv.org/abs/2206.10298v1
- Date: Tue, 17 May 2022 21:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-12 20:59:13.902889
- Title: ViralBERT: A User Focused BERT-Based Approach to Virality Prediction
- Title(参考訳): ViralBERT: Virality Predictionに対するBERTベースのアプローチ
- Authors: Rikaz Rameez, Hossein A. Rahmani, Emine Yilmaz
- Abstract要約: 本稿では、コンテンツとユーザベースの機能を用いて、ツイートのバイラル性を予測できるViralBERTを提案する。
ハッシュタグやフォロワー数などの数値的特徴を合成してテキストをツイートし、2つのBERTモジュールを利用する手法を用いる。
ViralBERTをトレーニングするために330kのツイートのデータセットを収集し、この分野での現在の研究からベースラインを使用して、モデルの有効性を検証する。
- 参考スコア(独自算出の注目度): 11.992815669875924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Twitter has become the social network of choice for sharing and
spreading information to a multitude of users through posts called 'tweets'.
Users can easily re-share these posts to other users through 'retweets', which
allow information to cascade to many more users, increasing its outreach.
Clearly, being able to know the extent to which a post can be retweeted has
great value in advertising, influencing and other such campaigns. In this paper
we propose ViralBERT, which can be used to predict the virality of tweets using
content- and user-based features. We employ a method of concatenating numerical
features such as hashtags and follower numbers to tweet text, and utilise two
BERT modules: one for semantic representation of the combined text and
numerical features, and another module purely for sentiment analysis of text,
as both the information within text and it's ability to elicit an emotional
response play a part in retweet proneness. We collect a dataset of 330k tweets
to train ViralBERT and validate the efficacy of our model using baselines from
current studies in this field. Our experiments show that our approach
outperforms these baselines, with a 13% increase in both F1 Score and Accuracy
compared to the best performing baseline method. We then undergo an ablation
study to investigate the importance of chosen features, finding that text
sentiment and follower counts, and to a lesser extent mentions and following
counts, are the strongest features for the model, and that hashtag counts are
detrimental to the model.
- Abstract(参考訳): 最近、Twitterは「つぶやき」と呼ばれる投稿を通じて、情報の共有や拡散に最適なソーシャルネットワークになっている。
ユーザーは、これらの投稿を他のユーザーと簡単に再共有できる。retweetsは、より多くのユーザーに対して情報をカスケードし、リーチを増やすことができる。
明らかに、投稿がリツイートされる範囲を知ることは、広告、影響力、その他のキャンペーンにおいて大きな価値を持っている。
本稿では、コンテンツとユーザベースの機能を用いて、ツイートのバイラル性を予測できるViralBERTを提案する。
我々は、ハッシュタグやフォロワー数などの数値的特徴を結合してテキストをツイートし、2つのBERTモジュール(テキストと数値的特徴のセマンティックな表現のためのもの)と、テキスト内の情報とリツイートの傾向に影響を及ぼす感情的応答を導く能力の両方として、テキストの感情分析のためのもの)を利用する。
ViralBERTをトレーニングするために330kのツイートのデータセットを収集し、この分野での現在の研究からベースラインを用いてモデルの有効性を検証する。
実験の結果,本手法はベースラインを上回っており,f1スコアと精度は最高のベースライン法と比較して13%向上した。
次に,選択された特徴の重要性を検討するためにアブレーション研究を行い,テキストの感情と従者数,および少なからぬ言及数と追従数をモデルにとって最強の特徴とし,ハッシュタグ数をモデルに有害であることを示す。
関連論文リスト
- ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Retweet-BERT: Political Leaning Detection Using Language Features and
Information Diffusion on Social Networks [30.143148646797265]
Retweet-BERTは、シンプルでスケーラブルなモデルで、Twitterユーザーの政治的傾向を推定する。
我々の仮定は、同様のイデオロギーを共有する人々の間で、ネットワークや言語学のパターンがホモフィリーであることに由来する。
論文 参考訳(メタデータ) (2022-07-18T02:18:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Understanding Information Spreading Mechanisms During COVID-19 Pandemic
by Analyzing the Impact of Tweet Text and User Features for Retweet
Prediction [6.658785818853953]
新型コロナウイルスは世界の経済や、ほぼすべての人々の日常生活に影響を与えている。
ソーシャルメディアプラットフォームは、情報を共有できる他のユーザーと情報を共有できる。
CNNとRNNをベースとした2つのモデルを提案し、これらのモデルの性能を公開のTweetsCOV19データセットで評価する。
論文 参考訳(メタデータ) (2021-05-26T15:55:58Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - TweetBERT: A Pretrained Language Representation Model for Twitter Text
Analysis [0.0]
我々は、何百万ものツイートで事前訓練されたドメイン固有言語プレゼンテーションモデルである2つのTweetBERTモデルを紹介した。
TweetBERTモデルは、Twitterのテキストマイニングタスクにおける従来のBERTモデルよりも、各Twitterデータセットで7%以上優れています。
論文 参考訳(メタデータ) (2020-10-17T00:45:02Z) - Writer Identification Using Microblogging Texts for Social Media
Forensics [53.180678723280145]
私たちは、文学的分析に広く使われている人気のあるスタイル的特徴と、URL、ハッシュタグ、返信、引用などの特定のTwitter機能を評価します。
我々は、様々なサイズの著者集合と、著者毎のトレーニング/テストテキストの量をテストする。
論文 参考訳(メタデータ) (2020-07-31T00:23:18Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。