論文の概要: BERT based classification system for detecting rumours on Twitter
- arxiv url: http://arxiv.org/abs/2109.02975v1
- Date: Tue, 7 Sep 2021 10:15:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 14:32:01.755690
- Title: BERT based classification system for detecting rumours on Twitter
- Title(参考訳): BERTを用いたTwitter上の噂の分類システム
- Authors: Rini Anggrainingsih, Ghulam Mubashar Hassan, Amitava Datta
- Abstract要約: 従来の特徴抽出手法ではなく,Twitter上での噂を識別する手法を提案する。
BERTを用いた文埋め込みを用いて、ツイートの文脈的意味に応じて、各ツイートの文をベクターに表現する。
BERTをベースとしたモデルでは,従来の手法に比べて約10%精度が向上した。
- 参考スコア(独自算出の注目度): 3.2872586139884623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The role of social media in opinion formation has far-reaching implications
in all spheres of society. Though social media provide platforms for expressing
news and views, it is hard to control the quality of posts due to the sheer
volumes of posts on platforms like Twitter and Facebook. Misinformation and
rumours have lasting effects on society, as they tend to influence people's
opinions and also may motivate people to act irrationally. It is therefore very
important to detect and remove rumours from these platforms. The only way to
prevent the spread of rumours is through automatic detection and classification
of social media posts. Our focus in this paper is the Twitter social medium, as
it is relatively easy to collect data from Twitter. The majority of previous
studies used supervised learning approaches to classify rumours on Twitter.
These approaches rely on feature extraction to obtain both content and context
features from the text of tweets to distinguish rumours and non-rumours.
Manually extracting features however is time-consuming considering the volume
of tweets. We propose a novel approach to deal with this problem by utilising
sentence embedding using BERT to identify rumours on Twitter, rather than the
usual feature extraction techniques. We use sentence embedding using BERT to
represent each tweet's sentences into a vector according to the contextual
meaning of the tweet. We classify those vectors into rumours or non-rumours by
using various supervised learning techniques. Our BERT based models improved
the accuracy by approximately 10% as compared to previous methods.
- Abstract(参考訳): 意見形成におけるソーシャルメディアの役割は、社会のあらゆる領域に広く影響している。
ソーシャルメディアはニュースやビューを表現できるプラットフォームを提供しているが、TwitterやFacebookなどのプラットフォームに大量の投稿があるため、投稿の質をコントロールするのは難しい。
誤報や噂は、人々の意見に影響を及ぼしがちであり、不合理に行動する動機となるため、社会に持続する。
したがって、これらのプラットフォームから噂を検出し、取り除くことが非常に重要である。
噂の拡散を防ぐ唯一の方法は、ソーシャルメディア投稿の自動検出と分類である。
この論文の焦点はTwitterのソーシャルメディアであり、Twitterからデータを集めることは比較的容易である。
これまでの研究の大半は、教師付き学習アプローチを使って、Twitterで噂を分類していた。
これらのアプローチは、噂と非噂を区別するために、ツイートのテキストからコンテンツとコンテキストの特徴の両方を取得する機能抽出に依存する。
しかし、手動で機能を抽出することは、ツイートの量を考えるのに時間がかかる。
本稿では,従来の特徴抽出手法ではなく,BERTを用いた文埋め込みを利用してTwitter上の噂を識別する手法を提案する。
BERTを用いた文埋め込みを用いて、ツイートの文脈的意味に応じて各ツイートの文をベクトルに表現する。
様々な教師付き学習手法を用いて,これらのベクトルを噂や非噂に分類する。
BERTベースのモデルでは,従来の手法に比べて約10%精度が向上した。
関連論文リスト
- ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Which tweets 'deserve' to be included in news stories? Chronemics of
tweet embedding [0.0]
この研究は、メディアエコシステムにおける即時性の圧力に焦点を当てている。
ツイートを埋め込んだ大量のニュースメディアを分析して、ツイート埋め込みの実践を分析する。
ツイートを埋め込むのが早く、どの種類のツイートを埋め込むのが早いのか?
論文 参考訳(メタデータ) (2022-11-16T20:08:35Z) - ViralBERT: A User Focused BERT-Based Approach to Virality Prediction [11.992815669875924]
本稿では、コンテンツとユーザベースの機能を用いて、ツイートのバイラル性を予測できるViralBERTを提案する。
ハッシュタグやフォロワー数などの数値的特徴を合成してテキストをツイートし、2つのBERTモジュールを利用する手法を用いる。
ViralBERTをトレーニングするために330kのツイートのデータセットを収集し、この分野での現在の研究からベースラインを使用して、モデルの有効性を検証する。
論文 参考訳(メタデータ) (2022-05-17T21:40:24Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Understanding Information Spreading Mechanisms During COVID-19 Pandemic
by Analyzing the Impact of Tweet Text and User Features for Retweet
Prediction [6.658785818853953]
新型コロナウイルスは世界の経済や、ほぼすべての人々の日常生活に影響を与えている。
ソーシャルメディアプラットフォームは、情報を共有できる他のユーザーと情報を共有できる。
CNNとRNNをベースとした2つのモデルを提案し、これらのモデルの性能を公開のTweetsCOV19データセットで評価する。
論文 参考訳(メタデータ) (2021-05-26T15:55:58Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Heterogeneous Graph Attention Networks for Early Detection of Rumors on
Twitter [9.358510255345676]
ソーシャルメディアに関する偽の噂は、大衆のパニックを招き、個人的評判を損なう可能性がある。
我々は、テキストの内容と噂の発信元であるツイートの伝搬に基づいて、ツイートワードを利用する異種グラフを構築した。
論文 参考訳(メタデータ) (2020-06-10T14:49:08Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。