論文の概要: Utilization of Multinomial Naive Bayes Algorithm and Term Frequency
Inverse Document Frequency (TF-IDF Vectorizer) in Checking the Credibility of
News Tweet in the Philippines
- arxiv url: http://arxiv.org/abs/2306.00018v1
- Date: Tue, 30 May 2023 15:41:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 20:36:01.049913
- Title: Utilization of Multinomial Naive Bayes Algorithm and Term Frequency
Inverse Document Frequency (TF-IDF Vectorizer) in Checking the Credibility of
News Tweet in the Philippines
- Title(参考訳): フィリピンにおけるニュースツイートの信頼性検証における多項ナイーブベイズアルゴリズムと項周波数逆文書周波数(tf-idfベクタライザ)の利用
- Authors: Neil Christian R. Riego and Danny Bell Villarba
- Abstract要約: 本稿では,ニュース記事の特徴抽出として,地中真理に基づくアノテーションとTF-IDFを利用する。
モデルの精度は99.46%、88.98%である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The digitalization of news media become a good indicator of progress and
signal to more threats. Media disinformation or fake news is one of these
threats, and it is necessary to take any action in fighting disinformation.
This paper utilizes ground truth-based annotations and TF-IDF as feature
extraction for the news articles which is then used as a training data set for
Multinomial Naive Bayes. The model has an accuracy of 99.46% in training and
88.98% in predicting unseen data. Tagging fake news as real news is a
concerning point on the prediction that is indicated in the F1 score of 89.68%.
This could lead to a negative impact. To prevent this to happen it is suggested
to further improve the corpus collection, and use an ensemble machine learning
to reinforce the prediction
- Abstract(参考訳): ニュースメディアのデジタル化は、さらなる脅威への進展とシグナルのよい指標となる。
メディア偽情報や偽ニュースはこれらの脅威の1つであり、偽情報と戦うためにはいかなる行動も取らなければならない。
本稿では,ニュース記事の特徴抽出として,基底的真理に基づくアノテーションとtf-idfを活用し,多項ベイのための学習データセットとして用いる。
このモデルはトレーニングで99.46%、見えないデータを予測するのに88.98%の精度を持つ。
偽ニュースを実ニュースとしてタグ付けすることは、F1スコア89.68%で示される予測に関する問題である。
これは悪影響をもたらす可能性がある。
これを防止するため、コーパス収集をさらに改善し、アンサンブル機械学習を用いて予測を強化することが提案されている。
関連論文リスト
- Prompt-and-Align: Prompt-Based Social Alignment for Few-Shot Fake News
Detection [50.07850264495737]
プロンプト・アンド・アライン(Prompt-and-Align、P&A)は、数発のフェイクニュース検出のための新しいプロンプトベースのパラダイムである。
我々はP&Aが、数発のフェイクニュース検出性能をかなりのマージンで新たな最先端に設定していることを示す。
論文 参考訳(メタデータ) (2023-09-28T13:19:43Z) - fakenewsbr: A Fake News Detection Platform for Brazilian Portuguese [0.6775616141339018]
本稿ではブラジルポルトガル語における偽ニュースの検出に関する総合的研究について述べる。
本稿では、TF-IDFやWord2Vecといった自然言語処理技術を活用する機械学習ベースのアプローチを提案する。
ユーザフレンドリーなWebプラットフォームである fakenewsbr.com を開発し,ニュース記事の妥当性の検証を容易にする。
論文 参考訳(メタデータ) (2023-09-20T04:10:03Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - MMCoVaR: Multimodal COVID-19 Vaccine Focused Data Repository for Fake
News Detection and a Baseline Architecture for Classification [1.587767395906846]
新型コロナウイルスワクチンに関するニュース記事やツイートを含む新しいマルチモーダルラベル付きデータセットを提供する。
3つのニュースメディアランキングサイトからのレーティングを組み合わせて、ニュースデータセットを信頼性と信頼性の2つのレベルに分類する。
提案アーキテクチャはFスコア0.919,精度0.882で偽ニュース検出を行う。
論文 参考訳(メタデータ) (2021-09-14T03:57:50Z) - Explainable Tsetlin Machine framework for fake news detection with
credibility score assessment [16.457778420360537]
本稿では,最近導入されたTsetlin Machine (TM) に基づく,新たな解釈可能な偽ニュース検出フレームワークを提案する。
我々は、TMの接続節を用いて、真偽のニューステキストの語彙的および意味的特性をキャプチャする。
評価のために、PolitiFactとGossipCopという2つの公開データセットで実験を行い、TMフレームワークが以前公開されたベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2021-05-19T13:18:02Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - Evaluating Deep Learning Approaches for Covid19 Fake News Detection [0.0]
データマイニングの観点から、偽ニュース検出の自動化技術を検討します。
Contraint@AAAI 2021 Covid-19 Fakeニュース検出データセットで異なる教師付きテキスト分類アルゴリズムを評価します。
Covid-19 Fakeニュース検出データセットで98.41%の最高の精度を報告する。
論文 参考訳(メタデータ) (2021-01-11T16:39:03Z) - An Event Correlation Filtering Method for Fake News Detection [0.0]
既存のディープラーニングモデルは、偽ニュース検出の問題に取り組むために大きな進歩を遂げている。
偽ニュースの検出性能を向上させるために,ニュースのイベント相関を利用した。
イベント相関フィルタリング方式で偽ニュースを検出するためにECFMが提案されている。
論文 参考訳(メタデータ) (2020-12-10T07:31:07Z) - Machine Learning Explanations to Prevent Overtrust in Fake News
Detection [64.46876057393703]
本研究では、ニュースレビュープラットフォームに組み込んだ説明可能なAIアシスタントが、フェイクニュースの拡散と戦う効果について検討する。
我々は、ニュースレビューと共有インターフェースを設計し、ニュース記事のデータセットを作成し、4つの解釈可能なフェイクニュース検出アルゴリズムを訓練する。
説明可能なAIシステムについてより深く理解するために、説明プロセスにおけるユーザエンゲージメント、メンタルモデル、信頼、パフォーマンス対策の相互作用について議論する。
論文 参考訳(メタデータ) (2020-07-24T05:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。