論文の概要: It's All in the Embedding! Fake News Detection Using Document Embeddings
- arxiv url: http://arxiv.org/abs/2304.07781v1
- Date: Sun, 16 Apr 2023 13:30:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 17:19:58.847896
- Title: It's All in the Embedding! Fake News Detection Using Document Embeddings
- Title(参考訳): It's all in the Embedding!
文書埋め込みを用いた偽ニュース検出
- Authors: Ciprian-Octavian Truic\u{a} and Elena-Simona Apostol
- Abstract要約: 本稿では,文書埋め込みを用いて,ニュース記事を信頼性やニセモノと正確にラベル付けする複数のモデルを構築する手法を提案する。
また、バイナリや複数ラベルの分類を用いて偽ニュースを検出する異なるアーキテクチャのベンチマークを示す。
- 参考スコア(独自算出の注目度): 0.6091702876917281
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the current shift in the mass media landscape from journalistic rigor to
social media, personalized social media is becoming the new norm. Although the
digitalization progress of the media brings many advantages, it also increases
the risk of spreading disinformation, misinformation, and malformation through
the use of fake news. The emergence of this harmful phenomenon has managed to
polarize society and manipulate public opinion on particular topics, e.g.,
elections, vaccinations, etc. Such information propagated on social media can
distort public perceptions and generate social unrest while lacking the rigor
of traditional journalism. Natural Language Processing and Machine Learning
techniques are essential for developing efficient tools that can detect fake
news. Models that use the context of textual data are essential for resolving
the fake news detection problem, as they manage to encode linguistic features
within the vector representation of words. In this paper, we propose a new
approach that uses document embeddings to build multiple models that accurately
label news articles as reliable or fake. We also present a benchmark on
different architectures that detect fake news using binary or multi-labeled
classification. We evaluated the models on five large news corpora using
accuracy, precision, and recall. We obtained better results than more complex
state-of-the-art Deep Neural Network models. We observe that the most important
factor for obtaining high accuracy is the document encoding, not the
classification model's complexity.
- Abstract(参考訳): マスメディアの状況がジャーナリストの厳格さからソーシャルメディアへと変化している今、パーソナライズされたソーシャルメディアが新しい標準になりつつある。
メディアのデジタル化の進展は多くの利点をもたらすが、偽ニュースを利用することで偽情報、誤情報、誤情報を拡散するリスクも高まる。
この有害な現象の出現は、社会を分極し、選挙、予防接種など特定の話題に関する世論を操ることに成功した。
ソーシャルメディアに伝播するこうした情報は、従来のジャーナリズムの厳格さを欠きながら、大衆の認識を歪め、社会不安を生じさせる可能性がある。
自然言語処理と機械学習技術は、偽ニュースを検出する効率的なツールを開発するために不可欠である。
テキストデータのコンテキストを利用するモデルは、単語のベクトル表現内で言語的特徴を符号化するため、偽ニュース検出問題の解決に不可欠である。
本稿では,文書埋め込みを用いて,ニュース記事を信頼性やニセモノと正確にラベル付けする複数のモデルを構築する手法を提案する。
また、バイナリや複数ラベルの分類を用いて偽ニュースを検出する異なるアーキテクチャのベンチマークを示す。
精度,精度,リコールの5つの大ニュースコーパスで評価した。
より複雑なDeep Neural Networkモデルよりも優れた結果を得た。
高い精度を得る上で最も重要な要因は,分類モデルの複雑さではなく,文書符号化である。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - An Interactive Framework for Profiling News Media Sources [26.386860411085053]
本稿では,ニュースメディアのプロファイリングのためのインタラクティブなフレームワークを提案する。
グラフベースのニュースメディアプロファイリングモデル、事前訓練された大規模言語モデル、人間の洞察の強みを組み合わせる。
人間のインタラクションが5つにも満たないので、我々のフレームワークはフェイクや偏見のあるニュースメディアを素早く検出できる。
論文 参考訳(メタデータ) (2023-09-14T02:03:45Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Modelling Social Context for Fake News Detection: A Graph Neural Network
Based Approach [0.39146761527401425]
フェイクニュースの検出は、情報の信頼性を確保し、ニュースエコシステムの信頼性を維持するために不可欠である。
本稿では,ハイブリッドグラフニューラルネットワークによる偽ニュース検出の社会的文脈を解析した。
論文 参考訳(メタデータ) (2022-07-27T12:58:33Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Viable Threat on News Reading: Generating Biased News Using Natural
Language Models [49.90665530780664]
公開されている言語モデルは、入力されたオリジナルニュースに基づいてバイアスのあるニュースコンテンツを確実に生成できることを示す。
また、制御可能なテキスト生成を用いて、多数の高品質な偏りのあるニュース記事を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-05T16:55:39Z) - Modeling the spread of fake news on Twitter [2.7910505923792637]
本稿では,Twitter上での偽ニュース拡散のポイントプロセスモデルを提案する。
提案手法は,偽ニュース項目の拡散の進化を正確に予測する上で,現在の最先端手法よりも優れていることを示す。
提案モデルは,ソーシャルメディア上での偽ニュース拡散のダイナミクスの理解に寄与する。
論文 参考訳(メタデータ) (2020-07-28T08:28:16Z) - Fake News Detection on News-Oriented Heterogeneous Information Networks
through Hierarchical Graph Attention [12.250335118888891]
階層型グラフ注意ネットワーク(HGAT)という,新たなフェイクニュース検出フレームワークを提案する。
HGATは、新しい階層的な注意機構を使用して、HINでノード表現学習を行い、ニュース記事ノードを分類することでフェイクニュースを検出する。
2つの実世界のフェイクニュースデータセットの実験は、HGATがテキストベースのモデルや他のネットワークベースのモデルより優れていることを示している。
論文 参考訳(メタデータ) (2020-02-05T19:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。