論文の概要: LTCR: Long-Text Chinese Rumor Detection Dataset
- arxiv url: http://arxiv.org/abs/2306.07201v2
- Date: Tue, 13 Jun 2023 08:08:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 10:22:05.485098
- Title: LTCR: Long-Text Chinese Rumor Detection Dataset
- Title(参考訳): LTCR:長文中国の噂検出データセット
- Authors: Ziyang Ma, Mengsha Liu, Guian Fang, Ying Shen
- Abstract要約: LTCRという長文中国噂データセットが提案されている。
データセットは、それぞれ1,729件のリアルニュースと500件のフェイクニュースで構成されている。
実ニュースと偽ニュースの平均長は約230文字と152文字である。
- 参考スコア(独自算出の注目度): 14.503426768310536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: False information can spread quickly on social media, negatively influencing
the citizens' behaviors and responses to social events. To better detect all of
the fake news, especially long texts which are harder to find completely, a
Long-Text Chinese Rumor detection dataset named LTCR is proposed. The LTCR
dataset provides a valuable resource for accurately detecting misinformation,
especially in the context of complex fake news related to COVID-19. The dataset
consists of 1,729 and 500 pieces of real and fake news, respectively. The
average lengths of real and fake news are approximately 230 and 152 characters.
We also propose \method, Salience-aware Fake News Detection Model, which
achieves the highest accuracy (95.85%), fake news recall (90.91%) and F-score
(90.60%) on the dataset. (https://github.com/Enderfga/DoubleCheck)
- Abstract(参考訳): 偽情報はソーシャルメディアに急速に広まり、市民の行動や社会イベントに対する反応に悪影響を及ぼす。
偽ニュース、特に完全に見つけるのが難しい長いテキストをよりよく検出するために、LTCRと呼ばれるLong-Text Chinese Rumor検出データセットが提案されている。
ltcrデータセットは、特にcovid-19に関連する複雑な偽ニュースの文脈において、誤った情報を正確に検出するための貴重なリソースを提供する。
データセットは、それぞれ1,729と500のリアルニュースとフェイクニュースで構成されている。
実ニュースと偽ニュースの平均長は約230文字と152文字である。
また,データセット上で最も高い精度(95.85%),偽ニュースリコール(90.91%),f-score(90.60%)を実現する,salience-aware fake news detectionモデルを提案する。
(https://github.com/Enderfga/DoubleCheck)
関連論文リスト
- MCFEND: A Multi-source Benchmark Dataset for Chinese Fake News Detection [5.288018460787191]
純粋に1つのニュースソースで訓練された方法は、現実のシナリオにはほとんど適用できない。
MCFENDと呼ばれる中国の偽ニュース検出のための、最初のマルチソースベンチマークデータセットを構築した。
MCFENDは、ベンチマークデータセットとして、中国の偽ニュース検出アプローチを現実世界のシナリオで前進させることを目的としている。
論文 参考訳(メタデータ) (2024-03-14T04:32:13Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Written and spoken corpus of real and fake social media postings about
COVID-19 [0.0]
データは言語データ中のパターンを検出するためにLingguistic Inquiry and Word Count (LIWC)ソフトウェアを用いて分析された。
その結果, 偽ニュースと実ニュースを区別する言語的特徴の集合が, 文章データと音声データの両方で示されることがわかった。
論文 参考訳(メタデータ) (2023-10-06T13:21:04Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - A Heuristic-driven Uncertainty based Ensemble Framework for Fake News
Detection in Tweets and News Articles [5.979726271522835]
ニュース項目が「本物」か「偽」かを自動的に識別する新しい偽ニュース検出システムについて述べる。
我々は,事前学習したモデルと統計的特徴融合ネットワークからなるアンサンブルモデルを用いた。
提案手法は,分類タスクの適切なクラス出力信頼度レベルとともに,信頼性の高い予測不確実性を定量化した。
論文 参考訳(メタデータ) (2021-04-05T06:35:30Z) - Evaluating Deep Learning Approaches for Covid19 Fake News Detection [0.0]
データマイニングの観点から、偽ニュース検出の自動化技術を検討します。
Contraint@AAAI 2021 Covid-19 Fakeニュース検出データセットで異なる教師付きテキスト分類アルゴリズムを評価します。
Covid-19 Fakeニュース検出データセットで98.41%の最高の精度を報告する。
論文 参考訳(メタデータ) (2021-01-11T16:39:03Z) - Connecting the Dots Between Fact Verification and Fake News Detection [21.564628184287173]
本稿では,事実検証と偽ニュース検出の点を結合する,シンプルで効果的な手法を提案する。
提案手法は,最近の事実検証モデルの成功を活用し,ゼロショットフェイクニュースの検出を可能にする。
論文 参考訳(メタデータ) (2020-10-11T09:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。