論文の概要: BanFakeNews: A Dataset for Detecting Fake News in Bangla
- arxiv url: http://arxiv.org/abs/2004.08789v1
- Date: Sun, 19 Apr 2020 07:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 00:14:43.689870
- Title: BanFakeNews: A Dataset for Detecting Fake News in Bangla
- Title(参考訳): BanFakeNews:バングラのフェイクニュースを検出するデータセット
- Authors: Md Zobaer Hossain, Md Ashraful Rahman, Md Saiful Islam, Sudipta Kar
- Abstract要約: 自動フェイクニュース検知システムの構築に使用できる50Kニュースの注釈付きデータセットを提案する。
我々は,Bangla偽ニュースを識別するためのNLP技術の現状を示すベンチマークシステムを開発した。
- 参考スコア(独自算出の注目度): 1.4170999534105675
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Observing the damages that can be done by the rapid propagation of fake news
in various sectors like politics and finance, automatic identification of fake
news using linguistic analysis has drawn the attention of the research
community. However, such methods are largely being developed for English where
low resource languages remain out of the focus. But the risks spawned by fake
and manipulative news are not confined by languages. In this work, we propose
an annotated dataset of ~50K news that can be used for building automated fake
news detection systems for a low resource language like Bangla. Additionally,
we provide an analysis of the dataset and develop a benchmark system with state
of the art NLP techniques to identify Bangla fake news. To create this system,
we explore traditional linguistic features and neural network based methods. We
expect this dataset will be a valuable resource for building technologies to
prevent the spreading of fake news and contribute in research with low resource
languages.
- Abstract(参考訳): 政治や金融など様々な分野における偽ニュースの急速な伝播による被害を観察し、言語分析による偽ニュースの自動識別が研究コミュニティの注目を集めている。
しかし、このような手法は、低リソース言語が焦点を絞らない英語で開発されている。
しかし、偽ニュースや操作的なニュースによって引き起こされるリスクは言語によって制限されない。
本研究では,Banglaのような低リソース言語のための偽ニュース自動検出システムを構築するために,50K以上のニュースの注釈付きデータセットを提案する。
さらに,Banglaフェイクニュースを識別するためのNLP技術の現状を指標として,データセットの分析とベンチマークシステムの開発を行う。
このシステムを構築するために,従来の言語的特徴とニューラルネットワークに基づく手法を検討する。
このデータセットは、フェイクニュースの拡散を防ぎ、低リソース言語による研究に貢献する技術を構築する上で、貴重なリソースになるだろうと考えています。
関連論文リスト
- Detection of Human and Machine-Authored Fake News in Urdu [2.013675429941823]
ソーシャルメディアは偽ニュースの拡散を増幅した。
従来の偽ニュース検出手法は、言語的手がかりに依存しているため、効果が低くなる。
精度とロバスト性を改善するため,階層的検出手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T12:42:07Z) - MMCFND: Multimodal Multilingual Caption-aware Fake News Detection for Low-resource Indic Languages [0.4062349563818079]
Indic Fake News Detection (MMIFND) のためのマルチモーダル多言語データセットを提案する。
この厳密にキュレートされたデータセットは、ヒンディー語、ベンガル語、マラタイ語、マラヤラム語、タミル語、グジャラート語、パンジャービ語にまたがる28,085のインスタンスで構成されている。
フェイクニュース検出(MMCFND)のためのマルチモーダルキャプション対応フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-14T11:59:33Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - fakenewsbr: A Fake News Detection Platform for Brazilian Portuguese [0.6775616141339018]
本稿ではブラジルポルトガル語における偽ニュースの検出に関する総合的研究について述べる。
本稿では、TF-IDFやWord2Vecといった自然言語処理技術を活用する機械学習ベースのアプローチを提案する。
ユーザフレンドリーなWebプラットフォームである fakenewsbr.com を開発し,ニュース記事の妥当性の検証を容易にする。
論文 参考訳(メタデータ) (2023-09-20T04:10:03Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。