論文の概要: BanFakeNews: A Dataset for Detecting Fake News in Bangla
- arxiv url: http://arxiv.org/abs/2004.08789v1
- Date: Sun, 19 Apr 2020 07:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 00:14:43.689870
- Title: BanFakeNews: A Dataset for Detecting Fake News in Bangla
- Title(参考訳): BanFakeNews:バングラのフェイクニュースを検出するデータセット
- Authors: Md Zobaer Hossain, Md Ashraful Rahman, Md Saiful Islam, Sudipta Kar
- Abstract要約: 自動フェイクニュース検知システムの構築に使用できる50Kニュースの注釈付きデータセットを提案する。
我々は,Bangla偽ニュースを識別するためのNLP技術の現状を示すベンチマークシステムを開発した。
- 参考スコア(独自算出の注目度): 1.4170999534105675
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Observing the damages that can be done by the rapid propagation of fake news
in various sectors like politics and finance, automatic identification of fake
news using linguistic analysis has drawn the attention of the research
community. However, such methods are largely being developed for English where
low resource languages remain out of the focus. But the risks spawned by fake
and manipulative news are not confined by languages. In this work, we propose
an annotated dataset of ~50K news that can be used for building automated fake
news detection systems for a low resource language like Bangla. Additionally,
we provide an analysis of the dataset and develop a benchmark system with state
of the art NLP techniques to identify Bangla fake news. To create this system,
we explore traditional linguistic features and neural network based methods. We
expect this dataset will be a valuable resource for building technologies to
prevent the spreading of fake news and contribute in research with low resource
languages.
- Abstract(参考訳): 政治や金融など様々な分野における偽ニュースの急速な伝播による被害を観察し、言語分析による偽ニュースの自動識別が研究コミュニティの注目を集めている。
しかし、このような手法は、低リソース言語が焦点を絞らない英語で開発されている。
しかし、偽ニュースや操作的なニュースによって引き起こされるリスクは言語によって制限されない。
本研究では,Banglaのような低リソース言語のための偽ニュース自動検出システムを構築するために,50K以上のニュースの注釈付きデータセットを提案する。
さらに,Banglaフェイクニュースを識別するためのNLP技術の現状を指標として,データセットの分析とベンチマークシステムの開発を行う。
このシステムを構築するために,従来の言語的特徴とニューラルネットワークに基づく手法を検討する。
このデータセットは、フェイクニュースの拡散を防ぎ、低リソース言語による研究に貢献する技術を構築する上で、貴重なリソースになるだろうと考えています。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [54.60443666911077]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - fakenewsbr: A Fake News Detection Platform for Brazilian Portuguese [0.6775616141339018]
本稿ではブラジルポルトガル語における偽ニュースの検出に関する総合的研究について述べる。
本稿では、TF-IDFやWord2Vecといった自然言語処理技術を活用する機械学習ベースのアプローチを提案する。
ユーザフレンドリーなWebプラットフォームである fakenewsbr.com を開発し,ニュース記事の妥当性の検証を容易にする。
論文 参考訳(メタデータ) (2023-09-20T04:10:03Z) - Unsupervised Domain-agnostic Fake News Detection using Multi-modal Weak
Signals [19.22829945777267]
本研究は,4つのモダリティで利用可能な知識をニュースレコードに埋め込んだ,教師なしフェイクニュース検出のための効果的なフレームワークを提案する。
また,既存のニュースデータセットの潜伏バイアスを最小限に抑えたニュースデータセット構築手法を提案する。
LUND-COVIDを使って提案した教師なしフレームワークをトレーニングし、大規模データセットの可能性を活用した。
論文 参考訳(メタデータ) (2023-05-18T23:49:31Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - SGG: Spinbot, Grammarly and GloVe based Fake News Detection [6.193231258199234]
オンラインニュースポータルは必然的に、偽情報をWebに広める原因になっている。
このような不正行為は、堅牢な自動偽ニュース検知システムを要求する。
本稿では, パラフレーズ, 文法チェック, 単語埋め込みのツールを活用した, 頑健で単純な偽ニュース検出システムを提案する。
論文 参考訳(メタデータ) (2020-08-16T08:06:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。