論文の概要: Bengali Fake Review Detection using Semi-supervised Generative
Adversarial Networks
- arxiv url: http://arxiv.org/abs/2304.02739v1
- Date: Wed, 5 Apr 2023 20:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 16:00:47.716368
- Title: Bengali Fake Review Detection using Semi-supervised Generative
Adversarial Networks
- Title(参考訳): 半教師付き生成逆数ネットワークを用いたベンガリフェイクレビュー検出
- Authors: Md. Tanvir Rouf Shawon, G. M. Shahariar, Faisal Muhammad Shah,
Mohammad Shafiul Alam and Md. Shahriar Mahbub
- Abstract要約: 本稿では,半教師付きGAN(Generative Adversarial Networks)による事前学習言語モデルの微調整の可能性について検討する。
提案した半教師付きGAN-LMアーキテクチャは,ベンガルの偽レビューを分類する上で有効な解であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper investigates the potential of semi-supervised Generative
Adversarial Networks (GANs) to fine-tune pretrained language models in order to
classify Bengali fake reviews from real reviews with a few annotated data. With
the rise of social media and e-commerce, the ability to detect fake or
deceptive reviews is becoming increasingly important in order to protect
consumers from being misled by false information. Any machine learning model
will have trouble identifying a fake review, especially for a low resource
language like Bengali. We have demonstrated that the proposed semi-supervised
GAN-LM architecture (generative adversarial network on top of a pretrained
language model) is a viable solution in classifying Bengali fake reviews as the
experimental results suggest that even with only 1024 annotated samples,
BanglaBERT with semi-supervised GAN (SSGAN) achieved an accuracy of 83.59% and
a f1-score of 84.89% outperforming other pretrained language models -
BanglaBERT generator, Bangla BERT Base and Bangla-Electra by almost 3%, 4% and
10% respectively in terms of accuracy. The experiments were conducted on a
manually labeled food review dataset consisting of total 6014 real and fake
reviews collected from various social media groups. Researchers that are
experiencing difficulty recognizing not just fake reviews but other
classification issues owing to a lack of labeled data may find a solution in
our proposed methodology.
- Abstract(参考訳): 本稿では,ベンガルの偽レビューを実際のレビューからいくつかの注釈付きデータで分類するために,GANが事前学習言語モデルを微調整する可能性について検討する。
ソーシャルメディアやeコマースの台頭に伴い、消費者が偽情報によって誤解されるのを防ぐために、偽レビューや偽レビューを検知する能力がますます重要になっている。
どんな機械学習モデルでも、特にbengaliのような低リソース言語の場合、偽レビューを特定するのに苦労する。
We have demonstrated that the proposed semi-supervised GAN-LM architecture (generative adversarial network on top of a pretrained language model) is a viable solution in classifying Bengali fake reviews as the experimental results suggest that even with only 1024 annotated samples, BanglaBERT with semi-supervised GAN (SSGAN) achieved an accuracy of 83.59% and a f1-score of 84.89% outperforming other pretrained language modelsBanglaBERT generator, Bangla BERT Base and Bangla-Electra by almost 3%, 4% and 10% respectively in terms of accuracy.
実験は、さまざまなソーシャルメディアグループから収集された6014件のリアルレビューとフェイクレビューからなる、手動でラベル付けされた食品レビューデータセット上で実施された。
偽レビューだけでなく,ラベル付きデータの欠如による分類問題も認識に苦慮している研究者は,提案手法の解決法を見出すことができる。
関連論文リスト
- What Matters in Explanations: Towards Explainable Fake Review Detection Focusing on Transformers [45.55363754551388]
顧客のレビューとフィードバックは、Amazon、Zalando、eBayなどのEコマースプラットフォームにおいて重要な役割を果たす。
売り手が偽レビューやスパムレビューを投稿し、潜在的な顧客を欺き、製品に関する意見を操作しているという懸念が有力である。
本稿では,偽レビューを高精度に検出するための説明可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-24T13:26:02Z) - Bengali Fake Reviews: A Benchmark Dataset and Detection System [0.0]
本稿では,Bengali Fake Review Detection (BFRD)データセットを紹介する。
データセットは7710件のノンフェイクと1339件の偽の食品関連レビューで構成されている。
レビューで非ベンガル語を変換するために、英語の単語を対応するベンガル語の意味に翻訳するユニークなパイプラインが提案されている。
論文 参考訳(メタデータ) (2023-08-03T18:49:45Z) - Tackling Fake News in Bengali: Unraveling the Impact of Summarization vs. Augmentation on Pre-trained Language Models [0.0]
ベンガル語で偽ニュースを分類するための4つの異なるアプローチからなる方法論を提案する。
弊社のアプローチは、英語ニュース記事の翻訳や、偽ニュース記事の欠陥を抑えるための強化技術の利用を含む。
ベンガル語偽ニュース検出における要約と拡張の有効性を示す。
論文 参考訳(メタデータ) (2023-07-13T14:50:55Z) - BanglaBook: A Large-scale Bangla Dataset for Sentiment Analysis from
Book Reviews [1.869097450593631]
本稿では,バングラ書評の大規模データセットについて,肯定,否定,中立の3つのカテゴリに分類される158,065のサンプルからなる。
我々は、SVM、LSTM、Bangla-BERTなどのベースラインを確立するために、さまざまな機械学習モデルを使用します。
この結果から,手作業で作成する機能に依存したモデルよりも,事前訓練したモデルに対して,かなりの性能上の利点が示された。
論文 参考訳(メタデータ) (2023-05-11T06:27:38Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Combat AI With AI: Counteract Machine-Generated Fake Restaurant Reviews
on Social Media [77.34726150561087]
我々は、高品質なYelpレビューを活用して、OpenAI GPTレビュー作成者から偽レビューを生成することを提案する。
このモデルを適用して、非エリートレビューを予測し、複数の次元にまたがるパターンを識別する。
ソーシャルメディアプラットフォームは、マシン生成の偽レビューによって継続的に挑戦されていることを示す。
論文 参考訳(メタデータ) (2023-02-10T19:40:10Z) - Online Fake Review Detection Using Supervised Machine Learning And BERT
Model [0.0]
テキストから単語の埋め込みを抽出するためにBERT(Bidirectional Representation from Transformers)モデルを提案する(レビュー)。
その結果、SVM分類器は精度で他より優れており、f1スコアは精度87.81%であることがわかった。
論文 参考訳(メタデータ) (2023-01-09T09:40:56Z) - Fake or Genuine? Contextualised Text Representation for Fake Review
Detection [0.4724825031148411]
本稿では, トランスフォーマーアーキテクチャを用いて, 偽レビューのシーケンス中に隠されたパターンを発見し, 正確に検出する新しいアンサンブルモデルを提案する。
半現実的なベンチマークデータセットを用いた実験結果から,提案モデルが最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-12-29T00:54:47Z) - Explain, Edit, and Understand: Rethinking User Study Design for
Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。
単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (2021-12-17T18:29:56Z) - ScoreGAN: A Fraud Review Detector based on Multi Task Learning of
Regulated GAN with Data Augmentation [50.779498955162644]
生成・検出プロセスにおけるレビューテキストとレビューレーティングスコアの両方を利用した不正レビュー検出のためのScoreGANを提案する。
その結果,提案フレームワークは,既存の最先端フレームワークであるFakeGANをAPの7%,YelpとTripAdvisorのデータセットで5%上回る性能を示した。
論文 参考訳(メタデータ) (2020-06-11T16:15:06Z) - Unsupervised Opinion Summarization with Noising and Denoising [85.49169453434554]
ユーザレビューのコーパスから合成データセットを作成し、レビューをサンプリングし、要約のふりをして、ノイズのあるバージョンを生成します。
テスト時に、モデルは本物のレビューを受け入れ、健全な意見を含む要約を生成し、合意に達しないものをノイズとして扱います。
論文 参考訳(メタデータ) (2020-04-21T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。