論文の概要: Leveraging Big Data Frameworks for Spam Detection in Amazon Reviews
- arxiv url: http://arxiv.org/abs/2509.21579v1
- Date: Thu, 25 Sep 2025 20:56:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.011758
- Title: Leveraging Big Data Frameworks for Spam Detection in Amazon Reviews
- Title(参考訳): Amazon Reviewsにおけるスパム検出のためのビッグデータフレームワークの活用
- Authors: Mst Eshita Khatun, Halima Akter, Tasnimul Rehan, Toufiq Ahmed,
- Abstract要約: この研究は、高度なビッグデータ分析と機械学習アプローチを、Amazon製品レビューのかなりのデータセットに採用している。
主な目的は、スパムレビューを正確に検出し、分類し、レビューの信頼性を高めることである。
ロジスティック回帰は90.35%の精度を達成し、より信頼性が高く透明なオンラインショッピング環境に寄与する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this digital era, online shopping is common practice in our daily lives. Product reviews significantly influence consumer buying behavior and help establish buyer trust. However, the prevalence of fraudulent reviews undermines this trust by potentially misleading consumers and damaging the reputations of the sellers. This research addresses this pressing issue by employing advanced big data analytics and machine learning approaches on a substantial dataset of Amazon product reviews. The primary objective is to detect and classify spam reviews accurately so that it enhances the authenticity of the review. Using a scalable big data framework, we efficiently process and analyze a large scale of review data, extracting key features indicative of fraudulent behavior. Our study illustrates the utility of various machine learning classifiers in detecting spam reviews, with Logistic Regression achieving an accuracy of 90.35%, thus contributing to a more trustworthy and transparent online shopping environment.
- Abstract(参考訳): このデジタル時代には、オンラインショッピングは私たちの日常生活に共通する実践である。
製品レビューは消費者の購買行動に大きな影響を与え、購入者の信頼を確立するのに役立つ。
しかし、不正レビューの流行は、消費者を誤解させ、売り手の評判を傷つけることによって、この信頼を損なう。
この研究は、高度なビッグデータ分析と機械学習アプローチを、Amazon製品レビューのかなりのデータセットに導入することで、このプレッシャーに対処する。
主な目的は、スパムレビューを正確に検出し、分類し、レビューの信頼性を高めることである。
スケーラブルなビッグデータフレームワークを使用して、大規模なレビューデータを効率的に処理し、分析し、不正行為を示す重要な特徴を抽出する。
本研究は,ロジスティック回帰が90.35%の精度を達成し,より信頼性が高く透明なオンラインショッピング環境に寄与する,スパムレビューの検出における機械学習分類器の有用性について述べる。
関連論文リスト
- LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.87393214734114]
この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。
大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。
命令ベースのデータセットの微調整により、パフォーマンスが10~20ポイント向上する。
論文 参考訳(メタデータ) (2025-04-15T10:07:33Z) - Unmasking Falsehoods in Reviews: An Exploration of NLP Techniques [0.0]
本研究は,誤認レビューを識別する機械学習モデルを提案する。
これを実現するために,n-gramモデルと最大特徴量を開発し,認識内容を効果的に同定する。
実験結果から,パッシブ・アグレッシブ・クラシファイアは様々なアルゴリズムにおいて顕著であることがわかった。
論文 参考訳(メタデータ) (2023-07-20T06:35:43Z) - Protecting User Privacy in Online Settings via Supervised Learning [69.38374877559423]
我々は、教師付き学習を活用する、オンラインプライバシ保護に対するインテリジェントなアプローチを設計する。
ユーザのプライバシを侵害する可能性のあるデータ収集を検出してブロックすることにより、ユーザに対してある程度のディジタルプライバシを復元することが可能になります。
論文 参考訳(メタデータ) (2023-04-06T05:20:16Z) - 5-Star Hotel Customer Satisfaction Analysis Using Hybrid Methodology [0.0]
我々の研究は、レビューデータから顧客満足度を判断する新しい方法を提案する。
これまで実施されてきた顧客満足度に関する多くの研究とは異なり、本研究は論文の新規性を持っている。
論文 参考訳(メタデータ) (2022-09-26T04:53:10Z) - Opinion Spam Detection: A New Approach Using Machine Learning and
Network-Based Algorithms [2.062593640149623]
オンラインレビューは、消費者が製品やサービスを評価し比較する上で重要な役割を果たす。
偽レビュー(オピニオンスパム)が普及し、顧客やサービスプロバイダに悪影響を及ぼしている。
本稿では,機械学習とメッセージパッシングアルゴリズムを組み合わせて,レビュアーをスパマーや良心として分類する手法を提案する。
論文 参考訳(メタデータ) (2022-05-26T15:27:46Z) - Characterization of Frequent Online Shoppers using Statistical Learning
with Sparsity [54.26540039514418]
本研究は,小売分析と統計学習のアイデアを疎結合に組み合わせ,買い物客のオンラインギフトストアへの買い物嗜好を学習する方法を報告する。
論文 参考訳(メタデータ) (2021-11-11T05:36:39Z) - Confounds and Overestimations in Fake Review Detection: Experimentally
Controlling for Product-Ownership and Data-Origin [1.658669052286989]
2つのコンファウンドは、データオリジン(データセットは複数のソースで構成されている)と製品オーナーシップ(レビューされた製品を所有しているか、所有していない個人によって書かれたレビュー)である。
データオリジン、製品オーナシップ、レビューポラリティ、妥当性を操作し、改善された学習分析により、レビューの妥当性(60.26 - 69.87%)は幾らか検出可能であるが、レビューは製品オーナーシップ(66.19 - 74.17%)またはデータオリジン(84.44 - 86.94%)で分類し易いことが示唆された。
論文 参考訳(メタデータ) (2021-10-28T14:04:03Z) - Improving Opinion Spam Detection by Cumulative Relative Frequency
Distribution [0.9176056742068814]
オンラインレビューにおける意見スパムの検出には様々なアプローチが提案されている。
我々は意見スパムの分類に有効な一連の機能を再設計した。
分布特性を用いることで分類器の性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-12-27T10:23:44Z) - Learning to Infer User Hidden States for Online Sequential Advertising [52.169666997331724]
本稿では,これらの問題に対処するディープインテントシーケンス広告(DISA)手法を提案する。
解釈可能性の鍵となる部分は、消費者の購入意図を理解することである。
論文 参考訳(メタデータ) (2020-09-03T05:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。