論文の概要: An Optimized Machine Learning Classifier for Detecting Fake Reviews Using Extracted Features
- arxiv url: http://arxiv.org/abs/2511.21716v1
- Date: Wed, 19 Nov 2025 10:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.358512
- Title: An Optimized Machine Learning Classifier for Detecting Fake Reviews Using Extracted Features
- Title(参考訳): 抽出特徴量を用いたフェイクレビュー検出のための最適機械学習分類器
- Authors: Shabbir Anees, Anshuman, Ayush Chaurasia, Prathmesh Bogar,
- Abstract要約: 本稿では,AIによるこれらのレビューを顕著な精度で分析する,高度な機械学習ベースのシステムを提案する。
提案手法は,高度なテキスト前処理,マルチモーダル特徴抽出,ハリスホークス最適化,および積み重ねアンサンブル分類器を統合する。
我々の最終積み重ねモデルは95.40%の精度、92.81%の精度、95.01%のリコール、93.90%のF1スコアを達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is well known that fraudulent reviews cast doubt on the legitimacy and dependability of online purchases. The most recent development that leads customers towards darkness is the appearance of human reviews in computer-generated (CG) ones. In this work, we present an advanced machine-learning-based system that analyses these reviews produced by AI with remarkable precision. Our method integrates advanced text preprocessing, multi-modal feature extraction, Harris Hawks Optimization (HHO) for feature selection, and a stacking ensemble classifier. We implemented this methodology on a public dataset of 40,432 Original (OR) and Computer-Generated (CG) reviews. From an initial set of 13,539 features, HHO selected the most applicable 1,368 features, achieving an 89.9% dimensionality reduction. Our final stacking model achieved 95.40% accuracy, 92.81% precision, 95.01% recall, and a 93.90% F1-Score, which demonstrates that the combination of ensemble learning and bio-inspired optimisation is an effective method for machine-generated text recognition. Because large-scale review analytics commonly run on cloud platforms, privacy-preserving techniques such as differential approaches and secure outsourcing are essential to protect user data in these systems.
- Abstract(参考訳): 不正なレビューがオンライン購入の正当性と信頼性に疑問を投げかけたことはよく知られている。
顧客を闇へと導く最新の開発は、コンピュータ生成(CG)の人間のレビューの出現である。
本研究では,AIが生成したレビューを顕著な精度で分析する,高度な機械学習に基づくシステムを提案する。
提案手法は,高度なテキスト前処理,マルチモーダル特徴抽出,特徴選択のためのハリスホークス最適化(HHO),および積み重ねアンサンブル分類器を統合する。
提案手法は,40,432のOriginal (OR) とComputer-Generated (CG) のパブリックデータセット上に実装された。
13,539個の特徴から、HHOは最も適用可能な1,368個の特徴を選択し、89.9%の次元減少を達成した。
我々の最終積み重ねモデルは95.40%の精度、92.81%の精度、95.01%のリコール、93.90%のF1スコアを達成した。
大規模なレビュー分析はクラウドプラットフォーム上で実行されることが多いため,これらのシステム内のユーザデータを保護する上では,差分アプローチやセキュアなアウトソーシングといったプライバシ保護技術が不可欠である。
関連論文リスト
- Adaptive Malware Detection using Sequential Feature Selection: A Dueling Double Deep Q-Network (D3QN) Framework for Intelligent Classification [1.4120905648647635]
マルウェアの分類をマルコフ決定プロセスとして定式化する。
適応型逐次特徴選択のためのD3QN(Dueling Double Deep Q-Network)フレームワークを提案する。
Microsoft Big2015(9クラス,1,795機能)とBODMAS(バイナリ,2,381機能)データセットに対するアプローチを評価します。
論文 参考訳(メタデータ) (2025-07-06T12:37:50Z) - Towards Trustworthy Keylogger detection: A Comprehensive Analysis of Ensemble Techniques and Feature Selections through Explainable AI [0.0]
キーロガー検出は、タイピングと文字表示の遅延のような異常なシステム動作の監視を含む。
本研究では,従来の機械学習モデルを用いたキーロガー検出の包括的解析を行う。
論文 参考訳(メタデータ) (2025-05-22T01:04:13Z) - Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production [1.3499500088995464]
本研究では,自動車生産環境における人工知能適用の有効性について検討した。
データ構造は、コンテキストの特徴を識別するために分析され、ワンホット符号化を使用して前処理される。
この研究は、高度に可変された生産データにAIメソッドを効果的に適用し、ビジネス価値を付加できることを実証している。
論文 参考訳(メタデータ) (2025-01-13T13:28:03Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Transforming In-Vehicle Network Intrusion Detection: VAE-based Knowledge Distillation Meets Explainable AI [0.0]
本稿では,変分オートエンコーダ(VAE)に基づく知識蒸留手法を用いて,KD-XVAEと呼ばれる高度な侵入検知システムを提案する。
本モデルでは,1669個のパラメータで処理し,バッチ毎に0.3msの推論時間を実現することにより,複雑性を大幅に低減する。
論文 参考訳(メタデータ) (2024-10-11T17:57:16Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Clustering and Ranking: Diversity-preserved Instruction Selection through Expert-aligned Quality Estimation [56.13803674092712]
本稿では,産業に優しく,専門家に順応し,多様性に配慮した指導データ選択手法を提案する:クラスタリングとランキング(CaR)
CaRは2段階のプロセスを採用している: まず、専門家の好みに合わせた高精度(84.25%)のスコアリングモデルを使用して、命令ペアをランク付けする。
我々の実験では、CaRはAlpacaのITデータのわずか1.96%を効率よく選択したが、結果のAlpaCaRモデルはGPT-4の評価において平均32.1%の精度でAlpacaのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2024-02-28T09:27:29Z) - Evaluating Machine Unlearning via Epistemic Uncertainty [78.27542864367821]
本研究では,不確実性に基づく機械学習アルゴリズムの評価を行う。
これは私たちの最良の知識の一般的な評価の最初の定義です。
論文 参考訳(メタデータ) (2022-08-23T09:37:31Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。