論文の概要: Hybrid Machine Learning Model for Detecting Bangla Smishing Text Using BERT and Character-Level CNN
- arxiv url: http://arxiv.org/abs/2502.01518v1
- Date: Mon, 03 Feb 2025 16:51:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:01:46.289070
- Title: Hybrid Machine Learning Model for Detecting Bangla Smishing Text Using BERT and Character-Level CNN
- Title(参考訳): BERTとキャラクタレベルCNNを用いたバングラスマイッシングテキスト検出のためのハイブリッド機械学習モデル
- Authors: Gazi Tanbhir, Md. Farhan Shahriyar, Khandker Shahed, Abdullah Md Raihan Chy, Md Al Adnan,
- Abstract要約: スマイッシング攻撃は328%増加し、モバイルユーザーにとって大きな脅威となった。
人気は高まっているものの、この問題は依然としてかなり過小評価されている。
本稿では,バングラスミッシングテキストを検出するためのハイブリッド機械学習モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Smishing is a social engineering attack using SMS containing malicious content to deceive individuals into disclosing sensitive information or transferring money to cybercriminals. Smishing attacks have surged by 328%, posing a major threat to mobile users, with losses exceeding \$54.2 million in 2019. Despite its growing prevalence, the issue remains significantly under-addressed. This paper presents a novel hybrid machine learning model for detecting Bangla smishing texts, combining Bidirectional Encoder Representations from Transformers (BERT) with Convolutional Neural Networks (CNNs) for enhanced character-level analysis. Our model addresses multi-class classification by distinguishing between Normal, Promotional, and Smishing SMS. Unlike traditional binary classification methods, our approach integrates BERT's contextual embeddings with CNN's character-level features, improving detection accuracy. Enhanced by an attention mechanism, the model effectively prioritizes crucial text segments. Our model achieves 98.47% accuracy, outperforming traditional classifiers, with high precision and recall in Smishing detection, and strong performance across all categories.
- Abstract(参考訳): スマイッシング(Smishing)は、悪意のあるコンテンツを含むSMSを使って個人を騙し、機密情報を開示したり、サイバー犯罪者に送金したりする社会工学攻撃である。
スマイッシング攻撃は328%増加し、モバイルユーザーにとって大きな脅威となり、2019年の損失は5420万ドルを超えた。
人気は高まっているが、この問題は依然としてかなり過小評価されている。
本稿では,変換器 (BERT) からの双方向エンコーダ表現と畳み込みニューラルネットワーク (CNN) を組み合わせ,文字レベル解析の強化を目的とした,バングラスミッシングテキスト検出のためのハイブリッド機械学習モデルを提案する。
本モデルは,通常のSMSとプロモーションSMSとスマイシングSMSを区別することで,マルチクラス分類に対処する。
従来のバイナリ分類法とは異なり、BERTのコンテキスト埋め込みとCNNの文字レベルの特徴を統合し、検出精度を向上させる。
注意機構によって強化され、モデルは重要なテキストセグメントを効果的に優先順位付けする。
我々のモデルは98.47%の精度を実現し、従来の分類器より優れ、スマイシング検出の精度とリコール、全カテゴリで高い性能を実現している。
関連論文リスト
- KLCBL: An Improved Police Incident Classification Model [0.0]
警察のインシデントデータは、公共のセキュリティインテリジェンスにとって不可欠だが、草の根機関は、手動の非効率性と自動システムの制限のために、効率的な分類に苦慮している。
本研究では,言語的に強化されたテキスト前処理アプローチ(LERT),畳み込みニューラルネットワーク(CNN),双方向長短期記憶(BiLSTM)を組み合わせた多チャンネルニューラルネットワークモデルKLCBLを提案する。
このモデルは、分類問題に対処し、警察の情報化を強化し、資源割り当てを改善し、他の分類タスクに幅広い適用性を提供する。
論文 参考訳(メタデータ) (2024-11-11T07:02:23Z) - Undermining Image and Text Classification Algorithms Using Adversarial Attacks [0.0]
本研究は,各種機械学習モデルを訓練し,GANとSMOTEを用いてテキスト分類モデルへの攻撃を目的とした追加データポイントを生成することにより,そのギャップを解消する。
実験の結果,分類モデルの重大な脆弱性が明らかとなった。特に,攻撃後の最上位のテキスト分類モデルの精度が20%低下し,顔認識精度が30%低下した。
論文 参考訳(メタデータ) (2024-11-03T18:44:28Z) - Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T18:42:09Z) - Classification of Non-native Handwritten Characters Using Convolutional Neural Network [0.0]
非ネイティブユーザによる英語文字の分類は、カスタマイズされたCNNモデルを提案することによって行われる。
我々はこのCNNを、手書きの独立した英語文字データセットと呼ばれる新しいデータセットでトレーニングする。
5つの畳み込み層と1つの隠蔽層を持つモデルでは、文字認識精度において最先端モデルよりも優れる。
論文 参考訳(メタデータ) (2024-06-06T21:08:07Z) - FaultGuard: A Generative Approach to Resilient Fault Prediction in Smart Electrical Grids [53.2306792009435]
FaultGuardは、障害タイプとゾーン分類のための最初のフレームワークであり、敵攻撃に耐性がある。
本稿では,ロバスト性を高めるために,低複雑性故障予測モデルとオンライン逆行訓練手法を提案する。
本モデルでは,耐故障予測ベンチマークの最先端を最大0.958の精度で上回っている。
論文 参考訳(メタデータ) (2024-03-26T08:51:23Z) - Securing Graph Neural Networks in MLaaS: A Comprehensive Realization of Query-based Integrity Verification [68.86863899919358]
我々は機械学習におけるGNNモデルをモデル中心の攻撃から保護するための画期的なアプローチを導入する。
提案手法は,GNNの完全性に対する包括的検証スキーマを含み,トランスダクティブとインダクティブGNNの両方を考慮している。
本稿では,革新的なノード指紋生成アルゴリズムを組み込んだクエリベースの検証手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T03:17:05Z) - Text generation for dataset augmentation in security classification
tasks [55.70844429868403]
本研究では、複数のセキュリティ関連テキスト分類タスクにおいて、このデータギャップを埋めるための自然言語テキストジェネレータの適用性を評価する。
我々は,GPT-3データ拡張戦略において,既知の正のクラスサンプルに厳しい制約がある状況において,大きなメリットを見出した。
論文 参考訳(メタデータ) (2023-10-22T22:25:14Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - A New Deep Boosted CNN and Ensemble Learning based IoT Malware Detection [0.0]
セキュリティ問題は、特にIoT(Internet of Things)環境で、さまざまなタイプのネットワークで脅かされている。
我々は,新しいマルウェア検出フレームワークであるDeep Squeezed-Boosted and Ensemble Learning (DSBEL)を開発し,Squeezed-Boosted Boundary-Region Split-Transform-Merge (SB-BR-STM) CNNとアンサンブル学習を行った。
論文 参考訳(メタデータ) (2022-12-15T18:14:51Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。