論文の概要: A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail
- arxiv url: http://arxiv.org/abs/2210.14616v1
- Date: Wed, 26 Oct 2022 10:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 15:24:45.406137
- Title: A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail
- Title(参考訳): ハイブリッドスパムメール検出のための遅発型マルチモーダル融合モデル
- Authors: Zhibo Zhang, Ernesto Damiani, Hussam Al Hamadi, Chan Yeob Yeun, Fatma
Taher
- Abstract要約: ハイブリッドスパムメールの検出を目的とした研究がいくつか行われている。
光文字認識はテキストと画像のハイブリッドスパム処理において非常に成功した技術である。
テキストと画像のハイブリッドスパム電子メールフィルタリングシステムのための,新しいマルチモーダル融合訓練フレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.182080825408661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, spammers are now trying to obfuscate their intents by
introducing hybrid spam e-mail combining both image and text parts, which is
more challenging to detect in comparison to e-mails containing text or image
only. The motivation behind this research is to design an effective approach
filtering out hybrid spam e-mails to avoid situations where traditional
text-based or image-baesd only filters fail to detect hybrid spam e-mails. To
the best of our knowledge, a few studies have been conducted with the goal of
detecting hybrid spam e-mails. Ordinarily, Optical Character Recognition (OCR)
technology is used to eliminate the image parts of spam by transforming images
into text. However, the research questions are that although OCR scanning is a
very successful technique in processing text-and-image hybrid spam, it is not
an effective solution for dealing with huge quantities due to the CPU power
required and the execution time it takes to scan e-mail files. And the OCR
techniques are not always reliable in the transformation processes. To address
such problems, we propose new late multi-modal fusion training frameworks for a
text-and-image hybrid spam e-mail filtering system compared to the classical
early fusion detection frameworks based on the OCR method. Convolutional Neural
Network (CNN) and Continuous Bag of Words were implemented to extract features
from image and text parts of hybrid spam respectively, whereas generated
features were fed to sigmoid layer and Machine Learning based classifiers
including Random Forest (RF), Decision Tree (DT), Naive Bayes (NB) and Support
Vector Machine (SVM) to determine the e-mail ham or spam.
- Abstract(参考訳): 近年、スパマーは、画像とテキストの両方を組み合わせたハイブリッドスパムメールを導入して、その意図を難読化しようとしている。
この研究の動機は、従来のテキストベースやイメージベースのみのフィルタがハイブリッドスパム電子メールを検出できない状況を避けるために、ハイブリッドスパム電子メールをフィルタリングする効果的なアプローチを設計することにある。
私たちの知る限りでは、ハイブリッドスパムメールの検出を目標とした研究がいくつか行われている。
通常、光学文字認識(OCR)技術は、画像からテキストに変換することでスパムのイメージ部分を除去するために用いられる。
しかし、OCRスキャンはテキストと画像のハイブリッドスパム処理において非常に成功した手法であるが、CPUパワーと電子メールファイルをスキャンするのに要する実行時間により、膨大な量の処理に有効な解決策ではない。
また、OCR技術は変換プロセスにおいて常に信頼できるとは限らない。
このような問題に対処するために,ocr法に基づく従来の早期融合検出フレームワークと比較して,テキスト・画像ハイブリッドスパム電子メールフィルタリングシステムのための新しい遅発型マルチモーダル融合学習フレームワークを提案する。
合成ニューラルネットワーク(cnn)と単語の連続袋を,ハイブリッドスパムのイメージ部分とテキスト部分からそれぞれ抽出し,生成した特徴をランダムフォレスト(rf),決定木(dt),ナイーブベイズ(nb),サポートベクターマシン(svm)などのsgmoid層と機械学習に基づく分類器に供給し,電子メールハムやスパムを判定した。
関連論文リスト
- Prompted Contextual Vectors for Spear-Phishing Detection [45.07804966535239]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文 参考訳(メタデータ) (2024-02-13T09:12:55Z) - DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection [56.513637720967566]
大規模言語モデル(LLM)は、盗作、eコマースプラットフォームへの偽レビューの設置、炎症性偽ツイートなどの誤用のリスクを引き起こすテキストを生成することができる。
既存の高品質な検出手法では、本質的な特徴を抽出するために、モデルの内部にアクセスする必要がある。
ブラックボックスモデル生成テキストの深い内在特性を抽出する。
論文 参考訳(メタデータ) (2023-05-21T17:26:16Z) - Unified Multi-Modal Latent Diffusion for Joint Subject and Text
Conditional Image Generation [63.061871048769596]
本稿では, 特定対象を含む画像と共同テキストを入力シーケンスとして用いた, Unified Multi-Modal Latent Diffusion (UMM-Diffusion) を提案する。
より具体的には、入力テキストと画像の両方を1つの統一マルチモーダル潜在空間に符号化する。
入力テキストと画像の両面から複雑な意味を持つ高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2023-03-16T13:50:20Z) - Building an Effective Email Spam Classification Model with spaCy [0.0]
著者はPythonプログラミング言語のspurCy自然言語処理ライブラリと3つの機械学習(ML)アルゴリズムを使用して、Gmailサービスから収集されたスパムメールを検出する。
論文 参考訳(メタデータ) (2023-03-15T17:41:11Z) - Convolutional Neural Networks for Image Spam Detection [4.817429789586127]
スパムは、孤立しないバルクメールと定義できる。
テキストベースのフィルタを避けるために、スパマーは画像にスパムテキストを埋め込むことがある。
我々は、この問題に対して畳み込みニューラルネットワーク(CNN)を適用し、CNNを用いて得られた結果と他の機械学習技術との比較を行い、その結果を過去の関連する研究と比較する。
論文 参考訳(メタデータ) (2022-04-02T15:10:44Z) - Adaptive Shrink-Mask for Text Detection [91.34459257409104]
既存のリアルタイムテキスト検出器は、ストリップマスクによってテキストの輪郭を直接再構築する。
予測された収縮マスクへの依存は不安定な検出結果をもたらす。
スーパーピクセルウィンドウ (SPW) はネットワークを監督するように設計されている。
論文 参考訳(メタデータ) (2021-11-18T07:38:57Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Universal Adversarial Perturbations and Image Spam Classifiers [4.111899441919165]
画像スパムとは、画像に埋め込まれた電子メールである。
現代のディープラーニングベースの分類器は、典型的な画像スパムを検出するのにうまく機能する。
我々は,画像スパムに適応した「自然な摂動」を生成できる新しいトランスフォーメーションベースの敵攻撃を提案し,解析する。
論文 参考訳(メタデータ) (2021-03-07T14:36:02Z) - DF-GAN: A Simple and Effective Baseline for Text-to-Image Synthesis [80.54273334640285]
本稿では,異なる生成装置間の絡み合わずに高解像度画像を直接合成する,新しい1段階のテキスト・ツー・イメージバックボーンを提案する。
また,Matching-Aware Gradient Penalty と One-Way Output を組み合わせた新たなターゲット認識識別器を提案する。
現在の最先端手法と比較して,提案するDF-GANはよりシンプルだが,現実的およびテキストマッチング画像の合成には効率的である。
論文 参考訳(メタデータ) (2020-08-13T12:51:17Z) - DeepCapture: Image Spam Detection Using Deep Learning and Data
Augmentation [16.488574089293326]
本稿では、畳み込みニューラルネットワーク(CNN)モデルを用いて、DeepCaptureと呼ばれる新しい画像スパムメール検出ツールを提案する。
DeepCaptureは88%のF1スコアを達成でき、既存のスパム検出モデルであるCNN-SVMよりも6%改善されている。
論文 参考訳(メタデータ) (2020-06-16T02:50:04Z) - Classification of Spam Emails through Hierarchical Clustering and
Supervised Learning [1.8065361710947976]
本稿では,すでに検出されているスパムメールのハンドリングを改善するために,スパムメールをカテゴリに分類することを提案する。
マルチクラスのスパム分類のタスクでは、TF-IDFをSVMと組み合わせて最高のマイクロF1スコア、95.39%ドル、および(ii)TD-IDFをNBと組み合わせて最速のスパム分類を行い、電子メールを2.13$msで分析する。
論文 参考訳(メタデータ) (2020-05-18T14:41:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。