論文の概要: DeepCapture: Image Spam Detection Using Deep Learning and Data
Augmentation
- arxiv url: http://arxiv.org/abs/2006.08885v1
- Date: Tue, 16 Jun 2020 02:50:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 18:53:45.176462
- Title: DeepCapture: Image Spam Detection Using Deep Learning and Data
Augmentation
- Title(参考訳): deepcapture:ディープラーニングとデータ拡張を用いた画像スパム検出
- Authors: Bedeuro Kim, Sharif Abuadbba, Hyoungshick Kim
- Abstract要約: 本稿では、畳み込みニューラルネットワーク(CNN)モデルを用いて、DeepCaptureと呼ばれる新しい画像スパムメール検出ツールを提案する。
DeepCaptureは88%のF1スコアを達成でき、既存のスパム検出モデルであるCNN-SVMよりも6%改善されている。
- 参考スコア(独自算出の注目度): 16.488574089293326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image spam emails are often used to evade text-based spam filters that detect
spam emails with their frequently used keywords. In this paper, we propose a
new image spam email detection tool called DeepCapture using a convolutional
neural network (CNN) model. There have been many efforts to detect image spam
emails, but there is a significant performance degrade against entirely new and
unseen image spam emails due to overfitting during the training phase. To
address this challenging issue, we mainly focus on developing a more robust
model to address the overfitting problem. Our key idea is to build a
CNN-XGBoost framework consisting of eight layers only with a large number of
training samples using data augmentation techniques tailored towards the image
spam detection task. To show the feasibility of DeepCapture, we evaluate its
performance with publicly available datasets consisting of 6,000 spam and 2,313
non-spam image samples. The experimental results show that DeepCapture is
capable of achieving an F1-score of 88%, which has a 6% improvement over the
best existing spam detection model CNN-SVM with an F1-score of 82%. Moreover,
DeepCapture outperformed existing image spam detection solutions against new
and unseen image datasets.
- Abstract(参考訳): 画像スパムメールは、しばしば使用されるキーワードでスパムメールを検出するテキストベースのスパムフィルタを避けるために使用される。
本稿では,畳み込みニューラルネットワーク(CNN)モデルを用いて,DeepCaptureと呼ばれる新しい画像スパムメール検出ツールを提案する。
画像スパムメールの検出には多くの取り組みがあったが、トレーニング期間中の過度な適合により、全く新しい、目に見えない画像スパムメールに対して大きなパフォーマンス低下がある。
この課題に対処するため、私たちは主に、オーバーフィット問題に対処するより堅牢なモデルの開発に重点を置いています。
我々のキーとなるアイデアは、画像スパム検出タスクに適したデータ拡張技術を用いて、多数のトレーニングサンプルのみを含む8層からなるCNN-XGBoostフレームワークを構築することです。
DeepCaptureの実現可能性を示すために、6,000のスパムと2,313のノンスパム画像サンプルからなる公開データセットを用いて、その性能を評価する。
実験の結果,DeepCaptureはF1スコア88%を達成でき,既存のスパム検出モデルであるCNN-SVMよりも6%改善され,F1スコア82%となっている。
さらに、DeepCaptureは、新しい、見えない画像データセットに対して、既存のイメージスパム検出ソリューションより優れています。
関連論文リスト
- Multimodal Unlearnable Examples: Protecting Data against Multimodal Contrastive Learning [53.766434746801366]
マルチモーダル・コントラッシブ・ラーニング (MCL) は、インターネットから何百万ものイメージ・キャプション・ペアから学習することで、ゼロショット分類において顕著な進歩を見せている。
ハッカーは、個人やプライバシーに敏感な情報を含む、モデルトレーニングのために画像テキストデータを不正に活用する可能性がある。
近年の研究では、保護のためのショートカットを構築するための訓練画像に知覚不能な摂動を加えることで、学習不可能な例を生成することを提案する。
マルチステップ誤り最小化(MEM)を提案する。
論文 参考訳(メタデータ) (2024-07-23T09:00:52Z) - A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail [5.182080825408661]
ハイブリッドスパムメールの検出を目的とした研究がいくつか行われている。
光文字認識はテキストと画像のハイブリッドスパム処理において非常に成功した技術である。
テキストと画像のハイブリッドスパム電子メールフィルタリングシステムのための,新しいマルチモーダル融合訓練フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T10:47:12Z) - Convolutional Neural Networks for Image Spam Detection [4.817429789586127]
スパムは、孤立しないバルクメールと定義できる。
テキストベースのフィルタを避けるために、スパマーは画像にスパムテキストを埋め込むことがある。
我々は、この問題に対して畳み込みニューラルネットワーク(CNN)を適用し、CNNを用いて得られた結果と他の機械学習技術との比較を行い、その結果を過去の関連する研究と比較する。
論文 参考訳(メタデータ) (2022-04-02T15:10:44Z) - Core Risk Minimization using Salient ImageNet [53.616101711801484]
私たちは、1000のImagenetクラスのコアとスプリアス機能をローカライズする100万人以上のソフトマスクを備えたSalient Imagenetデータセットを紹介します。
このデータセットを用いて、まず、いくつかのImagenet事前訓練されたモデル(総計42件)の素早い特徴に対する依存度を評価する。
次に、コアリスク最小化(CoRM)と呼ばれる新しい学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-28T01:53:34Z) - Anomaly Detection in Emails using Machine Learning and Header
Information [0.0]
フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。
本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
論文 参考訳(メタデータ) (2022-03-19T23:31:23Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - DeepDarts: Modeling Keypoints as Objects for Automatic Scorekeeping in
Darts using a Single Camera [75.34178733070547]
既存のマルチカメラソリューションは、スチールチップダーツの自動スコア管理に非常に高価であり、ほとんどのプレイヤーにはアクセスできない。
キーポイント検出に対する新しいアプローチを提案し,任意のカメラアングルから撮影した単一の画像からダートスコアを予測する。
我々は、このアイデアにまつわる深い畳み込みニューラルネットワークを開発し、ダート位置とダートボードの校正点を予測する。
論文 参考訳(メタデータ) (2021-05-20T16:25:57Z) - Universal Adversarial Perturbations and Image Spam Classifiers [4.111899441919165]
画像スパムとは、画像に埋め込まれた電子メールである。
現代のディープラーニングベースの分類器は、典型的な画像スパムを検出するのにうまく機能する。
我々は,画像スパムに適応した「自然な摂動」を生成できる新しいトランスフォーメーションベースの敵攻撃を提案し,解析する。
論文 参考訳(メタデータ) (2021-03-07T14:36:02Z) - Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。
提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文 参考訳(メタデータ) (2020-06-10T21:18:07Z) - DeepQuarantine for Suspicious Mail [0.0]
DeepQuarantine(DQ)は、潜在的なスパムメッセージを検出し、隔離するクラウド技術である。
隔離されたメールのほとんどはスパムであり、クライアントは遅滞なくメールを使用できる。
論文 参考訳(メタデータ) (2020-01-13T11:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。