論文の概要: VBSF: A Visual-Based Spam Filtering Technique for Obfuscated Emails
- arxiv url: http://arxiv.org/abs/2512.23788v1
- Date: Mon, 29 Dec 2025 18:18:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.172916
- Title: VBSF: A Visual-Based Spam Filtering Technique for Obfuscated Emails
- Title(参考訳): VBSF: 難読メールのためのビジュアルベースのスパムフィルタリング技術
- Authors: Ali Hossary, Stefano Tomasin,
- Abstract要約: 最近のスパムメール技術は、テキストメッセージの視覚効果を利用する。
これらの効果は、テキストに基づいてスパム検出技術を回避することができた。
視覚ベーススパムフィルタ(VBSF)と呼ばれる新しい視覚ベースのスパム検出アーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 13.498324867038713
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent spam email techniques exploit visual effects in text messages, such as poisoning text, obfuscating words, and hidden text salting techniques. These effects were able to evade spam detection techniques based on the text. In this paper, we overcome this limitation by introducing a novel visual-based spam detection architecture, denoted as visual-based spam filter (VBSF). The multi-step process mimics the human eye's natural way of processing visual information, automatically rendering incoming emails and capturing their content as it appears on a user screen. Then, two different processing pipelines are applied in parallel. The first pipeline pertains to the perceived textual content, as it includes optical character recognition (OCR) to extract rendered textual content, followed by naive Bayes (NB) and decision tree (DT) content classifiers. The second pipeline focuses on the appearance of the email, as it analyzes and classifies the images of rendered emails through a specific convolutional neural network. Lastly, a meta classifier integrates text- and image-based classifier outputs, exploiting the stacking ensemble learning method. The performance of the proposed VBSF is assessed, showing that it achieves an accuracy of more than 98%, which is higher than the compared existing techniques on the designed dataset.
- Abstract(参考訳): 最近のスパムメール技術は、テキストの中毒、難読化語、隠されたテキストソルティング技術など、テキストメッセージの視覚効果を利用する。
これらの効果は、テキストに基づいてスパム検出技術を回避することができた。
本稿では,視覚ベースのスパム検出アーキテクチャを,視覚ベースのスパムフィルタ(VBSF)として導入することで,この制限を克服する。
このマルチステッププロセスは、人間の目で視覚情報を処理し、受信したメールを自動でレンダリングし、ユーザの画面に表示されるようにコンテンツをキャプチャする、という人間の自然なやり方を模倣する。
次に、2つの異なる処理パイプラインを並列に適用する。
第1のパイプラインは、描画されたテキストコンテンツを抽出する光学的文字認識(OCR)を含む、知覚されたテキストコンテンツに関するもので、次いでネイブベイズ(NB)と決定木(DT)コンテンツ分類器が続く。
第2のパイプラインは、特定の畳み込みニューラルネットワークを通じて、レンダリングされたメールの画像を分析し、分類するEメールの外観に焦点を当てている。
最後に、メタ分類器はテキストおよび画像に基づく分類器出力を統合し、積み重ねアンサンブル学習法を利用する。
提案したVBSFの性能を評価し,98%以上の精度を達成できることを示した。
関連論文リスト
- Visual Text Processing: A Comprehensive Review and Unified Evaluation [99.57846940547171]
視覚テキスト処理における最近の進歩を包括的・多視点的に分析する。
本研究の目的は,視覚テキスト処理のダイナミックな分野における今後の探索と革新を促進する基礎資源として,本研究を確立することである。
論文 参考訳(メタデータ) (2025-04-30T14:19:29Z) - Decoder Pre-Training with only Text for Scene Text Recognition [54.93037783663204]
シーンテキスト認識(STR)事前学習法は,主に合成データセットに依存し,顕著な進歩を遂げている。
STR(DPTR)用テキストのみを用いたDecoder Pre-trainingという新しい手法を提案する。
DPTRはCLIPテキストエンコーダが生成したテキスト埋め込みを擬似視覚埋め込みとして扱い、デコーダの事前訓練に使用する。
論文 参考訳(メタデータ) (2024-08-11T06:36:42Z) - Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text Retrieval [13.315951821189538]
シーンテキスト検索は、画像ギャラリーからクエリテキストを含むすべての画像を見つけることを目的としている。
現在の取り組みでは、複雑なテキスト検出および/または認識プロセスを必要とする光学文字認識(OCR)パイプラインを採用する傾向にある。
我々は,OCRのないシーンテキスト検索のためのCLIP(Contrastive Language- Image Pre-Trening)の本質的な可能性について検討する。
論文 参考訳(メタデータ) (2024-08-01T10:25:14Z) - VLLMs Provide Better Context for Emotion Understanding Through Common Sense Reasoning [66.23296689828152]
我々は、視覚・言語モデルの機能を活用し、文脈内感情分類を強化する。
まず、VLLMに対して、視覚的文脈に関連して、被験者の明らかな感情を自然言語で記述するように促す。
第二に、記述は視覚入力とともに、トランスフォーマーベースのアーキテクチャのトレーニングに使用される。
論文 参考訳(メタデータ) (2024-04-10T15:09:15Z) - Visually-augmented pretrained language models for NLP tasks without
images [77.74849855049523]
既存のソリューションはしばしば視覚的知識増強のために明示的なイメージに依存している。
我々は、新しいtextbfVisually-textbfAugmented fine-tuningアプローチを提案する。
我々のアプローチは、BERT、RoBERTa、BART、T5を異なるスケールで継続的に改善することができる。
論文 参考訳(メタデータ) (2022-12-15T16:13:25Z) - A Late Multi-Modal Fusion Model for Detecting Hybrid Spam E-mail [5.182080825408661]
ハイブリッドスパムメールの検出を目的とした研究がいくつか行われている。
光文字認識はテキストと画像のハイブリッドスパム処理において非常に成功した技術である。
テキストと画像のハイブリッドスパム電子メールフィルタリングシステムのための,新しいマルチモーダル融合訓練フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T10:47:12Z) - Language Matters: A Weakly Supervised Pre-training Approach for Scene
Text Detection and Spotting [69.77701325270047]
本稿では,シーンテキストを効果的に表現できる弱教師付き事前学習手法を提案する。
本ネットワークは,画像エンコーダと文字認識型テキストエンコーダから構成され,視覚的特徴とテキスト的特徴を抽出する。
実験により、事前訓練されたモデルは、重みを他のテキスト検出やスポッティングネットワークに転送しながら、Fスコアを+2.5%、+4.8%改善することが示された。
論文 参考訳(メタデータ) (2022-03-08T08:10:45Z) - SCATTER: Selective Context Attentional Scene Text Recognizer [16.311256552979835]
Scene Text Recognition (STR) は複雑な画像背景に対してテキストを認識するタスクである。
現在のSOTA(State-of-the-art)メソッドは、任意の形で書かれたテキストを認識するのに依然として苦労している。
Selective Context Attentional Text Recognizer (SCATTER) というSTRの新しいアーキテクチャを導入する。
論文 参考訳(メタデータ) (2020-03-25T09:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。