論文の概要: Advancing Email Spam Detection: Leveraging Zero-Shot Learning and Large Language Models
- arxiv url: http://arxiv.org/abs/2505.02362v1
- Date: Mon, 05 May 2025 04:48:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.56053
- Title: Advancing Email Spam Detection: Leveraging Zero-Shot Learning and Large Language Models
- Title(参考訳): メールスパム検出の強化:ゼロショット学習と大規模言語モデルを活用する
- Authors: Ghazaleh SHirvani, Saeid Ghasemshirazi,
- Abstract要約: 本研究では,メールスパム検出におけるFLAN-T5とBERTなどの高度自然言語処理(NLP)技術を用いたゼロショット学習の有効性について検討した。
提案手法は,従来のスパム検出システムの限界に対処することを目的としている。
FLAN-T5とBERTの統合により、広範なラベル付きデータセットや頻繁な再トレーニングに頼ることなく、堅牢なスパム検出が可能になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Email spam detection is a critical task in modern communication systems, essential for maintaining productivity, security, and user experience. Traditional machine learning and deep learning approaches, while effective in static settings, face significant limitations in adapting to evolving spam tactics, addressing class imbalance, and managing data scarcity. These challenges necessitate innovative approaches that reduce dependency on extensive labeled datasets and frequent retraining. This study investigates the effectiveness of Zero-Shot Learning using FLAN-T5, combined with advanced Natural Language Processing (NLP) techniques such as BERT for email spam detection. By employing BERT to preprocess and extract critical information from email content, and FLAN-T5 to classify emails in a Zero-Shot framework, the proposed approach aims to address the limitations of traditional spam detection systems. The integration of FLAN-T5 and BERT enables robust spam detection without relying on extensive labeled datasets or frequent retraining, making it highly adaptable to unseen spam patterns and adversarial environments. This research highlights the potential of leveraging zero-shot learning and NLPs for scalable and efficient spam detection, providing insights into their capability to address the dynamic and challenging nature of spam detection tasks.
- Abstract(参考訳): 電子メールによるスパム検出は、現代のコミュニケーションシステムにおいて重要な課題であり、生産性、セキュリティ、ユーザエクスペリエンスの維持に不可欠である。
従来の機械学習とディープラーニングのアプローチは、静的な設定では有効だが、スパム戦術の進化、クラスの不均衡への対処、データの不足管理において、重大な制限に直面している。
これらの課題は、広範なラベル付きデータセットへの依存を減らし、頻繁な再トレーニングを行う革新的なアプローチを必要とする。
本研究では,FLAN-T5を用いたゼロショット学習と,メールスパム検出のためのBERTなどの高度な自然言語処理(NLP)技術の組み合わせを検討した。
BERTを用いてメールコンテンツから重要な情報を前処理し抽出し、FLAN-T5でZero-Shotフレームワークで電子メールを分類することにより、従来のスパム検出システムの限界に対処する。
FLAN-T5とBERTの統合により、広範なラベル付きデータセットや頻繁な再トレーニングに頼ることなく、堅牢なスパム検出が可能になる。
この研究は、ゼロショット学習とNLPをスケーラブルで効率的なスパム検出に活用する可能性を強調し、スパム検出タスクの動的で挑戦的な性質に対処する能力についての洞察を提供する。
関連論文リスト
- An Investigation of Large Language Models and Their Vulnerabilities in Spam Detection [7.550686419077825]
本稿では,スパムデータセットを微調整したLarge Language Models(LLM)を利用したスパム検出システムを提案する。
この実験には、GPT2とBERTの2つのLLMモデルと、Enron、LingSpam、SMSspamCollectionの3つのスパムデータセットが使用されている。
その結果, LLMモデルは, 効果的なスパムフィルタとして機能するが, 敵対的・データ中毒攻撃の影響を受けやすいことがわかった。
論文 参考訳(メタデータ) (2025-04-14T00:30:27Z) - SpaLLM-Guard: Pairing SMS Spam Detection Using Open-source and Commercial LLMs [1.3198171962008958]
我々は,SMSスパム検出における大規模言語モデル (LLM) の可能性を評価する。
ゼロショット、少数ショット、微調整、チェーン・オブ・プルーピングのアプローチでパフォーマンスを比較します。
ファインチューニングは最も効果的な戦略として現れ、Mixtralの精度は98.6%、偽陽性と偽陰性率は2%以下である。
論文 参考訳(メタデータ) (2025-01-09T06:00:08Z) - Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.03511469562013]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文 参考訳(メタデータ) (2024-07-25T07:09:35Z) - Evaluating the Performance of ChatGPT for Spam Email Detection [15.690834818368929]
本研究は,ChatGPTの英語および中国語のメールデータセットにおけるスパム識別能力を評価することを目的とする。
In-context Learning を用いたスパムメール検出にはChatGPT を用いる。
また,実演回数がChatGPTの性能に与える影響についても検討した。
論文 参考訳(メタデータ) (2024-02-23T04:52:08Z) - DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - CosSGD: Nonlinear Quantization for Communication-efficient Federated
Learning [62.65937719264881]
フェデレーション学習は、これらのクライアントのローカルデータを中央サーバに転送することなく、クライアント間での学習を促進する。
圧縮勾配降下のための非線形量子化を提案し、フェデレーションラーニングで容易に利用することができる。
本システムは,訓練過程の収束と精度を維持しつつ,通信コストを最大3桁まで削減する。
論文 参考訳(メタデータ) (2020-12-15T12:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。