論文の概要: Classification of Spam URLs Using Machine Learning Approaches
- arxiv url: http://arxiv.org/abs/2310.05953v1
- Date: Sun, 10 Sep 2023 16:15:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:53:43.328269
- Title: Classification of Spam URLs Using Machine Learning Approaches
- Title(参考訳): 機械学習を用いたスパムURLの分類
- Authors: Omar Husni Odeh, Anas Arram, and Murad Njoum
- Abstract要約: 本研究では、機械学習モデルを用いて、URLをスパムやノンスパムとして分類する。
我々は、バッグングが96.5%の精度で最高の精度を達成することを発見した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Internet is used by billions of users daily because it offers fast and
free communication tools and platforms. Nevertheless, with this significant
increase in usage, huge amounts of spam are generated every second, which
wastes internet resources and, more importantly, users time. This study
investigates using machine learning models to classify URLs as spam or
non-spam. We first extract the features from the URL as it has only one
feature, and then we compare the performance of several models, including
k-nearest neighbors, bagging, random forest, logistic regression, and others.
We find that bagging achieves the best accuracy, with an accuracy of 96.5%.
This suggests that bagging is a promising approach for classifying URLs as spam
or nonspam.
- Abstract(参考訳): インターネットは、高速で無料のコミュニケーションツールとプラットフォームを提供するため、毎日何十億ものユーザーが使っている。
それにもかかわらず、この使用量が大幅に増加すると、大量のスパムが毎秒発生し、インターネットリソースを浪費し、さらに重要なのはユーザ時間だ。
本研究では,機械学習モデルを用いてurlをスパムまたは非スパムとして分類する。
まず、1つの機能しか持たないurlから特徴を抽出する。次に、k-nearestの隣人、袋詰め、ランダムフォレスト、ロジスティック回帰など、いくつかのモデルのパフォーマンスを比較する。
我々は、バッグングが96.5%の精度で最高の精度を達成することを発見した。
これは、urlをスパムまたはノンスパムに分類する有望なアプローチであることを示唆している。
関連論文リスト
- URLBERT:A Contrastive and Adversarial Pre-trained Model for URL
Classification [10.562100395816595]
URLはWebコンテンツの理解と分類において重要な役割を果たす。
本稿では,URL分類や検出タスクに適用された最初の事前学習型表現学習モデルであるURLBERTを紹介する。
論文 参考訳(メタデータ) (2024-02-18T07:51:20Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - An Adversarial Attack Analysis on Malicious Advertisement URL Detection
Framework [22.259444589459513]
悪意のある広告URLは、サイバー攻撃の源泉であるため、セキュリティ上のリスクをもたらす。
既存の悪意のあるURL検出技術は制限されており、見えない機能やテストデータの一般化を扱うことができる。
本研究では,新しい語彙・ウェブスクラップ機能群を抽出し,機械学習技術を用いて不正広告URL検出システムを構築する。
論文 参考訳(メタデータ) (2022-04-27T20:06:22Z) - Classification of URL bitstreams using Bag of Bytes [3.2204506933585026]
本稿では,URL文字列から特徴ベクトルを生成するための機械的手法を適用する。
従来のDL法に比べて精度が23%向上した。
論文 参考訳(メタデータ) (2021-11-11T07:43:45Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Learning to Perform Downlink Channel Estimation in Massive MIMO Systems [72.76968022465469]
大規模マルチインプット・マルチアウトプット(MIMO)システムにおけるダウンリンク(DL)チャネル推定について検討する。
一般的なアプローチは、チャネル硬化によって動機付けられた推定値として平均値を使用することである。
本稿では2つの新しい推定法を提案する。
論文 参考訳(メタデータ) (2021-09-06T13:42:32Z) - Twitter Spam Detection: A Systematic Review [4.348112720799065]
本稿では,Twitterのスパム検出に関する既存の研究手法を体系的に比較することに焦点を当てる。
既存の手法のほとんどは機械学習ベースのアルゴリズムに依存している。
本稿では,コンテンツ分析,ユーザ分析,つぶやき分析,ネットワーク解析,ハイブリッド分析など,さまざまな特徴選択手法と分析に基づく分類法を提案する。
論文 参考訳(メタデータ) (2020-11-30T13:10:24Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z) - Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。
提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文 参考訳(メタデータ) (2020-06-10T21:18:07Z) - Phishing URL Detection Through Top-level Domain Analysis: A Descriptive
Approach [3.494620587853103]
本研究では,Splunkプラットフォーム内で使用可能な不正なURLを検出する機械学習モデルを開発することを目的とする。
文学における同様のアプローチから着想を得た私たちは、悪意のあるデータセットと良心的なデータセットを使用して、SVMとランダムフォレストアルゴリズムを訓練しました。
我々はアルゴリズムの性能を精度とリコールで評価し,ランダムフォレストの場合,最大85%の精度と87%のリコールを達成した。
論文 参考訳(メタデータ) (2020-05-13T21:41:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。