論文の概要: Efficient Detection of Botnet Traffic by features selection and Decision
Trees
- arxiv url: http://arxiv.org/abs/2107.02896v1
- Date: Wed, 30 Jun 2021 11:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-11 12:17:16.080254
- Title: Efficient Detection of Botnet Traffic by features selection and Decision
Trees
- Title(参考訳): 特徴選択と決定木によるボットネットトラフィックの効率的な検出
- Authors: Javier Velasco-Mata, V\'ictor Gonz\'alez-Castro, Eduardo Fidalgo,
Enrique Alegre
- Abstract要約: ボットネットは最大の存在感を持つオンラインの脅威の1つであり、世界の経済に億万長者の損失をもたらしている。
本研究では,ボットネットのトラフィック分類における性能向上に焦点をあてて,検出率をさらに向上させる特徴を選択する。
- 参考スコア(独自算出の注目度): 4.932130498861987
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Botnets are one of the online threats with the biggest presence, causing
billionaire losses to global economies. Nowadays, the increasing number of
devices connected to the Internet makes it necessary to analyze large amounts
of network traffic data. In this work, we focus on increasing the performance
on botnet traffic classification by selecting those features that further
increase the detection rate. For this purpose we use two feature selection
techniques, Information Gain and Gini Importance, which led to three
pre-selected subsets of five, six and seven features. Then, we evaluate the
three feature subsets along with three models, Decision Tree, Random Forest and
k-Nearest Neighbors. To test the performance of the three feature vectors and
the three models we generate two datasets based on the CTU-13 dataset, namely
QB-CTU13 and EQB-CTU13. We measure the performance as the macro averaged F1
score over the computational time required to classify a sample. The results
show that the highest performance is achieved by Decision Trees using a five
feature set which obtained a mean F1 score of 85% classifying each sample in an
average time of 0.78 microseconds.
- Abstract(参考訳): ボットネットは最大の存在感を持つオンラインの脅威の一つであり、世界経済に億万長者の損失をもたらしている。
近年,インターネットに接続されるデバイスが増えているため,大量のネットワークトラフィックデータを解析する必要がある。
本研究では,ボットネットのトラフィック分類における性能向上に着目し,検出率をさらに向上させる特徴を選択する。
この目的のために、情報ゲインとgini重要度という2つの機能選択技術を使い、5つ、6つ、7つの機能を事前に選択した3つのサブセットに導いた。
次に,3つの特徴部分集合と,決定木,ランダムフォレスト,k-Nearest Neighborsの3つのモデルを評価する。
3つの特徴ベクトルと3つのモデルの性能をテストするために、CTU-13データセット、すなわちQB-CTU13とEQB-CTU13に基づいて2つのデータセットを生成する。
サンプルの分類に必要な計算時間に対してマクロ平均f1スコアとして性能を測定する。
その結果, 平均F1スコアが85%, 平均0.78マイクロ秒, 平均F1スコアが得られた5つの特徴集合を用いて, 決定木が最も高い性能を示した。
関連論文リスト
- Entanglement Classification of Arbitrary Three-Qubit States via Artificial Neural Networks [2.715284063484557]
3ビットシステムの絡みを検知・分類する人工知能ニューラルネットワーク(ANN)を設計・実装する。
モデルはランダムに生成された状態のシミュレーションデータセット上で訓練され、検証される。
注目すべきは、密度行列の7つの対角要素をANNに供給するだけで、両方のタスクに対して94%以上の精度が得られることである。
論文 参考訳(メタデータ) (2024-11-18T06:50:10Z) - Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level [73.14232472724758]
我々は、エンドツーエンドの自律データサイエンスエージェントであるAgent K v1.0を紹介する。
経験から学ぶことによって、データサイエンスのライフサイクル全体を管理する。
キー情報を選択的に保存して検索することで、長期記憶と短期記憶を最適化する。
論文 参考訳(メタデータ) (2024-11-05T23:55:23Z) - Improving ICD coding using Chapter based Named Entities and Attentional Models [0.0]
我々は、章ベースの名前付きエンティティと注意モデルを用いて、F1スコアを改善するICD符号化の強化アプローチを導入する。
本手法は, 放電サマリーをICD-9章に分類し, 章別データを用いた注意モデルを開発する。
分類には第IV章を使用し、ニューラルネットワークを使わずに重要な要素や重みをデバイアスし、影響を及ぼす。
論文 参考訳(メタデータ) (2024-07-24T12:34:23Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Dual skip connections in U-Net, ResUnet and U-Net3+ for remote
extraction of buildings [0.0]
U-Netなどのセマンティックセグメンテーションネットワークを用いた高分解能地球観測(EO)画像から都市建物を抽出する。
それぞれの再イテレーションは、オブジェクトマッピングの精度を高めるために、マルチスケールの機能を利用する、より高密度なスキップ接続機構を利用することで、パフォーマンスを向上させることを目的としている。
我々は,3つのネットワーク(U-Net,ResUnet,U-Net3+)に対して,本質的な特徴マップを選択的に深化して性能向上を図るための3つの二重スキップ接続機構を開発した。
論文 参考訳(メタデータ) (2023-03-16T03:44:33Z) - A Hierarchical Terminal Recognition Approach based on Network Traffic
Analysis [0.48298211429517085]
本稿では,グリッドデータの詳細を適用した階層型端末認識手法を提案する。
我々はグリッドデータをセグメント化して2段階のモデル構造を構築した。
特徴の選定と再構築により、3つのアルゴリズムを組み合わせて端末の型を正確に識別する。
論文 参考訳(メタデータ) (2022-04-16T05:33:01Z) - M3DeTR: Multi-representation, Multi-scale, Mutual-relation 3D Object
Detection with Transformers [78.48081972698888]
M3DeTRは、マルチスケールのフィーチャーピラミッドに基づいて、異なるポイントクラウド表現と異なる機能スケールを組み合わせたものです。
M3DeTRは、複数のポイントクラウド表現、機能スケール、およびトランスを使用してポイントクラウド間の相互関係を同時にモデル化する最初のアプローチです。
論文 参考訳(メタデータ) (2021-04-24T06:48:23Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - A benchmark of data stream classification for human activity recognition
on connected objects [0.0]
通常の5つのストリーム分類アルゴリズムの分類性能と資源消費の両面を計測する。
その結果,HT,MF,NB分類器のFNNおよびMCNNに対する総合的な優位性を示した。
我々は、接続オブジェクト上のHARのストリーム学習は、興味深い将来の作業につながる可能性のある2つの要因によって挑戦されていると結論付けている。
論文 参考訳(メタデータ) (2020-08-27T01:42:07Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。