論文の概要: Deep Learning based Frameworks for Handling Imbalance in DGA, Email, and
URL Data Analysis
- arxiv url: http://arxiv.org/abs/2004.04812v2
- Date: Sat, 17 Oct 2020 08:12:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:12:57.537957
- Title: Deep Learning based Frameworks for Handling Imbalance in DGA, Email, and
URL Data Analysis
- Title(参考訳): dga、eメール、urlデータ分析における不均衡を扱うディープラーニングベースのフレームワーク
- Authors: Simran K, Prathiksha Balakrishna, Vinayakumar Ravi, Soman KP
- Abstract要約: 本稿では,コストに敏感なディープラーニングに基づくフレームワークを提案し,フレームワークの性能評価を行う。
コスト非感受性およびコスト非感受性法を用いて様々な実験を行った。
すべての実験において、コストに敏感なディープラーニング手法はコストに敏感なアプローチよりも優れている。
- 参考スコア(独自算出の注目度): 2.2901908285413413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning is a state of the art method for a lot of applications. The
main issue is that most of the real-time data is highly imbalanced in nature.
In order to avoid bias in training, cost-sensitive approach can be used. In
this paper, we propose cost-sensitive deep learning based frameworks and the
performance of the frameworks is evaluated on three different Cyber Security
use cases which are Domain Generation Algorithm (DGA), Electronic mail (Email),
and Uniform Resource Locator (URL). Various experiments were performed using
cost-insensitive as well as cost-sensitive methods and parameters for both of
these methods are set based on hyperparameter tuning. In all experiments, the
cost-sensitive deep learning methods performed better than the cost-insensitive
approaches. This is mainly due to the reason that cost-sensitive approach gives
importance to the classes which have a very less number of samples during
training and this helps to learn all the classes in a more efficient manner.
- Abstract(参考訳): ディープラーニングは、多くのアプリケーションのための最先端の手法です。
主な問題は、リアルタイムデータのほとんどが本質的に非常に不均衡であることだ。
トレーニングのバイアスを避けるために、コストに敏感なアプローチが用いられる。
本稿では、コストに敏感なディープラーニングフレームワークを提案し、ドメイン生成アルゴリズム(dga)、電子メール(email)、統一リソースロケータ(url)の3つの異なるサイバーセキュリティユースケースにおいて、フレームワークの性能を評価する。
コストに敏感な手法とコストに敏感な手法を用いて様々な実験を行い、これらの方法のパラメータはハイパーパラメータチューニングに基づいて設定される。
すべての実験において、コストに敏感なディープラーニング手法はコストに敏感なアプローチよりも優れている。
これは主に、コストに敏感なアプローチがトレーニング中にサンプルの数が非常に少ないクラスに重要になるためであり、より効率的な方法ですべてのクラスを学ぶのに役立ちます。
関連論文リスト
- Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.22819290458581]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。
提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文 参考訳(メタデータ) (2024-07-02T10:09:19Z) - Provably Robust Cost-Sensitive Learning via Randomized Smoothing [21.698527267902158]
我々は、ロバストネス認定のためのスケーラブルなフレームワークであるランダム化スムーシングが、コスト感受性のロバストネスの認定とトレーニングに活用できるかどうかを検討する。
まず、ランダム化スムージングの標準的な認証アルゴリズムを適用して、任意のバイナリコスト行列に対して厳密な堅牢性証明を生成する方法について説明する。
そこで我々は,モデル全体の精度を維持しつつ,信頼性の高いコスト感受性を向上するためのロバストなトレーニング手法を開発した。
論文 参考訳(メタデータ) (2023-10-12T21:39:16Z) - Efficient Methods for Non-stationary Online Learning [67.3300478545554]
本稿では, 動的後悔と適応的後悔を最適化する効率的な手法を提案し, ラウンド当たりの投影回数を$mathcalO(log T)$から$ $1$まで削減した。
本手法は,パラメータフリーオンライン学習において開発された還元機構を基礎として,非定常オンライン手法に非自明なツイストを必要とする。
論文 参考訳(メタデータ) (2023-09-16T07:30:12Z) - Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。
私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。
これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文 参考訳(メタデータ) (2023-02-06T17:30:22Z) - Cost-Sensitive Stacking: an Empirical Evaluation [3.867363075280544]
コスト感受性学習は、誤分類コストの違いを考慮に入れた分類アルゴリズムに適応する。
コストに敏感なスタックとは何か、という文献には意見の一致がない。
実験は12のデータセットを用いて行われ、最高の性能を得るためには、どちらのレベルの積み重ねもコストに敏感な分類決定を必要とすることを示した。
論文 参考訳(メタデータ) (2023-01-04T18:28:07Z) - Online Active Learning for Soft Sensor Development using Semi-Supervised
Autoencoders [0.7734726150561089]
データ駆動型ソフトセンサーは、産業や化学プロセスにおいて、ハード・トゥ・計測プロセスの変数を予測するために広く使われている。
アクティブな学習方法は、クエリに最も有意義なラベルを提案することができるため、非常に有益である。
本研究では,これらのアプローチのいくつかをストリームベースのシナリオに適用し,最も情報に富むデータポイントの選択にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2022-12-26T09:45:41Z) - Robust Few-shot Learning Without Using any Adversarial Samples [19.34427461937382]
高度なメタラーニング技術を用いて、数発の問題をロバストネスの目的と組み合わせる試みがいくつかなされている。
逆のサンプルを一切必要としない単純で効果的な代替案を提案する。
ヒトの認知的意思決定プロセスにインスパイアされ、ベースクラスデータとそれに対応する低周波サンプルの高レベル特徴マッチングを強制する。
論文 参考訳(メタデータ) (2022-11-03T05:58:26Z) - Rethinking Cost-sensitive Classification in Deep Learning via
Adversarial Data Augmentation [4.479834103607382]
コストに敏感な分類は、誤分類エラーがコストで大きく異なるアプリケーションにおいて重要である。
本稿では,過度パラメータ化モデルにコスト感受性を持たせるために,コスト依存型逆データ拡張フレームワークを提案する。
提案手法は,全体のコストを効果的に最小化し,臨界誤差を低減するとともに,全体的な精度で同等の性能を達成できる。
論文 参考訳(メタデータ) (2022-08-24T19:00:30Z) - An Experimental Design Perspective on Model-Based Reinforcement Learning [73.37942845983417]
環境からの状態遷移を観察するのは費用がかかる。
標準RLアルゴリズムは通常、学習するために多くの観測を必要とする。
本稿では,マルコフ決定過程について,状態-作用対がどの程度の情報を提供するかを定量化する獲得関数を提案する。
論文 参考訳(メタデータ) (2021-12-09T23:13:57Z) - A Simple Fine-tuning Is All You Need: Towards Robust Deep Learning Via
Adversarial Fine-tuning [90.44219200633286]
我々は,$textitslow start, fast decay$ learning rate schedulingストラテジーに基づく,単純かつ非常に効果的な敵の微調整手法を提案する。
実験の結果,提案手法はCIFAR-10, CIFAR-100, ImageNetデータセットの最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-25T20:50:15Z) - An Online Method for A Class of Distributionally Robust Optimization
with Non-Convex Objectives [54.29001037565384]
本稿では,オンライン分散ロバスト最適化(DRO)のクラスを解決するための実用的なオンライン手法を提案する。
本研究は,ネットワークの堅牢性向上のための機械学習における重要な応用を実証する。
論文 参考訳(メタデータ) (2020-06-17T20:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。