論文の概要: LSTM Hyper-Parameter Selection for Malware Detection: Interaction
Effects and Hierarchical Selection Approach
- arxiv url: http://arxiv.org/abs/2109.11500v1
- Date: Thu, 23 Sep 2021 17:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-24 14:47:04.116231
- Title: LSTM Hyper-Parameter Selection for Malware Detection: Interaction
Effects and Hierarchical Selection Approach
- Title(参考訳): マルウェア検出のためのLSTMハイパーパラメータ選択:相互作用効果と階層的選択アプローチ
- Authors: Mohit Sewak, Sanjay K. Sahay, Hemant Rathore
- Abstract要約: Long-Short-Term-Memory (LSTM)ネットワークは人工知能(AI)ベースの言語モデリングにおいて大きな可能性を秘めている。
LSTMネットワークはAIベースの侵入検知システム(IDS)の設計にも人気がある。
- 参考スコア(独自算出の注目度): 2.4493299476776778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-Short-Term-Memory (LSTM) networks have shown great promise in artificial
intelligence (AI) based language modeling. Recently, LSTM networks have also
become popular for designing AI-based Intrusion Detection Systems (IDS).
However, its applicability in IDS is studied largely in the default settings as
used in language models. Whereas security applications offer distinct
conditions and hence warrant careful consideration while applying such
recurrent networks. Therefore, we conducted one of the most exhaustive works on
LSTM hyper-parameters for IDS and experimented with approx. 150 LSTM
configurations to determine its hyper-parameters relative importance,
interaction effects, and optimal selection approach for designing an IDS. We
conducted multiple analyses of the results of these experiments and empirically
controlled for the interaction effects of different hyper-parameters covariate
levels. We found that for security applications, especially for designing an
IDS, neither similar relative importance as applicable to language models is
valid, nor is the standard linear method for hyper-parameter selection ideal.
We ascertained that the interaction effect plays a crucial role in determining
the relative importance of hyper-parameters. We also discovered that after
controlling for the interaction effect, the correct relative importance for
LSTMs for an IDS is batch-size, followed by dropout ratio and padding. The
findings are significant because when LSTM was first used for language models,
the focus had mostly been on increasing the number of layers to enhance
performance.
- Abstract(参考訳): Long-Short-Term-Memory (LSTM)ネットワークは人工知能(AI)ベースの言語モデリングにおいて大きな可能性を秘めている。
近年、LSTMネットワークはAIベースの侵入検知システム(IDS)の設計にも人気がある。
しかし、IDSにおける適用性は、言語モデルで使用されるデフォルト設定で主に研究されている。
セキュリティアプリケーションは異なる条件を提供するため、このような再帰的なネットワークを適用する際に慎重に考慮する必要がある。
IDS用LSTMハイパーパラメータにおいて,最も徹底的な研究の1つを行い,近似実験を行った。
150 lstm構成 ハイパーパラメータの相対的重要性、相互作用効果、およびids設計のための最適選択アプローチを決定する。
これらの実験の結果を複数回分析し、異なるハイパーパラメーター共変量レベルの相互作用効果を実験的に制御した。
セキュリティアプリケーション,特にids設計においては,言語モデルに適用できるような相対的重要性は認められず,またハイパーパラメータ選択イデアルの標準的な線形手法であることも判明した。
我々は、相互作用効果がハイパーパラメーターの相対的重要性を決定する上で重要な役割を果たすことを確かめた。
また, 相互作用効果の制御後, IDSにおけるLSTMの相対的重要性はバッチサイズであり, その後はドロップアウト比とパディングが続いた。
LSTMが最初に言語モデルに使われたとき、主にパフォーマンスを高めるためにレイヤーの数を増やすことに焦点が当てられていたため、この発見は重要である。
関連論文リスト
- R+R:Understanding Hyperparameter Effects in DP-SGD [3.0668784884950235]
DP-SGDはプライバシー保護機械学習の標準的な最適化アルゴリズムである。
プライベートでない学習アプローチに比べて、パフォーマンスの低いアプローチでは、依然として一般的な課題である。
論文 参考訳(メタデータ) (2024-11-04T12:56:35Z) - Efficient Hyperparameter Importance Assessment for CNNs [1.7778609937758323]
本稿では,畳み込みニューラルネットワーク(CNN)におけるハイパーパラメータの重み付けを,N-RReliefFというアルゴリズムを用いて定量化する。
我々は10の人気のある画像分類データセットから1万以上のCNNモデルをトレーニングし、広範囲にわたる研究を行う。
論文 参考訳(メタデータ) (2024-10-11T15:47:46Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Interactive Hyperparameter Optimization in Multi-Objective Problems via
Preference Learning [65.51668094117802]
我々は多目的機械学習(ML)に適した人間中心型対話型HPO手法を提案する。
ユーザが自分のニーズに最も適した指標を推測する代わりに、私たちのアプローチは自動的に適切な指標を学習します。
論文 参考訳(メタデータ) (2023-09-07T09:22:05Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - LSTM based models stability in the context of Sentiment Analysis for
social media [0.0]
LSTMモデルとそのキーパラメータについて述べる。
感性分析の文脈でこれらのモデルの安定性をテストする実験を行う。
論文 参考訳(メタデータ) (2022-11-21T08:31:30Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Assessment of the Relative Importance of different hyper-parameters of
LSTM for an IDS [2.4493299476776778]
音声言語用に調整されたデフォルト設定のLSTMモデルは、マルウェアを検出するのにうまく機能しない可能性がある。
侵入検知システムを構成するLSTMネットワークは、隠蔽層数、入力シーケンス長、アクティベーション-ファンクションの選択に対して非常に敏感である。
論文 参考訳(メタデータ) (2020-12-26T18:00:37Z) - Modular Multi Target Tracking Using LSTM Networks [0.0]
本稿では,センサ計測を用いた航空機目標追尾システムに対する自由端対端手法を提案する。
提案したモジュールブロックは、多数のトラッキングアプリケーションで独立して訓練および使用することができる。
論文 参考訳(メタデータ) (2020-11-16T15:58:49Z) - An Asymptotically Optimal Multi-Armed Bandit Algorithm and
Hyperparameter Optimization [48.5614138038673]
本稿では,高パラメータ探索評価のシナリオにおいて,SS (Sub-Sampling) と呼ばれる効率的で堅牢な帯域幅に基づくアルゴリズムを提案する。
また,BOSSと呼ばれる新しいパラメータ最適化アルゴリズムを開発した。
実験的な研究は、SSの理論的議論を検証し、多くのアプリケーションにおけるBOSSの優れた性能を実証する。
論文 参考訳(メタデータ) (2020-07-11T03:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。