論文の概要: Training a quantum annealing based restricted Boltzmann machine on
cybersecurity data
- arxiv url: http://arxiv.org/abs/2011.13996v4
- Date: Fri, 16 Apr 2021 10:23:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 14:21:54.487297
- Title: Training a quantum annealing based restricted Boltzmann machine on
cybersecurity data
- Title(参考訳): サイバーセキュリティデータに基づく量子アニールに基づく制限ボルツマンマシンのトレーニング
- Authors: Vivek Dixit, Raja Selvarajan, Tamer Aldwairi, Yaroslav Koshka, Mark A.
Novotny, Travis S. Humble, Muhammad A. Alam and Sabre Kais
- Abstract要約: 量子コンピュータを用いた実世界のアプリケーションを提案する。
具体的には、サイバーセキュリティアプリケーションにQAを用いてRBMをトレーニングする。
QAとCDで訓練したRBMの両方が有用な合成データを生成することができることを示す。
- 参考スコア(独自算出の注目度): 0.23453441553817037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a real-world application that uses a quantum computer.
Specifically, we train a RBM using QA for cybersecurity applications. The
D-Wave 2000Q has been used to implement QA. RBMs are trained on the ISCX data,
which is a benchmark dataset for cybersecurity. For comparison, RBMs are also
trained using CD. CD is a commonly used method for RBM training. Our analysis
of the ISCX data shows that the dataset is imbalanced. We present two different
schemes to balance the training dataset before feeding it to a classifier. The
first scheme is based on the undersampling of benign instances. The imbalanced
training dataset is divided into five sub-datasets that are trained separately.
A majority voting is then performed to get the result. Our results show the
majority vote increases the classification accuracy up from 90.24% to 95.68%,
in the case of CD. For the case of QA, the classification accuracy increases
from 74.14% to 80.04%. In the second scheme, a RBM is used to generate
synthetic data to balance the training dataset. We show that both QA and
CD-trained RBM can be used to generate useful synthetic data. Balanced training
data is used to evaluate several classifiers. Among the classifiers
investigated, K-Nearest Neighbor (KNN) and Neural Network (NN) perform better
than other classifiers. They both show an accuracy of 93%. Our results show a
proof-of-concept that a QA-based RBM can be trained on a 64-bit binary dataset.
The illustrative example suggests the possibility to migrate many practical
classification problems to QA-based techniques. Further, we show that synthetic
data generated from a RBM can be used to balance the original dataset.
- Abstract(参考訳): 量子コンピュータを用いた実世界のアプリケーションを提案する。
具体的には、サイバーセキュリティアプリケーションにQAを用いてRBMをトレーニングする。
D-Wave 2000QはQAの実装に使われている。
RBMは、サイバーセキュリティのベンチマークデータセットであるISCXデータに基づいてトレーニングされている。
比較として、RBMはCDを用いて訓練される。
CDは、RBMトレーニングの一般的な方法である。
ISCXデータの解析は,データセットが不均衡であることを示している。
分類器に入力する前にトレーニングデータセットのバランスをとるための2つの異なるスキームを提案する。
最初のスキームは良性インスタンスのアンダーサンプリングに基づいている。
不均衡なトレーニングデータセットは、個別にトレーニングされる5つのサブデータセットに分割される。
結果を得るために過半数の投票が行われる。
以上の結果から,CDの分類精度は90.24%から95.68%に向上した。
QAの場合、分類精度は74.14%から80.04%に向上する。
第2のスキームでは、rbmを使用して、トレーニングデータセットのバランスをとる合成データを生成する。
QAとCDで訓練したRBMの両方が有用な合成データを生成することができることを示す。
バランスの取れたトレーニングデータは、いくつかの分類器を評価するために使用される。
k-nearest neighbor (knn) とニューラルネットワーク (nn) は他の分類器よりも優れた性能を示す。
両者とも93%の精度を示している。
以上の結果から,64ビットバイナリデータセット上でQAベースのRBMをトレーニングできることが示唆された。
図示的な例は、多くの実践的な分類問題をQAベースの技術に移行する可能性を示唆している。
さらに、rbmから生成された合成データを元のデータセットのバランスに利用できることを示す。
関連論文リスト
- What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Training on the Benchmark Is Not All You Need [52.01920740114261]
本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,ブラックボックス条件下で動作することができる。
我々は,4つのベンチマークデータセットを用いて,31個の主要なオープンソースLCMのデータ漏洩の程度を評価する。
論文 参考訳(メタデータ) (2024-09-03T11:09:44Z) - Data-Free Generative Replay for Class-Incremental Learning on Imbalanced Data [0.7366405857677227]
連続的な学習は、特に不均衡なデータセットを持つ画像分類タスクにおいて、機械学習において難しい問題である。
本稿では、実データにアクセスせずに生成者を訓練するクラスインクリメンタルラーニングのためのData-Free Generative Replay(DFGR)を提案する。
DFGRはMNISTデータセットとFashionMNISTデータセットでそれぞれ88.5%と46.6%の精度を達成している。
論文 参考訳(メタデータ) (2024-06-07T17:51:27Z) - Task-Aware Machine Unlearning and Its Application in Load Forecasting [4.00606516946677]
本稿では、すでに訓練済みの予測器に対するデータセットの一部の影響を除去するために特別に設計された機械学習の概念を紹介する。
局所モデルパラメータ変化の感度を影響関数とサンプル再重み付けを用いて評価することにより,性能認識アルゴリズムを提案する。
リアルな負荷データセットを用いて,線形,CNN,Mixerベースの負荷予測器上で,未学習アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-08-28T08:50:12Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z) - Knockoffs-SPR: Clean Sample Selection in Learning with Noisy Labels [56.81761908354718]
雑音ラベルを用いた学習のための,理論的に保証されたクリーンサンプル選択フレームワークを提案する。
Knockoffs-SPRは、標準的な教師付きトレーニングパイプラインのサンプル選択モジュールと見なすことができる。
さらに、ラベルなしデータとしてノイズデータのサポートを利用する半教師付きアルゴリズムと組み合わせる。
論文 参考訳(メタデータ) (2023-01-02T07:13:28Z) - Learning brain MRI quality control: a multi-factorial generalization
problem [0.0]
本研究の目的は,MRIQCパイプラインの性能評価である。
分析はMRIQCの前処理ステップに焦点を合わせ、パイプラインをそれなしでテストした。
我々は、CATIデータセットのような異種集団のデータで訓練されたモデルが、目に見えないデータの最良のスコアを提供すると結論付けた。
論文 参考訳(メタデータ) (2022-05-31T15:46:44Z) - IADA: Iterative Adversarial Data Augmentation Using Formal Verification
and Expert Guidance [1.599072005190786]
本稿では,ニューラルネットワークモデルを学習するための反復的逆データ拡張フレームワークを提案する。
提案するフレームワークは,人工的な2Dデータセット,MNISTデータセット,人間の動作データセットに適用される。
学習モデルのロバスト性や精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2021-08-16T03:05:53Z) - Meta-Mining Discriminative Samples for Kinship Verification [95.26341773545528]
kinship検証データベースは、アンバランスなデータで生まれます。
本稿では, 識別的サンプルメタマイニング(DSMM)手法を提案する。
KinFaceW-I, KinFaceW-II, TSKinFace, Cornell Kinshipデータセットを用いた実験結果から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-03-28T11:47:07Z) - Training and Classification using a Restricted Boltzmann Machine on the
D-Wave 2000Q [0.2609784101826761]
制限ボルツマンマシンの勾配学習のモデル予測を量子アニールを用いて計算した。
量子アニール器から得られた試料は、CDで訓練されたRBMに似た分類性能で64ビットのバーとストライプのデータセットでRBMをトレーニングするために使用できる。
論文 参考訳(メタデータ) (2020-05-07T04:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。