論文の概要: Jasmine: A New Active Learning Approach to Combat Cybercrime
- arxiv url: http://arxiv.org/abs/2108.06238v1
- Date: Fri, 13 Aug 2021 13:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 13:00:48.572180
- Title: Jasmine: A New Active Learning Approach to Combat Cybercrime
- Title(参考訳): Jasmine: サイバー犯罪に対する新たなアクティブな学習アプローチ
- Authors: Jan Klein, Sandjai Bhulai, Mark Hoogendoorn, Rob van der Mei
- Abstract要約: 本稿では,Jasmineというハイブリッドな能動学習手法を提案する。
これは、各観測がクエリーにどの程度適しているか、すなわち、クラスi?cationを強化するのがどれくらいの確率かを決定する。
Jasmineは、不確実性のみを問うことや、異常や修正された2つの組み合わせだけを問うことよりも、常に良い、より堅牢な結果を得ることができることを示す。
- 参考スコア(独自算出の注目度): 4.189344860951592
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Over the past decade, the advent of cybercrime has accelarated the research
on cybersecurity. However, the deployment of intrusion detection methods falls
short. One of the reasons for this is the lack of realistic evaluation
datasets, which makes it a challenge to develop techniques and compare them.
This is caused by the large amounts of effort it takes for a cyber analyst to
classify network connections. This has raised the need for methods (i) that can
learn from small sets of labeled data, (ii) that can make predictions on large
sets of unlabeled data, and (iii) that request the label of only specially
selected unlabeled data instances. Hence, Active Learning (AL) methods are of
interest. These approaches choose speci?fic unlabeled instances by a query
function that are expected to improve overall classi?cation performance. The
resulting query observations are labeled by a human expert and added to the
labeled set.
In this paper, we propose a new hybrid AL method called Jasmine. Firstly, it
determines how suitable each observation is for querying, i.e., how likely it
is to enhance classi?cation. These properties are the uncertainty score and
anomaly score. Secondly, Jasmine introduces dynamic updating. This allows the
model to adjust the balance between querying uncertain, anomalous and randomly
selected observations. To this end, Jasmine is able to learn the best query
strategy during the labeling process. This is in contrast to the other AL
methods in cybersecurity that all have static, predetermined query functions.
We show that dynamic updating, and therefore Jasmine, is able to consistently
obtain good and more robust results than querying only uncertainties, only
anomalies or a ?fixed combination of the two.
- Abstract(参考訳): 過去10年間、サイバー犯罪の出現はサイバーセキュリティの研究を称賛してきた。
しかし,侵入検知手法の展開は短命である。
この理由の1つは、現実的な評価データセットが欠如していることにある。
これは、サイバーアナリストがネットワーク接続を分類するのに要する膨大な労力によって引き起こされる。
これにより、(i)ラベル付きデータの小さなセットから学習できるメソッド、(ii)ラベルなしデータの大規模なセットを予測できるメソッド、(iii)特別に選択されたラベルなしデータインスタンスのみのラベルを要求するメソッドの必要性が高まった。
したがって、アクティブラーニング(AL)手法は興味深い。
これらのアプローチでは、クエリ関数によってspeci?fic unlabeledインスタンスを選択し、全体的なclassi?cationパフォーマンスを改善することが期待されている。
結果のクエリ観察は、人間の専門家によってラベル付けされ、ラベル付きセットに追加される。
本稿では,Jasmineと呼ばれるハイブリッドAL手法を提案する。
まず、各観測値がクエリにどの程度適しているか、すなわち、クラスi?cationを向上する確率を決定する。
これらの特性は不確実性スコアと異常スコアである。
次に、Jasmineは動的更新を導入した。
これにより、モデルが不確かで異常でランダムに選択された観測のバランスを調整することができる。
この目的のためにJasmineは、ラベル付けプロセスで最高のクエリ戦略を学ぶことができる。
これは、すべて静的で所定のクエリ機能を持つサイバーセキュリティにおける他のALメソッドとは対照的である。
動的更新,すなわちJasmineは,不確実性のみを問合せする,異常や修正された組み合わせのみを問合せするよりも,良質で堅牢な結果が得られることを示す。
関連論文リスト
- Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。
本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。
本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-22T16:25:41Z) - Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Learnability Gaps of Strategic Classification [68.726857356532]
我々は,戦略的分類と標準学習の間にある学習可能性のギャップという,根本的な問題に対処することに注力する。
ほぼ厳密なサンプルの複雑さと後悔の限界を提供し、以前の結果よりも大幅に改善します。
この設定における我々のアルゴリズムは、独立して興味を持ち、マルチラベル学習のような他の問題にも適用できる。
論文 参考訳(メタデータ) (2024-02-29T16:09:19Z) - Overcoming Overconfidence for Active Learning [1.2776312584227847]
本稿では,アクティブな学習シナリオで発生する過信の問題に対処する2つの新しい手法を提案する。
1つ目はCross-Mix-and-Mix(CMaM)と呼ばれる拡張戦略で、限られたトレーニング分布を拡張してモデルを校正することを目的としている。
2つ目は Ranked Margin Sampling (RankedMS) という選択戦略である。
論文 参考訳(メタデータ) (2023-08-21T09:04:54Z) - Partial-Label Regression [54.74984751371617]
部分ラベル学習は、弱い教師付き学習環境であり、各トレーニング例に候補ラベルのセットをアノテートすることができる。
部分ラベル学習に関する従来の研究は、候補ラベルがすべて離散的な分類設定のみに焦点を当てていた。
本稿では,各トレーニング例に実値付き候補ラベルのセットをアノテートした部分ラベル回帰を初めて検討する。
論文 参考訳(メタデータ) (2023-06-15T09:02:24Z) - Uncertainty-based Network for Few-shot Image Classification [17.912365063048263]
相互情報の助けを借りて分類結果の不確実性をモデル化する不確実性ベースネットワークを提案する。
不確実性に基づくネットワークは,最先端手法と比較して,分類精度に匹敵する性能を示した。
論文 参考訳(メタデータ) (2022-05-17T07:49:32Z) - Online Selective Classification with Limited Feedback [82.68009460301585]
オンライン学習モデルにおいて、予測者がインスタンスの分類を控える可能性のある選択的分類について検討する。
私たちが考慮している設定の健全な2つの側面は、データが不可避である可能性があるため、データは不可避である可能性があるということです。
smash$tildeO(T1-mu)$ over abstention against Adaptive adversaries. smash$tildeO(T1-mu)$ incurring smash$tildeO(T1-mu)$ over abstention。
論文 参考訳(メタデータ) (2021-10-27T08:00:53Z) - Self-Supervised Learning from Semantically Imprecise Data [7.24935792316121]
動物」や「鳥」などの不正確なラベルから学ぶことは、熟練したラベル付きトレーニングデータが乏しい場合に重要な機能です。
CHILLAXはこの課題に取り組むために最近提案された方法です。
制約外挿を用いた自己教師型スキームでCHILLAXを拡張して擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-04-22T07:26:14Z) - PAL : Pretext-based Active Learning [2.869739951301252]
提案手法は,従来の提案手法よりも,誤ラベルに頑健な深層ニューラルネットワークの能動的学習手法を提案する。
ラベルのないサンプルを選別するために、別ネットワークを使用します。
その結果,ラベルノイズの欠如による競合精度も向上した。
論文 参考訳(メタデータ) (2020-10-29T21:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。