論文の概要: SQLi Detection with ML: A data-source perspective
- arxiv url: http://arxiv.org/abs/2304.12115v1
- Date: Mon, 24 Apr 2023 14:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 14:43:45.244065
- Title: SQLi Detection with ML: A data-source perspective
- Title(参考訳): MLを用いたSQLi検出:データソースの観点から
- Authors: Balazs Pejo and Nikolett Kapui
- Abstract要約: 評価手法,モデルパラメータの最適化,活用したデータセットの分布,特徴選択の4つの側面に焦点をあてて,これまでのMLベースの結果の欠点を強調した。
他のディストリビューションのデータを使ってトレーニングされたモデルを相互に検証する。(SQLi検出のためにトレーニングされた)MLモデルのこの側面は、決して研究されなかった。しかし、モデルのパフォーマンスとこれに対する感度は、実際のデプロイメントにおいて不可欠である。
- 参考スコア(独自算出の注目度): 0.7614628596146599
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Almost 50 years after the invention of SQL, injection attacks are still
top-tier vulnerabilities of today's ICT systems. Consequently, SQLi detection
is still an active area of research, where the most recent works incorporate
machine learning techniques into the proposed solutions. In this work, we
highlight the shortcomings of the previous ML-based results focusing on four
aspects: the evaluation methods, the optimization of the model parameters, the
distribution of utilized datasets, and the feature selection. Since no single
work explored all of these aspects satisfactorily, we fill this gap and provide
an in-depth and comprehensive empirical analysis. Moreover, we cross-validate
the trained models by using data from other distributions. This aspect of ML
models (trained for SQLi detection) was never studied. Yet, the sensitivity of
the model's performance to this is crucial for any real-life deployment.
Finally, we validate our findings on a real-world industrial SQLi dataset.
- Abstract(参考訳): SQLの発明から50年近く経った今でも、インジェクション攻撃は現在のICTシステムの最上位の脆弱性である。
その結果、sqli検出は現在も活発な研究領域であり、最新の研究で提案されたソリューションに機械学習技術が組み込まれている。
本稿では,評価手法,モデルパラメータの最適化,使用済みデータセットの分布,特徴選択という4つの側面に注目した,これまでのmlに基づく結果の欠点を強調する。
これらすべての側面を十分に調査するひとつの研究はないので、このギャップを埋め、深い総合的な経験分析を提供する。
さらに、他の分布のデータを用いて、トレーニングされたモデルを相互に検証する。
MLモデルのこの側面(SQLi検出のために訓練された)は、決して研究されなかった。
しかし、これに対するモデルの性能の敏感さは、実際のデプロイには不可欠である。
最後に、実世界の産業用sqliデータセットで結果を検証する。
関連論文リスト
- Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文 参考訳(メタデータ) (2024-07-02T22:23:40Z) - Probing Language Models for Pre-training Data Detection [11.37731401086372]
本稿では,モデルの内部アクティベーションを調べることで,事前学習データ検出のための探索手法を提案する。
我々の手法はシンプルで効果的であり、より信頼性の高い事前学習データ検出につながる。
論文 参考訳(メタデータ) (2024-06-03T13:58:04Z) - Precision and Adaptability of YOLOv5 and YOLOv8 in Dynamic Robotic Environments [0.0]
本研究は, YOLOv5モデルとYOLOv8モデルの比較分析を行った。
初期の期待とは対照的に、YOLOv5モデルは同等で、場合によってはオブジェクト検出タスクの精度が優れていた。
論文 参考訳(メタデータ) (2024-06-01T06:17:43Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Federated Object Detection for Quality Inspection in Shared Production [0.0]
フェデレートラーニング(FL)は、データプライバシを損なうことなく、分散データ上で機械学習モデルをトレーニングするための有望なアプローチとして登場した。
本稿では,オブジェクト検出アルゴリズムとしてYOLOv5,FLアルゴリズムとしてFederated Averaging(FedAvg)を用いた品質検査タスクにおけるオブジェクト検出のためのFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-30T13:33:27Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Log-based Anomaly Detection with Deep Learning: How Far Are We? [7.967230034960396]
我々は,4つの公開ログデータセット上のシステム異常を検出するための5つの最先端ディープラーニングモデルについて,詳細な分析を行う。
我々の結果は、すべての研究されたモデルは必ずしもうまくいかないことを指摘している。
論文 参考訳(メタデータ) (2022-02-09T06:27:11Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - MAIN: Multihead-Attention Imputation Networks [4.427447378048202]
本稿では,任意のモデルに適用可能なマルチヘッドアテンションに基づく新しいメカニズムを提案する。
提案手法は、下流タスクの性能を向上させるために、入力データの欠落パターンを誘導的にモデル化する。
論文 参考訳(メタデータ) (2021-02-10T13:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。