論文の概要: Leveraging large language models for SQL behavior-based database intrusion detection
- arxiv url: http://arxiv.org/abs/2508.05690v1
- Date: Wed, 06 Aug 2025 09:53:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:05.932898
- Title: Leveraging large language models for SQL behavior-based database intrusion detection
- Title(参考訳): SQL行動に基づくデータベース侵入検出のための大規模言語モデルの活用
- Authors: Meital Shlezinger, Shay Akirav, Lei Zhou, Liang Guo, Avi Kessel, Guoliang Li,
- Abstract要約: データベースシステムは、様々なドメインにまたがる重要なデータを格納するために広く使われている。
内部攻撃や外部攻撃によるデータベース侵入のような異常なデータベースアクセス行動の頻度は上昇し続けている。
現在のアプローチでは、運用レベルで異常を検出するために必要な粒度が不足している。
- 参考スコア(独自算出の注目度): 11.867133683645871
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Database systems are extensively used to store critical data across various domains. However, the frequency of abnormal database access behaviors, such as database intrusion by internal and external attacks, continues to rise. Internal masqueraders often have greater organizational knowledge, making it easier to mimic employee behavior effectively. In contrast, external masqueraders may behave differently due to their lack of familiarity with the organization. Current approaches lack the granularity needed to detect anomalies at the operational level, frequently misclassifying entire sequences of operations as anomalies, even though most operations are likely to represent normal behavior. On the other hand, some anomalous behaviors often resemble normal activities, making them difficult for existing detection methods to identify. This paper introduces a two-tiered anomaly detection approach for Structured Query Language (SQL) using the Bidirectional Encoder Representations from Transformers (BERT) model, specifically DistilBERT, a more efficient, pre-trained version. Our method combines both unsupervised and supervised machine learning techniques to accurately identify anomalous activities while minimizing the need for data labeling. First, the unsupervised method uses ensemble anomaly detectors that flag embedding vectors distant from learned normal patterns of typical user behavior across the database (out-of-scope queries). Second, the supervised method uses fine-tuned transformer-based models to detect internal attacks with high precision (in-scope queries), using role-labeled classification, even on limited labeled SQL data. Our findings make a significant contribution by providing an effective solution for safeguarding critical database systems from sophisticated threats.
- Abstract(参考訳): データベースシステムは、様々なドメインにまたがる重要なデータを格納するために広く使われている。
しかし、内部攻撃や外部攻撃によるデータベース侵入のような異常なデータベースアクセス行動の頻度は上昇し続けている。
内部のマスクレーダは、しばしばより大きな組織的知識を持ち、従業員の振る舞いを効果的に模倣しやすくする。
対照的に、外部のマスクレーダは組織との親密さの欠如により、異なる振る舞いをすることがある。
現在のアプローチでは、操作レベルでの異常を検出するのに必要な粒度が欠如しており、ほとんどの操作は通常の動作を表す可能性が高いが、操作のシーケンス全体を異常として誤分類することが多い。
一方、一部の異常な行動は通常の行動によく似ており、既存の検出方法の識別が困難である。
本稿では、変換器(BERT)モデルによる双方向エンコーダ表現を用いた構造化クエリ言語(SQL)の2階層異常検出手法、特により効率的で事前訓練されたバージョンのDistilBERTを提案する。
本手法は、教師なしと教師なしの両方の機械学習技術を組み合わせて、データラベリングの必要性を最小限に抑えながら、異常なアクティビティを正確に識別する。
まず、教師なしの方法では、データベース全体にわたる典型的なユーザ行動の学習パターン(スコープ外クエリ)から離れた埋め込みベクトルにフラグを付けるアンサンブル異常検出器を使用する。
第二に、教師付き手法は、微調整されたトランスフォーマーベースモデルを使用して、限られたラベル付きSQLデータであっても、役割ラベル付き分類を用いて、高精度(スコープ内クエリ)で内部攻撃を検出する。
我々の研究は、高度な脅威から重要なデータベースシステムを保護する効果的なソリューションを提供することで、大きな貢献をしている。
関連論文リスト
- ADALog: Adaptive Unsupervised Anomaly detection in Logs with Self-attention Masked Language Model [2.55347686868565]
ADALogは適応的で教師なしの異常検出フレームワークである。
個々の非構造化ログで動作し、ログ内のコンテキスト関係を抽出し、通常のデータに対して適応しきい値を設定する。
BGL,Thunderbird,Spiritのベンチマークデータセット上でADALogを評価する。
論文 参考訳(メタデータ) (2025-05-15T17:31:40Z) - Pattern-Based Time-Series Risk Scoring for Anomaly Detection and Alert Filtering -- A Predictive Maintenance Case Study [3.508168174653255]
本稿では,逐次パターンの類似性に基づいて,異常検出と警告フィルタリングを高速かつ効率的に行う手法を提案する。
本稿では, 大規模産業システムにおける異常検出を含む様々な目的で, このアプローチをどのように活用するかを示す。
論文 参考訳(メタデータ) (2024-05-24T20:27:45Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Label-Efficient Interactive Time-Series Anomaly Detection [17.799924009674694]
ラベル効率の良い対話型時系列異常検出システム(LEIAD)を提案する。
この目標を達成するために、システムは弱い監督と活発な学習を協調的に統合する。
本稿では,3つの時系列異常検出データセットについて実験を行い,提案手法が既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-30T10:16:15Z) - Active Learning-based Isolation Forest (ALIF): Enhancing Anomaly
Detection in Decision Support Systems [2.922007656878633]
ALIFは一般的な孤立林の軽量な修正であり、他の最先端のアルゴリズムと比較して優れた性能を示した。
提案手法は,現実のシナリオでますます普及しているDSS(Decision Support System)の存在に特に注目されている。
論文 参考訳(メタデータ) (2022-07-08T14:36:38Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - Enhancing Unsupervised Anomaly Detection with Score-Guided Network [13.127091975959358]
異常検出は、医療や金融システムなど、さまざまな現実世界のアプリケーションにおいて重要な役割を担っている。
正規データと異常データの間の異常スコアの差を学習・拡大するために,スコア誘導正規化を用いた新しいスコアネットワークを提案する。
次に,スコア誘導型オートエンコーダ(SG-AE)を提案する。
論文 参考訳(メタデータ) (2021-09-10T06:14:53Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。