Fugu-MT 論文翻訳(概要): DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence Generation

論文の概要: DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence Generation

arxiv url: http://arxiv.org/abs/2501.00446v1
Date: Tue, 31 Dec 2024 13:54:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-05 16:54:31.660553
Title: DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence Generation
Title（参考訳）: DEHYDRATOR:階層的エンコーディングとシーケンス生成によるProvenance Graphストレージの強化
Authors: Jie Ying, Tiantian Zhu, Mingqi Lv, Tieming Chen,
Abstract要約: 本稿では,効率の良いプロファイランスグラフストレージシステムであるDehydratorを提案する。監査フレームワークによって生成されたログに対して、Dehydratorはフィールドマッピングエンコーディングを使用してフィールドレベルの冗長性をフィルタリングし、階層的なエンコーディングによって構造レベルの冗長性をフィルタし、最終的にバッチクエリをサポートするディープニューラルネットワークを学習する。
参考スコア（独自算出の注目度）: 5.785410755732917
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As the scope and impact of cyber threats have expanded, analysts utilize audit logs to hunt threats and investigate attacks. The provenance graphs constructed from kernel logs are increasingly considered as an ideal data source due to their powerful semantic expression and attack historic correlation ability. However, storing provenance graphs with traditional databases faces the challenge of high storage overhead, given the high frequency of kernel events and the persistence of attacks. To address this, we propose Dehydrator, an efficient provenance graph storage system. For the logs generated by auditing frameworks, Dehydrator uses field mapping encoding to filter field-level redundancy, hierarchical encoding to filter structure-level redundancy, and finally learns a deep neural network to support batch querying. We have conducted evaluations on seven datasets totaling over one billion log entries. Experimental results show that Dehydrator reduces the storage space by 84.55%. Dehydrator is 7.36 times more efficient than PostgreSQL, 7.16 times than Neo4j, and 16.17 times than Leonard (the work most closely related to Dehydrator, published at Usenix Security'23).
Abstract（参考訳）: サイバー脅威の範囲と影響が拡大するにつれて、アナリストは監査ログを使用して脅威を追及し、攻撃を調査している。カーネルログから構築された前駆グラフは、その強力なセマンティック表現と、歴史的相関能力の攻撃により、理想的なデータソースとしてますます考えられている。しかし、カーネルイベントの頻度と攻撃の持続性を考えると、従来のデータベースでプロファイランスグラフを保存することは、高いストレージオーバーヘッドの課題に直面している。そこで本研究では,効率的なプロファイランスグラフストレージシステムであるDehydratorを提案する。監査フレームワークによって生成されたログに対して、Dehydratorはフィールドマッピングエンコーディングを使用してフィールドレベルの冗長性をフィルタリングし、階層的なエンコーディングによって構造レベルの冗長性をフィルタし、最終的にバッチクエリをサポートするディープニューラルネットワークを学習する。我々は、合計10億以上のログエントリを含む7つのデータセットの評価を行った。実験の結果, 脱水剤は貯蔵スペースを84.55%削減することがわかった。 DehydratorはPostgreSQLの7.36倍、Neo4jの7.16倍、Leonardの16.17倍である。

関連論文リスト

NGDB-Zoo: Towards Efficient and Scalable Neural Graph Databases Training [55.35217340229661]
NGDB-Zooは,演算子レベルのトレーニングをセマンティック拡張と相乗化することでボトルネックを解消する統合フレームワークである。 NGDB-Zooは多種多様な論理パターンにまたがって高いGPU利用率を維持し, ハイブリッド型ニューロシンボリック推論における摩擦を著しく軽減することを示した。
論文参考訳（メタデータ） (2026-02-25T05:46:42Z)
DRAINCODE: Stealthy Energy Consumption Attacks on Retrieval-Augmented Code Generation via Context Poisoning [48.175253752390425]
本稿では,RAGベースのコード生成システムの計算効率を目標とした,最初の逆アタックであるDrainCodeを紹介する。その結果,DrainCodeのレイテンシは85%増加し,エネルギー消費量は49%増加し,出力長はベースラインに比べて3倍増加した。
論文参考訳（メタデータ） (2026-01-28T13:51:00Z)
Rethinking Tamper-Evident Logging: A High-Performance, Co-Designed Auditing System [8.878757644816273]
既存の不正なログシステムは、高負荷設定で高いオーバーヘッドと深刻なデータ損失に悩まされている。我々は,ログ改ざんのきめ細かな検出を支援する,改ざんした監査ログシステムであるNitroについて紹介する。本システムは,eBPF技術を用いてカーネル再コンパイルを回避する。
論文参考訳（メタデータ） (2025-09-04T02:12:40Z)
Cluster-Aware Attacks on Graph Watermarks [50.19105800063768]
本稿では,コミュニティ誘導型修正を回避できるクラスタ・アウェア・脅威モデルを提案する。その結果,クラスタ・アウェア・アタックは,ランダムなベースラインよりも最大80%の精度でアトリビューション精度を低下させることができることがわかった。グラフコミュニティにまたがる透かしノードを分散する軽量な埋め込み拡張を提案する。
論文参考訳（メタデータ） (2025-04-24T22:49:28Z)
Corpus Poisoning via Approximate Greedy Gradient Descent [48.5847914481222]
本稿では,HotFlip法をベースとした高密度検索システムに対する新たな攻撃手法として,近似グレディ・グラディエント・Descentを提案する。提案手法は,複数のデータセットと複数のレトリバーを用いて高い攻撃成功率を達成し,未知のクエリや新しいドメインに一般化可能であることを示す。
論文参考訳（メタデータ） (2024-06-07T17:02:35Z)
RAGLog: Log Anomaly Detection using Retrieval Augmented Generation [0.0]
本稿では,ベクトルデータベースを利用してログから異常を検出する検索拡張大言語モデルについて検討する。我々の知る限り、RAGLogと呼ばれる我々の実験は、新しいもので、実験結果は、非常に有望であることを示している。
論文参考訳（メタデータ） (2023-11-09T10:40:04Z)
LogShrink: Effective Log Compression by Leveraging Commonality and Variability of Log Data [35.5712445690333]
本稿では,ログデータの共通性と可変性を生かした,新規かつ効果的なログ圧縮手法であるLogShrinkを提案する。ログメッセージにおける潜時的な共通性と変動性を特定するために, 最長のコモンシーケンスとエントロピーに基づく解析器を提案する。この背景にある重要な考え方は、共通性と可変性を利用して、より短い表現でログデータを縮小できるということだ。
論文参考訳（メタデータ） (2023-09-18T04:27:05Z)
GLAD: Content-aware Dynamic Graphs For Log Anomaly Detection [49.9884374409624]
GLADは、システムログの異常を検出するように設計されたグラフベースのログ異常検出フレームワークである。システムログの異常を検出するために設計されたグラフベースのログ異常検出フレームワークであるGLADを紹介する。
論文参考訳（メタデータ） (2023-09-12T04:21:30Z)
A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文参考訳（メタデータ） (2023-08-21T16:24:15Z)
Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文参考訳（メタデータ） (2023-08-17T14:19:22Z)
USTEP: Structuration des logs en flux gr{\^a}ce {\`a} un arbre de recherche {\'e}volutif [0.0]
ログメッセージを解析してフォーマットを構成することは、ログマイニングタスクの古典的な予備的なステップである。進化する木構造に基づくオンラインログ解析手法USTEPを提案する。
論文参考訳（メタデータ） (2023-04-24T09:12:00Z)
LogLG: Weakly Supervised Log Anomaly Detection via Log-Event Graph Construction [31.31712326361932]
そこで本研究では,LogLGという名前のログ異常検出フレームワークを提案し,シーケンスからキーワード間のセマンティックな関係を探索する。具体的には、ラベルなしログのキーワードを最初に抽出してログイベントグラフを構築するエンド・ツー・エンドの反復処理を設計する。そして、未ラベルのログシーケンスの擬似ラベルを生成するために、サブグラフアノテータを構築する。
論文参考訳（メタデータ） (2022-08-23T09:32:19Z)
LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文参考訳（メタデータ） (2021-11-02T15:16:08Z)
Robust and Transferable Anomaly Detection in Log Data using Pre-Trained Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-23T09:17:05Z)
Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。自動エンコーダのコンテキストでデコードすることで更新される。ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文参考訳（メタデータ） (2020-02-27T05:58:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。