論文の概要: Bridging the Semantic Gap in Virtual Machine Introspection and Forensic Memory Analysis
- arxiv url: http://arxiv.org/abs/2503.05482v1
- Date: Fri, 07 Mar 2025 14:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 15:56:54.478928
- Title: Bridging the Semantic Gap in Virtual Machine Introspection and Forensic Memory Analysis
- Title(参考訳): 仮想マシンイントロスペクションと法医学記憶解析における意味ギャップのブリッジ化
- Authors: Christofer Fellicious, Hans P. Reiser, Michael Granitzer,
- Abstract要約: セマンティックギャップ(Semantic Gap)とは、特定のツールや専門知識を使わずに生のメモリデータを解釈することの難しさである。
先進的な知識,メタデータ,エンジニアリング機能がVMIやFMAにどのように役立つかを検討する。
提案手法は,F1スコアを80%以上獲得することで,メタデータの充実によってパフォーマンスが向上することを示す。
- 参考スコア(独自算出の注目度): 0.6372911857214884
- License:
- Abstract: Forensic Memory Analysis (FMA) and Virtual Machine Introspection (VMI) are critical tools for security in a virtualization-based approach. VMI and FMA involves using digital forensic methods to extract information from the system to identify and explain security incidents. A key challenge in both FMA and VMI is the "Semantic Gap", which is the difficulty of interpreting raw memory data without specialized tools and expertise. In this work, we investigate how a priori knowledge, metadata and engineered features can aid VMI and FMA, leveraging machine learning to automate information extraction and reduce the workload of forensic investigators. We choose OpenSSH as our use case to test different methods to extract high level structures. We also test our method on complete physical memory dumps to showcase the effectiveness of the engineered features. Our features range from basic statistical features to advanced graph-based representations using malloc headers and pointer translations. The training and testing are carried out on public datasets that we compare against already recognized baseline methods. We show that using metadata, we can improve the performance of the algorithm when there is very little training data and also quantify how having more data results in better generalization performance. The final contribution is an open dataset of physical memory dumps, totalling more than 1 TB of different memory state, software environments, main memory capacities and operating system versions. Our methods show that having more metadata boosts performance with all methods obtaining an F1-Score of over 80%. Our research underscores the possibility of using feature engineering and machine learning techniques to bridge the semantic gap.
- Abstract(参考訳): FMA(Forensic Memory Analysis)とVMI(Virtual Machine Introspection)は、仮想化ベースのアプローチにおいて、セキュリティにとって重要なツールである。
VMIとFMAは、セキュリティインシデントを特定し説明するために、システムから情報を抽出するデジタル法医学手法を使用する。
FMAとVMIのどちらにおいても重要な課題は"Semantic Gap"であり、特別なツールや専門知識を使わずに生のメモリデータを解釈することが困難である。
本研究では,情報抽出の自動化と法医学研究者の作業量削減に機械学習を活用することによって,事前知識,メタデータ,エンジニアリング機能がVMIやFMAにどのように役立つかを検討する。
我々は、高いレベルの構造を抽出する異なる方法をテストするために、OpenSSHを選択します。
また,本手法を全物理メモリダンプ上でテストし,本手法の有効性を実証した。
我々の特徴は、基本的な統計的特徴から、malocヘッダとポインタ変換を用いた高度なグラフベースの表現まで様々である。
トレーニングとテストは、すでに認識されているベースライン手法と比較した公開データセット上で実施されます。
メタデータを用いることで,学習データが少ない場合にアルゴリズムの性能を向上させることができ,また,より多くのデータを持つことでより一般化性能が向上することを示す。
最後のコントリビューションは、物理メモリダンプのオープンデータセットで、1TBを超える異なるメモリ状態、ソフトウェア環境、メインメモリ容量、オペレーティングシステムバージョンである。
提案手法は,F1スコアを80%以上獲得することで,メタデータの充実によってパフォーマンスが向上することを示す。
本研究は,機能工学と機械学習技術を用いてセマンティックギャップを埋める可能性を明らかにする。
関連論文リスト
- MEX: Memory-efficient Approach to Referring Multi-Object Tracking [7.414903984067945]
メモリ効率のよいクロスモダリティ(MEX)と呼ばれる実用的なモジュールを紹介します。
このメモリ効率の手法は、iKUNのような市販のトラッカーに直接適用することができる。
提案手法は,メモリ4GBの単一GPU上での推論において有効であることを示す。
論文 参考訳(メタデータ) (2025-02-19T16:58:42Z) - Scalability of memorization-based machine unlearning [2.5782420501870296]
機械学習(MUL)は、事前訓練されたモデルからデータの特定のサブセットの影響を取り除くことに焦点を当てている。
記憶に基づく未学習法が開発され、未学習の品質に関して例外的な性能を示した。
我々は、一連の記憶スコアプロキシを用いて、最先端の記憶型MULアルゴリズムのスケーラビリティに挑戦する。
論文 参考訳(メタデータ) (2024-10-21T21:18:39Z) - PIM-Opt: Demystifying Distributed Optimization Algorithms on a Real-World Processing-In-Memory System [21.09681871279162]
大規模データセットに対するモダン機械学習(ML)トレーニングは、時間を要する作業量である。
最適化アルゴリズムであるGradient Descent (SGD) は、その効率性、単純さ、一般化性能に頼っている。
プロセッサ中心のアーキテクチャは、MLトレーニングワークロードの実行中に低パフォーマンスと高エネルギー消費に悩まされる。
Processing-In-Memory(PIM)は、データ移動のボトルネックを軽減するための有望なソリューションである。
論文 参考訳(メタデータ) (2024-04-10T17:00:04Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - MASTER: Multi-task Pre-trained Bottlenecked Masked Autoencoders are
Better Dense Retrievers [140.0479479231558]
本研究では,様々な事前学習タスクをマルチタスク事前学習モデル(MASTER)に統合することを目的とする。
MASTERは共有エンコーダのマルチデコーダアーキテクチャを利用して、タスク全体にわたる豊富なセマンティック情報を高密度ベクトルに圧縮する表現ボトルネックを構築することができる。
論文 参考訳(メタデータ) (2022-12-15T13:57:07Z) - Learning to Rank Graph-based Application Objects on Heterogeneous
Memories [0.0]
本稿では,アプリケーションの性能に最も影響を与えるアプリケーションオブジェクトを識別し,特徴付ける手法について述べる。
予測モデルを用いてデータ配置を行うことで,ベースラインのアプローチと比較して,実行時間の劣化を12% (平均) および30% (最大) 削減することができる。
論文 参考訳(メタデータ) (2022-11-04T00:20:31Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Memory Wrap: a Data-Efficient and Interpretable Extension to Image
Classification Models [9.848884631714451]
Memory Wrapは、任意の画像分類モデルのプラグアンドプレイ拡張である。
データ効率性とモデル解釈性の両方を改善し、コンテンツアテンションメカニズムを採用する。
メモリラップは,限られたデータ集合から学習すると,標準的な分類器よりも優れることを示す。
論文 参考訳(メタデータ) (2021-06-01T07:24:19Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。