論文の概要: HiGraph: A Large-Scale Hierarchical Graph Dataset for Malware Analysis
- arxiv url: http://arxiv.org/abs/2509.02113v1
- Date: Tue, 02 Sep 2025 09:10:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.977661
- Title: HiGraph: A Large-Scale Hierarchical Graph Dataset for Malware Analysis
- Title(参考訳): HiGraph: マルウェア分析のための大規模階層グラフデータセット
- Authors: Han Chen, Hanchen Wang, Hongmei Chen, Ying Zhang, Lu Qin, Wenjie Zhang,
- Abstract要約: 我々は、textbf595K Call Graphs (FCGs)内にネストしたtextbf200M Control Flow Graphs (CFGs) を含む、マルウェア分析のための最大の公開階層グラフデータセットであるデータセットを紹介する。
この2段階の表現は、コードの難読化とマルウェアの進化に耐性のある堅牢な検出器を構築するのに必要な構造的意味を保存している。
HiGraphの実用性は、良性および悪意のあるソフトウェアの構造的特性を明確化し、コミュニティの基本的なベンチマークとして確立する、大規模な分析を通じて実証する。
- 参考スコア(独自算出の注目度): 28.52072763032641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancement of graph-based malware analysis is critically limited by the absence of large-scale datasets that capture the inherent hierarchical structure of software. Existing methods often oversimplify programs into single level graphs, failing to model the crucial semantic relationship between high-level functional interactions and low-level instruction logic. To bridge this gap, we introduce \dataset, the largest public hierarchical graph dataset for malware analysis, comprising over \textbf{200M} Control Flow Graphs (CFGs) nested within \textbf{595K} Function Call Graphs (FCGs). This two-level representation preserves structural semantics essential for building robust detectors resilient to code obfuscation and malware evolution. We demonstrate HiGraph's utility through a large-scale analysis that reveals distinct structural properties of benign and malicious software, establishing it as a foundational benchmark for the community. The dataset and tools are publicly available at https://higraph.org.
- Abstract(参考訳): グラフベースのマルウェア分析の進歩は、ソフトウェア固有の階層構造をキャプチャする大規模なデータセットがないために、極めて制限されている。
既存の手法はしばしばプログラムを単一レベルのグラフに単純化し、高レベルの機能的相互作用と低レベルの命令論理の間の重要な意味関係をモデル化しなかった。
このギャップを埋めるために,<textbf{200M} Control Flow Graphs (CFGs) を内包する,マルウェア解析のための最大の階層グラフデータセットである \dataset を導入する。
この2段階の表現は、コードの難読化とマルウェアの進化に耐性のある堅牢な検出器を構築するのに必要な構造的意味を保存している。
HiGraphの実用性は、良性および悪意のあるソフトウェアの構造的特性を明確化し、コミュニティの基本的なベンチマークとして確立する、大規模な分析を通じて実証する。
データセットとツールはhttps://higraph.org.comで公開されている。
関連論文リスト
- From Features to Structure: Task-Aware Graph Construction for Relational and Tabular Learning with GNNs [6.0757501646966965]
タスク対応グラフ拡張のための統合フレームワークであるauGraphを紹介する。
auGraphは、属性をノードに選択的にプロモートすることで、ベースグラフ構造を強化する。
タスク関連構造信号を注入しながら、元のデータスキーマを保存する。
論文 参考訳(メタデータ) (2025-06-02T20:42:53Z) - Beyond Message Passing: Neural Graph Pattern Machine [50.78679002846741]
本稿では,グラフサブストラクチャから直接学習することで,メッセージパッシングをバイパスする新しいフレームワークであるNeural Graph Pattern Machine(GPM)を紹介する。
GPMはタスク関連グラフパターンを効率的に抽出し、エンコードし、優先順位付けする。
論文 参考訳(メタデータ) (2025-01-30T20:37:47Z) - GraphCroc: Cross-Correlation Autoencoder for Graph Structural Reconstruction [6.817416560637197]
グラフオートエンコーダ(GAE)はノード埋め込みからグラフ構造を再構築する。
我々はGAE表現能力を著しく向上する相互相関機構を導入する。
また、さまざまな下流タスクに適したフレキシブルエンコーダアーキテクチャをサポートする新しいGAEであるGraphCrocを提案する。
論文 参考訳(メタデータ) (2024-10-04T12:59:45Z) - Learning to Model Graph Structural Information on MLPs via Graph Structure Self-Contrasting [50.181824673039436]
本稿では,グラフ構造情報をメッセージパッシングなしで学習するグラフ構造自己コントラスト(GSSC)フレームワークを提案する。
提案するフレームワークは,構造情報を事前知識として暗黙的にのみ組み込む,MLP(Multi-Layer Perceptrons)に基づいている。
これはまず、近傍の潜在的非形式的あるいはノイズの多いエッジを取り除くために構造的スペーシングを適用し、その後、スペーシングされた近傍で構造的自己コントラストを行い、ロバストなノード表現を学ぶ。
論文 参考訳(メタデータ) (2024-09-09T12:56:02Z) - GraphEdit: Large Language Models for Graph Structure Learning [14.16155596597421]
グラフ構造学習(GSL)は、グラフ構造データ中のノード間の固有の依存関係と相互作用をキャプチャすることに焦点を当てている。
既存のGSL法は、監督信号として明示的なグラフ構造情報に大きく依存している。
グラフ構造化データの複雑なノード関係を学習するために,大規模言語モデル(LLM)を利用したグラフ編集を提案する。
論文 参考訳(メタデータ) (2024-02-23T08:29:42Z) - HUGE: Huge Unsupervised Graph Embeddings with TPUs [6.108914274067702]
グラフ埋め込み(Graph Embedding)は、グラフ内のノードを連続的に表現するプロセスである。
高帯域幅メモリを利用した高性能グラフ埋め込みアーキテクチャを提案する。
実・合成大規模データセット上での埋め込み空間の品質を検証する。
論文 参考訳(メタデータ) (2023-07-26T20:29:15Z) - GraphMI: Extracting Private Graph Data from Graph Neural Networks [59.05178231559796]
GNNを反転させてトレーニンググラフのプライベートグラフデータを抽出することを目的とした textbfGraph textbfModel textbfInversion attack (GraphMI) を提案する。
具体的には,グラフ特徴の空間性と滑らかさを保ちながら,グラフエッジの離散性に対処する勾配モジュールを提案する。
エッジ推論のためのグラフトポロジ、ノード属性、ターゲットモデルパラメータを効率的に活用するグラフ自動エンコーダモジュールを設計する。
論文 参考訳(メタデータ) (2021-06-05T07:07:52Z) - Learning Graph Structure With A Finite-State Automaton Layer [31.028101360041227]
本研究は,本質的なグラフ構造から抽象的関係を導出する学習の課題について考察する。
この問題を緩和して有限状態オートマトンポリシーを学習することで、これらの関係をエンドツーエンドで学習する方法を示す。
我々は,このレイヤがグリッドワールドグラフのショートカットを見つけ,Pythonプログラム上で単純な静的解析を再現できることを実証した。
論文 参考訳(メタデータ) (2020-07-09T17:01:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。