論文の概要: QUT-DV25: A Dataset for Dynamic Analysis of Next-Gen Software Supply Chain Attacks
- arxiv url: http://arxiv.org/abs/2505.13804v1
- Date: Tue, 20 May 2025 01:34:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.58445
- Title: QUT-DV25: A Dataset for Dynamic Analysis of Next-Gen Software Supply Chain Attacks
- Title(参考訳): QUT-DV25:次世代ソフトウェアサプライチェーン攻撃の動的解析のためのデータセット
- Authors: Sk Tanzir Mehedi, Raja Jurdak, Chadni Islam, Gowri Ramachandran,
- Abstract要約: 既存のデータセットはメタデータ検査と静的コード解析に依存しており、そのような攻撃を検出するには不十分である。
本稿では,サプライチェーン攻撃の検出・緩和研究を支援するための動的解析データセットQUT-DV25を提案する。
このデータセットは、14,271のPythonパッケージからインストールとインストール後のトレースをキャプチャする。
- 参考スコア(独自算出の注目度): 4.045165357831481
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Securing software supply chains is a growing challenge due to the inadequacy of existing datasets in capturing the complexity of next-gen attacks, such as multiphase malware execution, remote access activation, and dynamic payload generation. Existing datasets, which rely on metadata inspection and static code analysis, are inadequate for detecting such attacks. This creates a critical gap because these datasets do not capture what happens during and after a package is installed. To address this gap, we present QUT-DV25, a dynamic analysis dataset specifically designed to support and advance research on detecting and mitigating supply chain attacks within the Python Package Index (PyPI) ecosystem. This dataset captures install and post-install-time traces from 14,271 Python packages, of which 7,127 are malicious. The packages are executed in an isolated sandbox environment using an extended Berkeley Packet Filter (eBPF) kernel and user-level probes. It captures 36 real-time features, that includes system calls, network traffic, resource usages, directory access patterns, dependency logs, and installation behaviors, enabling the study of next-gen attack vectors. ML analysis using the QUT-DV25 dataset identified four malicious PyPI packages previously labeled as benign, each with thousands of downloads. These packages deployed covert remote access and multi-phase payloads, were reported to PyPI maintainers, and subsequently removed. This highlights the practical value of QUT-DV25, as it outperforms reactive, metadata, and static datasets, offering a robust foundation for developing and benchmarking advanced threat detection within the evolving software supply chain ecosystem.
- Abstract(参考訳): ソフトウェアサプライチェーンのセキュア化は、マルチフェーズマルウェアの実行やリモートアクセスアクティベーション、動的ペイロード生成といった、次世代攻撃の複雑さを捉える上で、既存のデータセットが不十分であるために、ますます困難になっている。
既存のデータセットはメタデータ検査と静的コード解析に依存しており、そのような攻撃を検出するには不十分である。
これらのデータセットは、パッケージのインストール中とインストール後に何が起こるかをキャプチャしないため、これは重大なギャップを生じます。
このギャップに対処するため,Python Package Index (PyPI)エコシステム内のサプライチェーン攻撃の検出と緩和に関する研究を支援するために設計された動的解析データセットであるQUT-DV25を提案する。
このデータセットは、14,271のPythonパッケージからインストールとインストール後のトレースをキャプチャする。
パッケージは、拡張バークレーパケットフィルタ(eBPF)カーネルとユーザレベルのプローブを使用して、分離されたサンドボックス環境で実行される。
システムコール、ネットワークトラフィック、リソース使用量、ディレクトリアクセスパターン、依存性ログ、インストール動作を含む36のリアルタイム機能をキャプチャし、次世代の攻撃ベクトルの研究を可能にする。
QUT-DV25データセットを用いたML分析では、以前は良性とラベル付けされていた4つの悪意あるPyPIパッケージが特定され、それぞれに数千のダウンロードがあった。
これらのパッケージは、秘密のリモートアクセスとマルチフェーズペイロードをデプロイし、PyPIメンテナに報告し、その後削除した。
これはQUT-DV25の実用的価値を強調し、リアクティブ、メタデータ、静的データセットを上回っ、進化するソフトウェアサプライチェーンエコシステム内で高度な脅威検出の開発とベンチマークを行うための堅牢な基盤を提供する。
関連論文リスト
- DySec: A Machine Learning-based Dynamic Analysis for Detecting Malicious Packages in PyPI Ecosystem [4.045165357831481]
悪意あるPythonパッケージは、Python Package Index (PyPI)のようなオープンソースのリポジトリの信頼を悪用することで、ソフトウェアサプライチェーンを脆弱にする
リアルタイムの行動監視の欠如は、メタデータ検査と静的コード解析を高度な攻撃戦略に不適当にする。
我々は,PyPI用の機械学習ベースの動的解析フレームワークであるDySecを紹介し,eBPFカーネルとユーザレベルのプローブを用いてパッケージインストール時の動作を監視する。
論文 参考訳(メタデータ) (2025-03-01T03:20:42Z) - PyPulse: A Python Library for Biosignal Imputation [58.35269251730328]
PyPulseは,臨床およびウェアラブルの両方のセンサ設定において生体信号の計算を行うPythonパッケージである。
PyPulseのフレームワークは、非機械学習バイオリサーバーを含む幅広いユーザーベースに対して、使い勝手の良いモジュラーで拡張可能なフレームワークを提供する。
PyPulseはMITライセンスでGithubとPyPIでリリースしました。
論文 参考訳(メタデータ) (2024-12-09T11:00:55Z) - OSPtrack: A Labeled Dataset Targeting Simulated Execution of Open-Source Software [0.0]
このデータセットには9,461のパッケージレポートが含まれており、そのうち1,962が悪意のあるものである。
データセットには、ファイル、ソケット、コマンド、DNSレコードなどの静的および動的機能が含まれている。
このデータセットは実行時検出をサポートし、検出モデルトレーニングを強化し、エコシステム間の効率的な比較分析を可能にする。
論文 参考訳(メタデータ) (2024-11-22T10:07:42Z) - SBOM Generation Tools in the Python Ecosystem: an In-Detail Analysis [2.828503885204035]
我々はCycloneDX標準を用いて4つの人気のあるSBOM生成ツールを分析する。
依存関係のバージョン、メタデータファイル、リモート依存関係、オプションの依存関係に関する問題を強調します。
PyPIエコシステムにおけるメタデータの標準の欠如による体系的な問題を特定する。
論文 参考訳(メタデータ) (2024-09-02T12:48:10Z) - Cross-domain Learning Framework for Tracking Users in RIS-aided Multi-band ISAC Systems with Sparse Labeled Data [55.70071704247794]
統合センシング・通信(ISAC)は6G通信において重要であり、再構成可能なインテリジェントサーフェス(RIS)の急速な発展によって促進される
本稿では,複数の帯域にまたがるマルチモーダルCSIインジケータを協調的に活用し,クロスドメイン方式で追跡機能をモデル化するX2Trackフレームワークを提案する。
X2Trackの下では、トランスフォーマーニューラルネットワークと逆学習技術に基づいて、トラッキングエラーを最小限に抑える効率的なディープラーニングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-05-10T08:04:27Z) - Malicious Package Detection using Metadata Information [0.272760415353533]
本稿では,メタデータに基づく悪意のあるパッケージ検出モデルであるMeMPtecを紹介する。
MeMPtecはパッケージメタデータ情報から一連の機能を抽出する。
実験の結果,偽陽性と偽陰性の両方が有意な減少を示した。
論文 参考訳(メタデータ) (2024-02-12T06:54:57Z) - DADApy: Distance-based Analysis of DAta-manifolds in Python [51.37841707191944]
DADApyは、高次元データの分析と特徴付けのためのピソンソフトウェアパッケージである。
固有次元と確率密度を推定し、密度に基づくクラスタリングを行い、異なる距離メトリクスを比較する方法を提供する。
論文 参考訳(メタデータ) (2022-05-04T08:41:59Z) - TODS: An Automated Time Series Outlier Detection System [70.88663649631857]
TODSは,パイプライン構築を容易にする,高度にモジュール化されたシステムである。
Todsはデータ処理、時系列処理、特徴分析、検出アルゴリズム、強化モジュールを含む70のプリミティブをサポートしている。
論文 参考訳(メタデータ) (2020-09-18T15:36:43Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。