論文の概要: OSPtrack: A Labeled Dataset Targeting Simulated Open-Source Package Execution
- arxiv url: http://arxiv.org/abs/2411.14829v1
- Date: Fri, 22 Nov 2024 10:07:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:02:23.616203
- Title: OSPtrack: A Labeled Dataset Targeting Simulated Open-Source Package Execution
- Title(参考訳): OSPtrack: オープンソースパッケージの実行をシミュレートするラベル付きデータセット
- Authors: Zhuoran Tan, Christos Anagnosstopoulos, Jeremy Singer,
- Abstract要約: このデータセットには9,461のパッケージレポート(悪意のある1,962)が含まれており、ファイル、ソケット、コマンド、DNSレコードなどの静的および動的機能を備えている。
ソースコードアクセスが制限されている場合、特に悪意のあるインジケータの特定を支援し、実行時に効率的な検出方法をサポートする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Open-source software is a fundamental part of the internet and the cyber supply chain, but its exploitation has become more frequent. While vulnerability detection in OSS has advanced, previous work mainly focuses on static code analysis, neglecting runtime indicators. To address this, we created a dataset spanning multiple ecosystems, capturing features generated during the execution of packages and libraries in isolated environments. The dataset includes 9,461 package reports (1,962 malicious), with static and dynamic features such as files, sockets, commands, and DNS records. Labeled with verified information and detailed sub-labels for attack types, this dataset helps identify malicious indicators, especially when source code access is limited, and supports efficient detection methods during runtime.
- Abstract(参考訳): オープンソースソフトウェアはインターネットとサイバーサプライチェーンの基本的な部分であるが、その利用が頻繁に行われている。
OSSの脆弱性検出は進歩しているが、以前の研究は主に静的コード分析に重点を置いており、実行時インジケータを無視している。
これを解決するために、複数のエコシステムにまたがるデータセットを作成し、分離された環境でパッケージやライブラリの実行中に生成された機能をキャプチャしました。
データセットには、9,461のパッケージレポート(悪意のある1,962)と、ファイル、ソケット、コマンド、DNSレコードなどの静的および動的機能が含まれている。
認証情報と攻撃タイプに関する詳細なサブラベルによってラベル付けされたこのデータセットは、特にソースコードアクセスが制限されている場合に、悪意のあるインジケータを特定するのに役立ち、実行時に効率的な検出方法をサポートする。
関連論文リスト
- Cross-domain Learning Framework for Tracking Users in RIS-aided Multi-band ISAC Systems with Sparse Labeled Data [55.70071704247794]
統合センシング・通信(ISAC)は6G通信において重要であり、再構成可能なインテリジェントサーフェス(RIS)の急速な発展によって促進される
本稿では,複数の帯域にまたがるマルチモーダルCSIインジケータを協調的に活用し,クロスドメイン方式で追跡機能をモデル化するX2Trackフレームワークを提案する。
X2Trackの下では、トランスフォーマーニューラルネットワークと逆学習技術に基づいて、トラッキングエラーを最小限に抑える効率的なディープラーニングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-05-10T08:04:27Z) - Characterising Payload Entropy in Packet Flows [0.0]
早期検出の鍵となる手法は、異常なネットワーク行動パターンの分類である。
我々は、複数の大きなパケットデータセットを分析し、共通のネットワークサービスに対して、ベースラインペイロード情報エントロピー値を確立する。
本稿では,ライブパケットデータやオフラインパケットデータからのフローリカバリを行う際のエントロピー指標の効率的な手法について述べる。
論文 参考訳(メタデータ) (2024-04-29T21:38:39Z) - DONAPI: Malicious NPM Packages Detector using Behavior Sequence Knowledge Mapping [28.852274185512236]
npmは最も広範なパッケージマネージャであり、200万人以上のサードパーティのオープンソースパッケージをホストしている。
本稿では,340万以上のパッケージを含むローカルパッケージキャッシュをほぼリアルタイムで同期させ,より詳細なパッケージコードにアクセスできるようにする。
静的解析と動的解析を組み合わせた自動悪質npmパッケージ検出器であるDONAPIを提案する。
論文 参考訳(メタデータ) (2024-03-13T08:38:21Z) - Anomaly Detection Dataset for Industrial Control Systems [1.2234742322758418]
産業制御システム(ICS)はサイバー攻撃の対象となり、ますます脆弱になりつつある。
機械学習アルゴリズムを評価するのに適したデータセットがないことは、課題である。
本稿では、教師付きおよび教師なしMLベースのIDS評価のためのネットワークデータとプロセス状態変数ログを提供する「ICS-Flow」データセットを提案する。
論文 参考訳(メタデータ) (2023-05-11T14:52:19Z) - Malicious Source Code Detection Using Transformer [0.0]
本稿では,トランスフォーマー(MSDT)アルゴリズムを用いたMalicious Source code Detectionを提案する。
MSDTは、ソースコードパッケージへの実世界のコードインジェクションケースを検出するディープラーニング手法に基づく、新しい静的解析である。
我々のアルゴリズムは、悪意のあるコードで注入された関数を精度@kで最大0.909の精度で検出できる。
論文 参考訳(メタデータ) (2022-09-16T14:16:50Z) - Towards Realistic Semi-Supervised Learning [73.59557447798134]
オープンワールド環境でSSLに取り組み、未知のクラスと未知のクラスを同時に分類する新しい手法を提案する。
我々のアプローチは、既存の最先端の7つのデータセットよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-07-05T19:04:43Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Extending the WILDS Benchmark for Unsupervised Adaptation [186.90399201508953]
We present the WILDS 2.0 update, which extends 8 of the 10 datasets in the WILDS benchmark of distribution shifts to include curated unlabeled data。
これらのデータセットは、組織学から野生生物保護まで幅広い応用、タスク(分類、回帰、検出)、モダリティにまたがる。
ドメイン不変量や自己学習,自己管理など,ラベルのないデータを活用する最先端の手法を体系的にベンチマークする。
論文 参考訳(メタデータ) (2021-12-09T18:32:38Z) - LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文 参考訳(メタデータ) (2021-11-02T15:16:08Z) - Malicious Code Detection: Run Trace Output Analysis by LSTM [0.0]
長期メモリ(LSTM)による実行トレース出力解析による悪意のあるコード検出手法を提案する。
PEファイルの動的解析から得られたトレース出力からデータセットを作成した。
実験の結果、ISMは87.51%、偽陽性率は18.34%、BSMは99.26%、偽陽性率は2.62%であった。
論文 参考訳(メタデータ) (2021-01-14T15:00:42Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。