論文の概要: PYPILINE: Malicious PyPI Package Detection via Suspicious API Knowledge and Agent Workflow
- arxiv url: http://arxiv.org/abs/2606.19063v1
- Date: Wed, 17 Jun 2026 13:37:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.181615
- Title: PYPILINE: Malicious PyPI Package Detection via Suspicious API Knowledge and Agent Workflow
- Title(参考訳): PyPILINE: 疑わしいAPI知識とエージェントワークフローによる悪意のあるPyPIパッケージ検出
- Authors: Siyuan Pang, Zhengwei Jiang, Yepeng Yao, Zijing Fan, Haozhe Li, Baoxu Liu,
- Abstract要約: PYPILINEは、疑わしいAPI知識ベースとAgentワークフローを組み合わせた、新しい検出方法である。
PYPILINEは96.7%の精度で既存の最先端ツール、99.6%のリコール、98.1%のF1スコアを大きく上回っている。
PYPILINEは、オープンソースのエコシステムのセキュリティを強化するために、実用的で効率的で便利な悪意のあるパッケージ検出ソリューションを提供する。
- 参考スコア(独自算出の注目度): 6.0010781463195455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The detection of malicious PyPI packages is crucial for maintaining the security of the open source software supply chain. Existing methods, which primarily rely on rules or traditional machine learning, suffer from poor interpretability and difficulty in adapting to novel attacks. To address this, we propose PYPILINE, a novel detection method that combines a suspicious API knowledge base with an Agent workflow. PYPILINE first conducts static analysis on known malicious packages, extracting abstract syntax trees and generating API call graphs, from which it automatically extracts and constructs a structured suspicious API knowledge base. During the detection phase, this knowledge base is used to enhance reasoning capabilities. Through an Agent workflow, PYPILINE performs in depth semantic analysis of unknown packages and outputs a structured, interpretable maliciousness assessment report. The experimental results show that PYPILINE significantly outperforms existing state-of-the-art tools in precision of 96.7\%, recall of 99.6\%, and F1-score of 98.1\%, with its precision surpassing baseline tools by 5.7 to 24.2 percentage points. Additionally, we conducted an empirical study on malicious packages, systematically revealing prevalent attack strategies, as well as the most commonly abused APIs. Equipped with tool-calling AI agent workflows for automated vector database retrieval of suspicious API knowledge and mail server delivery of analysis reports, PYPILINE delivers a practical, efficient, and convenient malicious package detection solution to strengthen open-source ecosystem security.
- Abstract(参考訳): 悪意のあるPyPIパッケージの検出は、オープンソースのソフトウェアサプライチェーンのセキュリティを維持するために不可欠である。
既存の手法は主にルールや従来の機械学習に依存しているが、新しい攻撃に適応する際の解釈可能性や難しさに悩まされている。
そこで本研究では,疑わしいAPI知識ベースとエージェントワークフローを組み合わせた新しい検出手法であるPYPILINEを提案する。
PYPILINEはまず、既知の悪意のあるパッケージの静的解析を行い、抽象構文木を抽出し、APIコールグラフを生成する。
検出フェーズの間、この知識ベースは推論能力を高めるために使用される。
Agentワークフローを通じて、PYPILINEは未知のパッケージの詳細なセマンティック分析を行い、構造化され、解釈可能な悪意評価レポートを出力する。
実験の結果、PYPILINEは既存の最先端ツールを96.7\%、リコール99.6\%、F1スコア98.1\%で大幅に上回り、ベースラインツールを5.7~24.2ポイント上回った。
さらに、悪意のあるパッケージについて実証的研究を行い、攻撃戦略を体系的に明らかにし、最も一般的に悪用されるAPIについても明らかにした。
PYPILINEは、不審なAPI知識の自動検索と分析レポートのメールサーバ配信のためのツールコールAIエージェントワークフローを備えており、オープンソースのエコシステムセキュリティを強化するために、実用的で効率的で便利な悪質なパッケージ検出ソリューションを提供する。
関連論文リスト
- When the Manual Lies: A Realistic Benchmark to Evaluate MCP Poisoning Attacks for LLM Agents [43.702131498259384]
本稿では,新しいセマンティックアタックであるTDP(Tool Description Poisoning)を体系的に検討する。
TDPでは、悪意のある命令はツールの実行可能なコードに埋め込まれず、記述的なメタデータに隠蔽的に注入される。
この研究は、TDP用に調整された最初の特別なセキュリティベンチマークを提供し、高度なエージェントシステムの認知層と計画層の確保に不可欠な洞察を提供する。
論文 参考訳(メタデータ) (2026-05-22T08:34:48Z) - AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents [50.481033105867205]
我々はAgentProcessBenchを紹介した。AgentProcessBenchは、現実的なツール拡張トラジェクトリにおけるステップレベルの有効性を評価するための最初のベンチマークである。
ベンチマークは、1,000の多様な軌跡と8,509の人間ラベル付きステップアノテーションと89.1%のアノテーション間合意で構成されている。
探索をキャプチャする3つのラベリングスキームと、ラベルのあいまいさを減らすためのエラー伝搬ルールを備えている。
論文 参考訳(メタデータ) (2026-03-15T16:13:58Z) - Cutting the Gordian Knot: Detecting Malicious PyPI Packages via a Knowledge-Mining Framework [14.0015860172317]
Python Package Index(PyPI)は悪意のあるアクターのターゲットとなっている。
現在の検出ツールは偽陽性率15~30%を生成し、不正に正規パッケージの3分の1を悪意のあるものとフラグ付けしている。
我々は,検出障害を有用な行動知識に変換する知識駆動型フレームワークであるPyGuardを提案する。
論文 参考訳(メタデータ) (2026-01-23T05:49:09Z) - Bridging Expert Reasoning and LLM Detection: A Knowledge-Driven Framework for Malicious Packages [10.858565849895314]
NPMやPyPIといったオープンソースエコシステムは、サプライチェーン攻撃によってますます標的になってきている。
我々は、専門家による解析的推論を自動化された悪意のあるパッケージ検出に統合する、検索強化世代(RAG)ベースのフレームワークであるIntelGuardを紹介する。
論文 参考訳(メタデータ) (2026-01-23T05:31:12Z) - ReasAlign: Reasoning Enhanced Safety Alignment against Prompt Injection Attack [52.17935054046577]
本稿では、間接的インジェクション攻撃に対する安全性アライメントを改善するためのモデルレベルのソリューションであるReasAlignを提案する。
ReasAlignには、ユーザクエリの分析、競合する命令の検出、ユーザの意図したタスクの継続性を維持するための構造化された推論ステップが組み込まれている。
論文 参考訳(メタデータ) (2026-01-15T08:23:38Z) - VulnLLM-R: Specialized Reasoning LLM with Agent Scaffold for Vulnerability Detection [45.69684471143409]
VulnLLM-R は脆弱性検出のための LLM を最優先の推論である。
私たちは70億のパラメータを持つ推論モデルをトレーニングします。
VulnLLM-R は SOTA 静的解析ツールよりも有効性と効率が優れていることを示す。
論文 参考訳(メタデータ) (2025-12-08T13:06:23Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - Detecting Malicious Source Code in PyPI Packages with LLMs: Does RAG Come in Handy? [6.7341750484636975]
PyPIのようなオープンソースのエコシステムにおける悪意あるソフトウェアパッケージは、セキュリティ上のリスクを増大させる。
本研究では,Large Language Models (LLM) とRetrieval-Augmented Generation (RAG) の有効性を実証的に評価する。
論文 参考訳(メタデータ) (2025-04-18T16:11:59Z) - A Machine Learning-Based Approach For Detecting Malicious PyPI Packages [4.311626046942916]
現代のソフトウェア開発では、外部ライブラリやパッケージの使用が増えている。
この再利用コードへの依存は、悪意のあるパッケージという形でデプロイされたソフトウェアに重大なリスクをもたらす。
本稿では、機械学習と静的解析を用いて、パッケージのメタデータ、コード、ファイル、テキストの特徴を調べるデータ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2024-12-06T18:49:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。