論文の概要: Taint-Style Vulnerability Detection and Confirmation for Node.js Packages Using LLM Agent Reasoning
- arxiv url: http://arxiv.org/abs/2604.20179v1
- Date: Wed, 22 Apr 2026 04:50:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.967603
- Title: Taint-Style Vulnerability Detection and Confirmation for Node.js Packages Using LLM Agent Reasoning
- Title(参考訳): LLMエージェント推論を用いたNode.jsパッケージのテイントスタイル脆弱性検出と確認
- Authors: Ronghao Ni, Mihai Christodorescu, Limin Jia,
- Abstract要約: コードをスキャンし、脆弱性を提案し、概念実証のエクスプロイトを生成し、検証するために、多段階のエージェントパイプラインを実装します。
公開ベンチマークのパッケージでは、LLMVD$.jsが脆弱性の84%を確認し、以前のプログラム分析ツールでは22%未満である。
- 参考スコア(独自算出の注目度): 7.678135270362941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapidly evolving Node$.$js ecosystem currently includes millions of packages and is a critical part of modern software supply chains, making vulnerability detection of Node$.$js packages increasingly important. However, traditional program analysis struggles in this setting because of dynamic JavaScript features and the large number of package dependencies. Recent advances in large language models (LLMs) and the emerging paradigm of LLM-based agents offer an alternative to handcrafted program models. This raises the question of whether an LLM-centric, tool-augmented approach can effectively detect and confirm taint-style vulnerabilities (e.g., arbitrary command injection) in Node$.$js packages. We implement LLMVD$.$js, a multi-stage agent pipeline to scan code, propose vulnerabilities, generate proof-of-concept exploits, and validate them through lightweight execution oracles; and systematically evaluate its effectiveness in taint-style vulnerability detection and confirmation in Node$.$js packages without dedicated static/dynamic analysis engines for path derivation. For packages from public benchmarks, LLMVD$.$js confirms 84% of the vulnerabilities, compared to less than 22% for prior program analysis tools. It also outperforms a prior LLM-program-analysis hybrid approach while requiring neither vulnerability annotations nor prior vulnerability reports. When evaluated on a set of 260 recently released packages (without vulnerability groundtruth information), traditional tools produce validated exploits for few ($\leq 2$) packages, while LLMVD$.$js generates validated exploits for 36 packages.
- Abstract(参考訳): 急速に進化しているNode$。
現在、$jsエコシステムには数百万のパッケージが含まれており、現代のソフトウェアサプライチェーンの重要な部分であり、Node.jsの脆弱性を検出する。
ますます重要な$jsパッケージ。
しかし、従来のプログラム分析は、動的JavaScript機能と多数のパッケージ依存のため、この設定で苦労している。
大規模言語モデル(LLM)の最近の進歩とLLMベースのエージェントの新しいパラダイムは、手作りのプログラムモデルに代わるものである。
これにより、LLM中心のツール拡張されたアプローチが、Node$.jsのtaintスタイルの脆弱性(例えば任意のコマンドインジェクション)を効果的に検出し、確認できるかどうか、という疑問が持ち上がる。
パッケージは$js。
LLMVD$を実装します。
コードをスキャンし、脆弱性を提案し、概念実証のエクスプロイトを生成し、軽量な実行オラクルを通じて検証する、マルチステージのエージェントパイプラインである。
パスの派生のために、専用の静的/動的分析エンジンを使わずに、$jsパッケージ。
公開ベンチマークのパッケージについては、LLMVD$。
以前のプログラム分析ツールでは22%未満だったのに対して、$jsは84%の脆弱性を確認している。
また、脆弱性アノテーションも以前の脆弱性レポートも必要とせず、以前のLCM-プログラム-分析ハイブリッドアプローチよりも優れている。
最近リリースされた260パッケージのセットで評価すると(脆弱性基盤情報なしで)、従来のツールは少数の(\leq 2$)パッケージに対して検証済みエクスプロイトを生成する。
$jsは36パッケージの検証済みエクスプロイトを生成する。
関連論文リスト
- Multi-Agent Taint Specification Extraction for Vulnerability Detection [49.27772068704498]
コンテナ分析を使用した静的アプリケーションセキュリティテスト(SAST)ツールは、高品質な脆弱性検出結果を提供するものとして広く見なされている。
本稿では,Large Language Models (LLM) のセマンティック理解と従来の静的プログラム解析を戦略的に組み合わせたマルチエージェントシステムであるSemTaintを提案する。
私たちは、SemTaintを最先端のSASTツールであるCodeQLと統合し、これまでCodeQLで検出できなかった162の脆弱性の106を検出して、その効果を実証しています。
論文 参考訳(メタデータ) (2026-01-15T21:31:51Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - Learning to Triage Taint Flows Reported by Dynamic Program Analysis in Node.js Packages [10.447259698656884]
プログラム分析ツールは、しばしば大量の脆弱性レポートを生成する。
本稿では,プログラム解析ツールによって報告される脆弱性の優先順位付けに機械学習を適用することができるかを検討する。
論文 参考訳(メタデータ) (2025-10-23T16:58:02Z) - Backdoor Collapse: Eliminating Unknown Threats via Known Backdoor Aggregation in Language Models [75.29749026964154]
Ourmethodは、複数のベンチマークで平均的な攻撃成功率を4.41%に下げる。
クリーンな精度と実用性はオリジナルのモデルの0.5%以内に保存される。
防衛はさまざまな種類のバックドアをまたいで一般化し、実際のデプロイメントシナリオにおける堅牢性を確認します。
論文 参考訳(メタデータ) (2025-10-11T15:47:35Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - SCORE: Syntactic Code Representations for Static Script Malware Detection [9.502104012686491]
サーバーサイドスクリプトアタックはデータを盗み、資格を侵害し、操作を妨害する。
本稿では,静的スクリプトマルウェア検出のための特徴抽出と深層学習(DL)に基づくアプローチを提案する。
本手法は, 主要なシグネチャベースの抗ウイルスソリューションよりも最大81%高い陽性率(TPR)を達成する。
論文 参考訳(メタデータ) (2024-11-12T20:58:04Z) - Unveiling the Invisible: Detection and Evaluation of Prototype Pollution Gadgets with Dynamic Taint Analysis [4.8966278983718405]
本稿では、開発者がアプリケーションのソフトウェアサプライチェーンにあるガジェットを識別するのに役立つ最初の半自動パイプラインであるDastyを提案する。
DastyはサーバーサイドのNode.jsアプリケーションをターゲットにしており、動的テナント分析の強化に依存している。
私たちは、最も依存度の高いNPMパッケージの研究にDastyを使って、ACEにつながるガジェットの存在を分析します。
論文 参考訳(メタデータ) (2023-11-07T11:55:40Z) - ZeroLeak: Using LLMs for Scalable and Cost Effective Side-Channel
Patching [6.556868623811133]
セキュリティクリティカルなソフトウェア、例えばOpenSSLには、リソースや専門家が不足しているため、パッチが残っていないサイドチャネルのリークが多数含まれている。
マイクロアーキテクチャのサイドチャネルリークを伴う脆弱性コードに対するパッチ生成において,LLM(Large Language Models)の使用について検討する。
論文 参考訳(メタデータ) (2023-08-24T20:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。