論文の概要: LLM-Enabled Open-Source Systems in the Wild: An Empirical Study of Vulnerabilities in GitHub Security Advisories
- arxiv url: http://arxiv.org/abs/2604.04288v1
- Date: Sun, 05 Apr 2026 22:07:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.025733
- Title: LLM-Enabled Open-Source Systems in the Wild: An Empirical Study of Vulnerabilities in GitHub Security Advisories
- Title(参考訳): LLM対応のオープンソースシステム: GitHubのセキュリティアドバイザリにおける脆弱性に関する実証的研究
- Authors: Fariha Tanjim Shifat, Hariswar Baburaj, Ce Zhou, Jaydeb Sarker, Mia Mohammad Imran,
- Abstract要約: 私たちは2025年1月から2026年1月までに発行された295のGitHub Security Advisoriesを分析します。
LLMシステムに特有の新しい実装レベルの弱点の証拠は見つからない。
ほとんどのアドバイザリは、確立されたCWE、特にインジェクションとデナイゼーションの弱点にマップする。
- 参考スコア(独自算出の注目度): 3.1744585256350053
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly embedded in open-source software (OSS) ecosystems, creating complex interactions among natural language prompts, probabilistic model outputs, and execution-capable components. However, it remains unclear whether traditional vulnerability disclosure frameworks adequately capture these model-mediated risks. To investigate this, we analyze 295 GitHub Security Advisories published between January 2025 and January 2026 that reference LLM-related components, and we manually annotate a sample of 100 advisories using the OWASP Top 10 for LLM Applications 2025. We find no evidence of new implementation-level weakness classes specific to LLM systems. Most advisories map to established CWEs, particularly injection and deserialization weaknesses. At the same time, the OWASP-based analysis reveals recurring architectural risk patterns, especially Supply Chain, Excessive Agency, and Prompt Injection, which often co-occur across multiple stages of execution. These results suggest that existing advisory metadata captures code-level defects but underrepresents model-mediated exposure. We conclude that combining the CWE and OWASP perspectives provides a more complete and necessary view of vulnerabilities in LLM-integrated systems.
- Abstract(参考訳): 大規模言語モデル(LLM)は、オープンソースソフトウェア(OSS)エコシステムにますます組み込まれており、自然言語プロンプト、確率モデル出力、実行可能なコンポーネント間の複雑な相互作用を生み出している。
しかし、従来の脆弱性開示フレームワークがこれらのモデルによるリスクを適切に捉えているかどうかは不明だ。
これを調べるために、2025年1月から2026年1月までに公開された295のGitHub Security Advisoriesを分析し、LLMアプリケーション2025用のOWASP Top 10を使用して、100のアドバイザのサンプルを手動で注釈付けしました。
LLMシステムに特有の新しい実装レベルの弱点の証拠は見つからない。
ほとんどのアドバイザリは、確立されたCWE、特に注入とデシリアライゼーションの弱点にマップする。
同時にOWASPベースの分析では、特にサプライチェーン、エクスシッシブエージェンシー(Excessive Agency)、プロンプトインジェクション(Prompt Injection)といった、繰り返し発生するアーキテクチャ上のリスクパターンが明らかになった。
これらの結果は、既存のアドバイザリメタデータがコードレベルの欠陥をキャプチャするが、モデルによる露出を過小に表現していることを示唆している。
我々は、CWEとOWASPの観点を組み合わせることで、LLM統合システムにおける脆弱性をより完全かつ必要とみなすことができると結論付けた。
関連論文リスト
- An Empirical Evaluation of LLM-Based Approaches for Code Vulnerability Detection: RAG, SFT, and Dual-Agent Systems [1.5216960763930782]
LLM(Large Language Models)の急速な進歩は、自動ソフトウェア脆弱性検出の新しい機会を提供する。
本稿では,ソフトウェア脆弱性検出のためのLLM技術の有効性について比較検討する。
論文 参考訳(メタデータ) (2026-01-01T08:05:51Z) - Odysseus: Jailbreaking Commercial Multimodal LLM-integrated Systems via Dual Steganography [77.44136793431893]
本稿では,悪質なクエリを隠蔽して良質な画像に埋め込むために,二重ステガノグラフィーを導入した新しいjailbreakパラダイムを提案する。
我々のOdysseusはいくつかの先駆的で現実的なMLLM統合システムを脱獄し、最大99%の攻撃成功率を達成した。
論文 参考訳(メタデータ) (2025-12-23T08:53:36Z) - Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.482522010482827]
本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。
本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。
これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。
パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文 参考訳(メタデータ) (2025-09-28T19:16:12Z) - An Empirical Study of Vulnerable Package Dependencies in LLM Repositories [14.817045028745563]
大型言語モデル(LLM)はパッケージ管理システムからの外部コード依存に依存している。
依存関係の脆弱性は、LSMをセキュリティリスクに晒すことができる。
LLMエコシステムの脆弱性の半分は56.2ヶ月以上も公表されていない。
論文 参考訳(メタデータ) (2025-08-29T08:38:58Z) - Understanding the Supply Chain and Risks of Large Language Model Applications [25.571274158366563]
本稿では,LLM(Large Language Models)サプライチェーンセキュリティの分析とベンチマークを行うための,最初の包括的なデータセットを紹介する。
実世界のLLMアプリケーション3,859件を収集し,相互依存解析を行い,109,211モデル,2,474データセット,9,862ライブラリを同定した。
以上の結果から,LLMアプリケーションへの依存性が深く,サプライチェーン全体の重大な脆弱性が指摘され,包括的セキュリティ分析の必要性が浮き彫りになった。
論文 参考訳(メタデータ) (2025-07-24T05:30:54Z) - Unveiling the Landscape of LLM Deployment in the Wild: An Empirical Study [7.5198516000202105]
大規模言語モデル(LLM)は、オープンソースおよび商用フレームワークを通じてますますデプロイされている。
LLMのデプロイメントが特に業界で普及するにつれて、安全で信頼性の高い運用が重要な問題になっている。
安全でないデフォルトと設定ミスはしばしばLLMサービスを公開インターネットに公開し、重大なセキュリティとシステムエンジニアリングのリスクを生じさせる。
論文 参考訳(メタデータ) (2025-05-05T09:30:19Z) - Exploring Automatic Cryptographic API Misuse Detection in the Era of LLMs [60.32717556756674]
本稿では,暗号誤用の検出において,大規模言語モデルを評価するための体系的評価フレームワークを提案する。
11,940個のLCM生成レポートを詳細に分析したところ、LSMに固有の不安定性は、報告の半数以上が偽陽性になる可能性があることがわかった。
最適化されたアプローチは、従来の手法を超え、確立されたベンチマークでこれまで知られていなかった誤用を明らかにすることで、90%近い顕著な検出率を達成する。
論文 参考訳(メタデータ) (2024-07-23T15:31:26Z) - OR-Bench: An Over-Refusal Benchmark for Large Language Models [65.34666117785179]
大きな言語モデル(LLM)は、悪意のある出力を防ぐために慎重に安全アライメントを必要とする。
本研究では,大規模なオーバーリファレンスデータセットの自動生成手法を提案する。
OR-Benchは,最初の大規模オーバーリファレンスベンチマークである。
論文 参考訳(メタデータ) (2024-05-31T15:44:33Z) - Unveiling the Misuse Potential of Base Large Language Models via In-Context Learning [61.2224355547598]
大規模言語モデル(LLM)のオープンソース化は、アプリケーション開発、イノベーション、科学的進歩を加速させる。
我々の調査は、この信念に対する重大な監視を露呈している。
我々の研究は、慎重に設計されたデモを配置することにより、ベースLSMが悪意のある命令を効果的に解釈し実行できることを実証する。
論文 参考訳(メタデータ) (2024-04-16T13:22:54Z) - Not what you've signed up for: Compromising Real-World LLM-Integrated
Applications with Indirect Prompt Injection [64.67495502772866]
大規模言語モデル(LLM)は、様々なアプリケーションに統合されつつある。
本稿では、プロンプトインジェクション攻撃を用いて、攻撃者が元の命令をオーバーライドし、制御を採用する方法を示す。
我々は、コンピュータセキュリティの観点から、影響や脆弱性を体系的に調査する包括的な分類法を導出する。
論文 参考訳(メタデータ) (2023-02-23T17:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。