論文の概要: Bridging Code Property Graphs and Language Models for Program Analysis
- arxiv url: http://arxiv.org/abs/2603.24837v1
- Date: Wed, 25 Mar 2026 22:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.001215
- Title: Bridging Code Property Graphs and Language Models for Program Analysis
- Title(参考訳): プログラム解析のためのコードプロパティグラフと言語モデルの作成
- Authors: Ahmed Lekssays,
- Abstract要約: 大規模言語モデル(LLM)は、現実世界のセキュリティ脆弱性を分析する上で、重大な課題に直面します。
トークン制限はレポジトリ全体をロードすることを防ぎ、コード埋め込みはプロシージャ間データフローのキャプチャに失敗し、LLMは複雑な静的解析クエリを生成するのに苦労する。
我々は,Joern の Code Property Graph エンジンと LLM を統合した,オープンソースの Model Context Protocol (MCP) サーバである codebadger を紹介する。
- 参考スコア(独自算出の注目度): 1.7158296436650338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) face critical challenges when analyzing security vulnerabilities in real world codebases: token limits prevent loading entire repositories, code embeddings fail to capture inter procedural data flows, and LLMs struggle to generate complex static analysis queries. These limitations force existing approaches to operate on isolated code snippets, missing vulnerabilities that span multiple functions and files. We introduce codebadger, an open source Model Context Protocol (MCP) server that integrates Joern's Code Property Graph (CPG) engine with LLMs. Rather than requiring LLMs to generate complex CPG queries, codebadger provides high level tools for program slicing, taint tracking, data flow analysis, and semantic code navigation, enabling targeted exploration of large codebases without exhaustive file reading. We demonstrate its effectiveness through three use cases: (1) navigating an 8,000 method codebase to audit memory safety patterns, (2) discovering and exploiting a previously unreported buffer overflow in libtiff, and (3) generating a correct patch for an integer overflow vulnerability (CVE-2025-6021) in libxml2 on the first attempt. codebadger enables LLMs to reason about code semantically across entire repositories, supporting vulnerability discovery, patching, and program comprehension at scale.
- Abstract(参考訳): 大きな言語モデル(LLM)は、現実のコードベースでセキュリティ上の脆弱性を分析する上で、重要な課題に直面している。トークン制限はリポジトリ全体のロードを妨げ、コード埋め込みは手続き間データフローをキャプチャできない、LCMは複雑な静的解析クエリを生成するのに苦労する。
これらの制限により、既存のアプローチでは、複数の関数やファイルにまたがる脆弱性の欠如により、分離されたコードスニペットを運用せざるを得なくなった。
我々は,Joern の Code Property Graph (CPG) エンジンと LLM を統合した,オープンソースの Model Context Protocol (MCP) サーバである codebadger を紹介する。
複雑な CPG クエリを生成するために LLM を必要とするのではなく、codebadger はプログラムスライシング、テナント追跡、データフロー分析、セマンティックコードナビゲーションのための高レベルなツールを提供する。
1)メモリ安全性パターンを監査するために8,000メソッドのコードベースをナビゲートし、(2) libtiffで未報告のバッファオーバーフローを発見し、活用し、(3) libxml2で整数オーバーフロー脆弱性(CVE-2025-6021)に対する正しいパッチを生成する。
Codebadgerは、LLMがリポジトリ全体にわたってセマンティックにコードを推論し、脆弱性発見、パッチ、大規模プログラムの理解をサポートする。
関連論文リスト
- RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Improving LLM-Assisted Secure Code Generation through Retrieval-Augmented-Generation and Multi-Tool Feedback [1.1017250479834206]
大きな言語モデル(LLM)はコードを生成することができるが、セキュリティ上の脆弱性、論理的不整合、コンパイルエラーをしばしば導入する。
本稿では,1つのコード生成LLMが反復的に出力を洗練する検索拡張型マルチツール修復ワークフローを提案する。
論文 参考訳(メタデータ) (2026-01-01T23:34:00Z) - LLM-GUARD: Large Language Model-Based Detection and Repair of Bugs and Security Vulnerabilities in C++ and Python [0.0]
ChatGPT-4、Claude 3、LLaMA 4のような大規模言語モデル(LLM)は、ソフトウェア/アプリケーション開発にますます組み込まれている。
本研究では,プログラムエラー,古典的セキュリティ欠陥,およびC++とPythonの高度なプロダクショングレードバグのベンチマークを用いて,これら3つの主要なLCMの体系的,実証的な評価を行う。
論文 参考訳(メタデータ) (2025-08-22T14:30:24Z) - IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。
この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。
バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文 参考訳(メタデータ) (2025-06-24T13:42:59Z) - HexaCoder: Secure Code Generation via Oracle-Guided Synthetic Training Data [60.75578581719921]
大規模言語モデル(LLM)は、自動コード生成に大きな可能性を示している。
最近の研究は、多くのLLM生成コードが深刻なセキュリティ脆弱性を含んでいることを強調している。
我々は,LLMがセキュアなコードを生成する能力を高めるための新しいアプローチであるHexaCoderを紹介する。
論文 参考訳(メタデータ) (2024-09-10T12:01:43Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - Can LLMs Patch Security Issues? [1.3299507495084417]
LLM(Large Language Models)は、コード生成に優れた習熟度を示している。
LLMは人間と弱点を共有している。
我々は、LLMが生成した脆弱性のあるコードを自動的に洗練するフィードバック駆動セキュリティパッチング(FDSP)を提案する。
論文 参考訳(メタデータ) (2023-11-13T08:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。