論文の概要: The Code Whisperer: LLM and Graph-Based AI for Smell and Vulnerability Resolution
- arxiv url: http://arxiv.org/abs/2604.13114v1
- Date: Sun, 12 Apr 2026 20:10:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.204997
- Title: The Code Whisperer: LLM and Graph-Based AI for Smell and Vulnerability Resolution
- Title(参考訳): Code Whisperer: Smellと脆弱性解決のためのLLMとグラフベースのAI
- Authors: Mohammad Baqar, Raji Rustamov, Alexander Hughes,
- Abstract要約: Code Whispererは、グラフベースのプログラム分析と大きな言語モデルを組み合わせて、保守性とセキュリティの問題を検出し、説明し、修復するハイブリッドフレームワークである。
このフレームワークを多言語データセット上で評価し,ルールベースアナライザや単一モデルベースラインと比較する。
- 参考スコア(独自算出の注目度): 42.25743513043402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code smells and software vulnerabilities both increase maintenance cost, yet they are often handled by separate tools that miss structural context and produce noisy warnings. This paper presents The Code Whisperer, a hybrid framework that combines graph-based program analysis with large language models to detect, explain, and repair maintainability and security issues within a unified workflow. The method aligns Abstract Syntax Trees (ASTs), Control Flow Graphs (CFGs), Program Dependency Graphs (PDGs), and token-level code embeddings so that structural and semantic signals can be learned jointly. We evaluate the framework on multi-language datasets and compare it with rule-based analyzers and single-model baselines. The results indicate that the hybrid design improves detection performance and produces more useful repair suggestions than either graph-only or language-model-only approaches. We also examine explainability and CI/CD integration as practical requirements for adopting AI-assisted code review in everyday software engineering workflows.
- Abstract(参考訳): コードの臭いとソフトウェア脆弱性はどちらもメンテナンスコストを増大させるが、構造的コンテキストを見逃し、ノイズの多い警告を発生させる別のツールによって処理されることが多い。
本稿では,グラフベースのプログラム分析と大規模言語モデルを組み合わせたハイブリッドフレームワークであるThe Code Whispererを提案する。
この手法は、抽象構文木(AST)、制御フローグラフ(CFG)、プログラム依存グラフ(PDG)、トークンレベルのコード埋め込みを整列させ、構造的および意味的な信号を共同で学習できるようにする。
このフレームワークを多言語データセット上で評価し,ルールベースアナライザや単一モデルベースラインと比較する。
その結果,ハイブリッド設計により検出性能が向上し,グラフのみあるいは言語のみのアプローチよりも有用な補修提案が得られた。
また、AI支援コードレビューを日々のソフトウェアエンジニアリングワークフローに適用するための実践的な要件として、説明可能性とCI/CD統合についても検討する。
関連論文リスト
- A Causal Perspective on Measuring, Explaining and Mitigating Smells in LLM-Generated Code [49.09545217453401]
Propensity Smelly Score (PSC) は、特定の臭いの種類を生成する確率を推定する計量である。
我々は、生成戦略、モデルサイズ、モデルアーキテクチャ、および生成したコードの構造特性をいかに形成するかを識別する。
PSCは、開発者がモデルの振る舞いを解釈し、コード品質を評価するのに役立つ。
論文 参考訳(メタデータ) (2025-11-19T19:18:28Z) - Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむ
これは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。
既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。
我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文 参考訳(メタデータ) (2025-09-25T06:48:52Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - CoRe: Benchmarking LLMs Code Reasoning Capabilities through Static Analysis Tasks [14.408364047538578]
大規模言語モデル(LLM)は、ソフトウェア工学の様々な領域で広く採用されている。
この研究は、基本的な静的解析タスク上でのLCMを評価するために設計されたベンチマークであるCOREを提示する。
論文 参考訳(メタデータ) (2025-07-03T01:35:58Z) - Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - CGP-Tuning: Structure-Aware Soft Prompt Tuning for Code Vulnerability Detection [15.013699967804987]
本稿では,脆弱性検出のためのCGP-Tuningを提案する。
CGP-Tuningでは、コードグラフ内のリッチなセマンティック情報をキャプチャするための型認識埋め込みと、効率的なクロスモーダルアライメントモジュールが導入されている。
最新のDiverseVulデータセットと3つの高度なオープンソースコードLLM、CodeLlama、CodeGemma、Qwen2.5-Coderで評価されている。
論文 参考訳(メタデータ) (2025-01-08T13:56:17Z) - AI Chain on Large Language Model for Unsupervised Control Flow Graph
Generation for Statically-Typed Partial Code [21.423928174875844]
制御フローグラフ(CFG)は、プログラムの振る舞いを可視化、理解、分析するために不可欠である。
本稿では,事前学習された大規模言語モデル(LLM)の誤り耐性と理解能力を活用してCFGを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T14:52:59Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。