論文の概要: CMind: An AI Agent for Localizing C Memory Bugs
- arxiv url: http://arxiv.org/abs/2601.14434v1
- Date: Tue, 20 Jan 2026 19:43:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.136697
- Title: CMind: An AI Agent for Localizing C Memory Bugs
- Title(参考訳): CMind: CメモリバグのローカライズのためのAIエージェント
- Authors: Chia-Yi Su, Collin McMillan,
- Abstract要約: 本稿では,Cメモリのバグをローカライズする人工知能エージェントであるCMindについて述べる。
ツールへの入力は、Cプログラムのソースコードと、問題を記述したバグレポートである。
CMindはバグレポートを読み、プログラムへの潜在的なエントリポイントを見つけ、プログラムのソースコードをナビゲートし、ソースコードを分析し、テンプレートに合った仮説の場所と合理性を生成する。
- 参考スコア(独自算出の注目度): 0.7448254811651417
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This demonstration paper presents CMind, an artificial intelligence agent for localizing C memory bugs. The novel aspect to CMind is that it follows steps that we observed human programmers perform during empirical study of those programmers finding memory bugs in C programs. The input to the tool is a C program's source code and a bug report describing the problem. The output is the tool's hypothesis about the reason for the bug and its location. CMind reads the bug report to find potential entry points to the program, then navigates the program's source code, analyzes that source code, and generates a hypothesis location and rationale that fit a template. The tool combines large language model reasoning with guided decision making we encoded to mimic human behavior. The video demonstration is available at https://youtu.be/_vVd0LRvVHI.
- Abstract(参考訳): 本稿では、Cメモリのバグをローカライズする人工知能エージェントであるCMindを紹介する。
CMindの新たな側面は、人間のプログラマがCプログラムでメモリのバグを見つける経験的な研究で実行するのを観察するステップに従うことである。
ツールへの入力は、Cプログラムのソースコードと、問題を記述したバグレポートである。
アウトプットは、バグの原因とその位置に関するツールの仮説である。
CMindはバグレポートを読み、プログラムへの潜在的なエントリポイントを見つけ、プログラムのソースコードをナビゲートし、ソースコードを分析し、テンプレートに合った仮説の場所と合理性を生成する。
このツールは、大きな言語モデル推論と、人間の振る舞いを模倣するためにエンコードしたガイド付き意思決定を組み合わせる。
ビデオデモはhttps://youtu.be/_vVd0LRvVHIで公開されている。
関連論文リスト
- BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - Do AI models help produce verified bug fixes? [62.985237003585674]
大規模言語モデルは、ソフトウェアバグの修正に使用される。
本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。
その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文 参考訳(メタデータ) (2025-07-21T17:30:16Z) - Human Attention During Localization of Memory Bugs in C Programs [2.879858918002325]
本稿では,C言語における記憶障害の局所化における人間の視覚的注意に関する研究について述べる。
私たちは11人のプログラマを募集し、3つのCプログラムの1~6つのメモリバグをそれぞれ1.5~2時間見つけました。
私たちの研究のバグは、メモリリーク、オーバーフロー、ダブルフリーをカバーしています。
論文 参考訳(メタデータ) (2025-05-31T19:56:16Z) - VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文 参考訳(メタデータ) (2024-06-19T11:09:16Z) - What is a "bug"? On subjectivity, epistemic power, and implications for
software research [8.116831482130555]
バグ」は少なくとも1870年代からの工学的「欠陥」の口語である。
現代のソフトウェア指向の定義のほとんどは、開発者が意図したものと、プログラムが実際に何をするかを区別するものである。
バグをファインディングするのは簡単だ" と最初に言うのは,“バグパターンはしばしばエラーとなるコード”だ。
論文 参考訳(メタデータ) (2024-02-13T01:52:42Z) - GWP-ASan: Sampling-Based Detection of Memory-Safety Bugs in Production [30.534320345970286]
Heap-use-after-freeとheap-buffer-overflowのバグは、CやC++で記述されたアプリケーションのセキュリティ、信頼性、開発者の生産性の主要な問題である。
本稿では,この2種類のメモリセーフなバグを実運用環境でほぼゼロのオーバーヘッドで検出するツール群について述べる。
論文 参考訳(メタデータ) (2023-11-15T21:41:53Z) - Dcc --help: Generating Context-Aware Compiler Error Explanations with
Large Language Models [53.04357141450459]
dcc --helpはCS1とCS2のコースにデプロイされ、2565人の学生が10週間で64,000回以上このツールを使っている。
LLMが生成した説明は、コンパイル時間の90%と実行時の75%で概念的に正確であるが、コードに解決策を提供しない命令を無視することが多かった。
論文 参考訳(メタデータ) (2023-08-23T02:36:19Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - Fault-Aware Neural Code Rankers [64.41888054066861]
サンプルプログラムの正しさを予測できる故障認識型ニューラルネットワークローダを提案する。
我々のフォールト・アウェア・ローダは、様々なコード生成モデルのpass@1精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-06-04T22:01:05Z) - Explanation-Based Human Debugging of NLP Models: A Survey [15.115037763351003]
この問題を説明ベースのヒューマンデバッグ(EBHD)と呼ぶ。
特に、EBHDの3つの主次元に沿った既存の作品の分類と議論を行う。
論文 参考訳(メタデータ) (2021-04-30T17:53:07Z) - Predicting Vulnerability In Large Codebases With Deep Code
Representation [6.357681017646283]
ソフトウェアエンジニアは様々なモジュールのコードを書きます。
過去に(異なるモジュールで)修正された同様の問題やバグも、本番コードで再び導入される傾向にある。
ソースコードから生成した抽象構文木(AST)の深部表現とアクティブフィードバックループを用いた,AIに基づく新しいシステムを開発した。
論文 参考訳(メタデータ) (2020-04-24T13:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。