論文の概要: CMind: An AI Agent for Localizing C Memory Bugs
- arxiv url: http://arxiv.org/abs/2601.14434v1
- Date: Tue, 20 Jan 2026 19:43:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.136697
- Title: CMind: An AI Agent for Localizing C Memory Bugs
- Title(参考訳): CMind: CメモリバグのローカライズのためのAIエージェント
- Authors: Chia-Yi Su, Collin McMillan,
- Abstract要約: 本稿では,Cメモリのバグをローカライズする人工知能エージェントであるCMindについて述べる。
ツールへの入力は、Cプログラムのソースコードと、問題を記述したバグレポートである。
CMindはバグレポートを読み、プログラムへの潜在的なエントリポイントを見つけ、プログラムのソースコードをナビゲートし、ソースコードを分析し、テンプレートに合った仮説の場所と合理性を生成する。
- 参考スコア(独自算出の注目度): 0.7448254811651417
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This demonstration paper presents CMind, an artificial intelligence agent for localizing C memory bugs. The novel aspect to CMind is that it follows steps that we observed human programmers perform during empirical study of those programmers finding memory bugs in C programs. The input to the tool is a C program's source code and a bug report describing the problem. The output is the tool's hypothesis about the reason for the bug and its location. CMind reads the bug report to find potential entry points to the program, then navigates the program's source code, analyzes that source code, and generates a hypothesis location and rationale that fit a template. The tool combines large language model reasoning with guided decision making we encoded to mimic human behavior. The video demonstration is available at https://youtu.be/_vVd0LRvVHI.
- Abstract(参考訳): 本稿では、Cメモリのバグをローカライズする人工知能エージェントであるCMindを紹介する。
CMindの新たな側面は、人間のプログラマがCプログラムでメモリのバグを見つける経験的な研究で実行するのを観察するステップに従うことである。
ツールへの入力は、Cプログラムのソースコードと、問題を記述したバグレポートである。
アウトプットは、バグの原因とその位置に関するツールの仮説である。
CMindはバグレポートを読み、プログラムへの潜在的なエントリポイントを見つけ、プログラムのソースコードをナビゲートし、ソースコードを分析し、テンプレートに合った仮説の場所と合理性を生成する。
このツールは、大きな言語モデル推論と、人間の振る舞いを模倣するためにエンコードしたガイド付き意思決定を組み合わせる。
ビデオデモはhttps://youtu.be/_vVd0LRvVHIで公開されている。
関連論文リスト
- BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - Human Attention During Localization of Memory Bugs in C Programs [2.879858918002325]
本稿では,C言語における記憶障害の局所化における人間の視覚的注意に関する研究について述べる。
私たちは11人のプログラマを募集し、3つのCプログラムの1~6つのメモリバグをそれぞれ1.5~2時間見つけました。
私たちの研究のバグは、メモリリーク、オーバーフロー、ダブルフリーをカバーしています。
論文 参考訳(メタデータ) (2025-05-31T19:56:16Z) - VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文 参考訳(メタデータ) (2024-06-19T11:09:16Z) - What is a "bug"? On subjectivity, epistemic power, and implications for
software research [8.116831482130555]
バグ」は少なくとも1870年代からの工学的「欠陥」の口語である。
現代のソフトウェア指向の定義のほとんどは、開発者が意図したものと、プログラムが実際に何をするかを区別するものである。
バグをファインディングするのは簡単だ" と最初に言うのは,“バグパターンはしばしばエラーとなるコード”だ。
論文 参考訳(メタデータ) (2024-02-13T01:52:42Z) - GWP-ASan: Sampling-Based Detection of Memory-Safety Bugs in Production [30.534320345970286]
Heap-use-after-freeとheap-buffer-overflowのバグは、CやC++で記述されたアプリケーションのセキュリティ、信頼性、開発者の生産性の主要な問題である。
本稿では,この2種類のメモリセーフなバグを実運用環境でほぼゼロのオーバーヘッドで検出するツール群について述べる。
論文 参考訳(メタデータ) (2023-11-15T21:41:53Z) - Fault-Aware Neural Code Rankers [64.41888054066861]
サンプルプログラムの正しさを予測できる故障認識型ニューラルネットワークローダを提案する。
我々のフォールト・アウェア・ローダは、様々なコード生成モデルのpass@1精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-06-04T22:01:05Z) - Explanation-Based Human Debugging of NLP Models: A Survey [15.115037763351003]
この問題を説明ベースのヒューマンデバッグ(EBHD)と呼ぶ。
特に、EBHDの3つの主次元に沿った既存の作品の分類と議論を行う。
論文 参考訳(メタデータ) (2021-04-30T17:53:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。