論文の概要: InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution
- arxiv url: http://arxiv.org/abs/2511.16005v1
- Date: Thu, 20 Nov 2025 03:05:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.447697
- Title: InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution
- Title(参考訳): InfCode-C++: C++問題解決のためのIntent-Guided Semantic RetrievalとAST-Structured Search
- Authors: Qingao Dong, Mengfei Wang, Hengzhi Zhang, Zhichao Li, Yuan Yuan, Mu Li, Xiang Gao, Hailong Sun, Chunming Hu, Weifeng Lv,
- Abstract要約: INFCODE-C++は、エンドツーエンドの課題解決のための最初のC++対応自律システムである。
このシステムは、セマンティックコードインテント検索と決定論的AST構造化クエリという2つの補完的な検索メカニズムを組み合わせる。
解像度は25.58%で、MSWEエージェントのパフォーマンスを倍増する10.85ポイントで最強の先行エージェントを上回っている。
- 参考スコア(独自算出の注目度): 31.437457217953835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents have recently shown strong performance on repository-level issue resolution, but existing systems are almost exclusively designed for Python and rely heavily on lexical retrieval and shallow code navigation. These approaches transfer poorly to C++ projects, where overloaded identifiers, nested namespaces, template instantiations, and deep control-flow structures make context retrieval and fault localization substantially more difficult. As a result, state-of-the-art Python-oriented agents show a drastic performance drop on the C++ subset of MultiSWE-bench. We introduce INFCODE-C++, the first C++-aware autonomous system for end-to-end issue resolution. The system combines two complementary retrieval mechanisms -- semantic code-intent retrieval and deterministic AST-structured querying -- to construct accurate, language-aware context for repair.These components enable precise localization and robust patch synthesis in large, statically typed C++ repositories. Evaluated on the \texttt{MultiSWE-bench-CPP} benchmark, INFCODE-C++ achieves a resolution rate of 25.58\%, outperforming the strongest prior agent by 10.85 percentage points and more than doubling the performance of MSWE-agent. Ablation and behavioral studies further demonstrate the critical role of semantic retrieval, structural analysis, and accurate reproduction in C++ issue resolution. INFCODE-C++ highlights the need for language-aware reasoning in multi-language software agents and establishes a foundation for future research on scalable, LLM-driven repair for complex, statically typed ecosystems.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、リポジトリレベルのイシュー解決に強いパフォーマンスを示しているが、既存のシステムはPython専用に設計されており、語彙検索と浅いコードナビゲーションに大きく依存している。
これらのアプローチは、オーバーロードされた識別子、ネストされた名前空間、テンプレートのインスタンス化、深い制御フロー構造がコンテキスト検索とフォールトローカライゼーションをかなり難しくするC++プロジェクトへあまり移行しない。
結果として、最先端のPython指向エージェントは、MultiSWE-benchのC++サブセットに劇的なパフォーマンス低下を示す。
INFCODE-C++は、エンドツーエンドの課題解決のための最初のC++対応自律システムである。
このシステムは、セマンティックコードインテント検索と決定論的AST構造化クエリという2つの補完的な検索機構を組み合わせて、修復のための正確な言語対応コンテキストを構築し、これらのコンポーネントは、大規模で静的に型付けされたC++リポジトリにおいて、正確なローカライズと堅牢なパッチ合成を可能にする。
INFCODE-C++は、texttt{MultiSWE-bench-CPP}ベンチマークで評価され、25.58\%の解像度で、最強の先行エージェントを10.85ポイント上回り、MSWE-エージェントのパフォーマンスを倍増させる。
アブレーションと行動学的研究は、C++問題解決における意味検索、構造解析、正確な再現の重要な役割を更に示している。
INFCODE-C++は、多言語ソフトウェアエージェントにおける言語対応推論の必要性を強調し、複雑な静的型付けされたエコシステムに対するスケーラブルでLLM駆動の修復に関する将来の研究の基礎を確立する。
関連論文リスト
- SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models [59.90381306452982]
ソフトウェアエンジニアリングのための大規模言語モデル(LLM)の評価は、タスクカバレッジの狭さ、言語バイアス、現実世界の開発者との整合性の不足によって制限されている。
SWE-1は、不均一なコード関連評価を構造化および生産整合性のあるフレームワークに統合する包括的なベンチマークである。
SWE-は8つのタスクタイプ、8つのプログラミングシナリオ、10のプログラミング言語にまたがる。
論文 参考訳(メタデータ) (2025-11-07T18:01:32Z) - Comparative Analysis of the Code Generated by Popular Large Language Models (LLMs) for MISRA C++ Compliance [0.0]
安全クリティカルなシステムのソフトウェア開発には厳格なエンジニアリングプラクティスとアビオニクスのDO-178Cのような認定基準の遵守が必要です。
DO-178Cは、MISRA C++のようなよく定義されたソフトウェアコーディング標準に準拠する必要があるガイダンス文書である。
MISRA C++に準拠するために、人気のあるLLMが生成するC++コードの比較分析を行った。
論文 参考訳(メタデータ) (2025-06-30T05:53:45Z) - The CodeInverter Suite: Control-Flow and Data-Mapping Augmented Binary Decompilation with LLMs [43.591384969171614]
バイナリ逆コンパイルを改善するためのCodeInverter Suiteを開発した。
我々は、逆コンパイルを改善するために制御フローグラフと明示的なデータマッピングを使用します。
我々のCIM-6.7Bは最先端の逆コンパイル性能を達成できる。
論文 参考訳(メタデータ) (2025-03-10T11:52:48Z) - OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models [58.45517851437422]
VsTP(Visually-situated text parsing)は、自動化された文書理解の需要が高まり、最近顕著な進歩を遂げている。
既存のソリューションは、タスク固有のアーキテクチャと個々のタスクの目的に依存していることが多い。
本稿では,テキストスポッティング,キー情報抽出,テーブル認識,レイアウト解析など,VsTPの典型的なタスクを統一する汎用モデルであるOmni V2を紹介する。
論文 参考訳(メタデータ) (2025-02-22T09:32:01Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - Adapting Language Models to Compress Contexts [71.98287002918941]
トランスフォーマーベースの言語モデル(LM)は強力で広く適用可能なツールであるが、その有用性は有限コンテキストウィンドウによって制限される。
本稿では,事前学習したLMを,長いコンテキストをコンパクトな要約ベクトルに圧縮可能なAutoCompressorに適応させることを提案する。
最大30,720個のトークンのシーケンスでOPTとLlama-2モデルを微調整し、AutoCompressorが長いコンテキストを使ってパープレキシティを向上できることを示す。
論文 参考訳(メタデータ) (2023-05-24T06:42:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。