Fugu-MT 論文翻訳(概要): InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution

論文の概要: InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution

arxiv url: http://arxiv.org/abs/2511.16005v1
Date: Thu, 20 Nov 2025 03:05:26 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-21 17:08:52.447697
Title: InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution
Title（参考訳）: InfCode-C++: C++問題解決のためのIntent-Guided Semantic RetrievalとAST-Structured Search
Authors: Qingao Dong, Mengfei Wang, Hengzhi Zhang, Zhichao Li, Yuan Yuan, Mu Li, Xiang Gao, Hailong Sun, Chunming Hu, Weifeng Lv,
Abstract要約: INFCODE-C++は、エンドツーエンドの課題解決のための最初のC++対応自律システムである。このシステムは、セマンティックコードインテント検索と決定論的AST構造化クエリという2つの補完的な検索メカニズムを組み合わせる。解像度は25.58%で、MSWEエージェントのパフォーマンスを倍増する10.85ポイントで最強の先行エージェントを上回っている。
参考スコア（独自算出の注目度）: 31.437457217953835
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language model (LLM) agents have recently shown strong performance on repository-level issue resolution, but existing systems are almost exclusively designed for Python and rely heavily on lexical retrieval and shallow code navigation. These approaches transfer poorly to C++ projects, where overloaded identifiers, nested namespaces, template instantiations, and deep control-flow structures make context retrieval and fault localization substantially more difficult. As a result, state-of-the-art Python-oriented agents show a drastic performance drop on the C++ subset of MultiSWE-bench. We introduce INFCODE-C++, the first C++-aware autonomous system for end-to-end issue resolution. The system combines two complementary retrieval mechanisms -- semantic code-intent retrieval and deterministic AST-structured querying -- to construct accurate, language-aware context for repair.These components enable precise localization and robust patch synthesis in large, statically typed C++ repositories. Evaluated on the \texttt{MultiSWE-bench-CPP} benchmark, INFCODE-C++ achieves a resolution rate of 25.58\%, outperforming the strongest prior agent by 10.85 percentage points and more than doubling the performance of MSWE-agent. Ablation and behavioral studies further demonstrate the critical role of semantic retrieval, structural analysis, and accurate reproduction in C++ issue resolution. INFCODE-C++ highlights the need for language-aware reasoning in multi-language software agents and establishes a foundation for future research on scalable, LLM-driven repair for complex, statically typed ecosystems.
Abstract（参考訳）: 大規模言語モデル(LLM)エージェントは、リポジトリレベルのイシュー解決に強いパフォーマンスを示しているが、既存のシステムはPython専用に設計されており、語彙検索と浅いコードナビゲーションに大きく依存している。これらのアプローチは、オーバーロードされた識別子、ネストされた名前空間、テンプレートのインスタンス化、深い制御フロー構造がコンテキスト検索とフォールトローカライゼーションをかなり難しくするC++プロジェクトへあまり移行しない。結果として、最先端のPython指向エージェントは、MultiSWE-benchのC++サブセットに劇的なパフォーマンス低下を示す。 INFCODE-C++は、エンドツーエンドの課題解決のための最初のC++対応自律システムである。このシステムは、セマンティックコードインテント検索と決定論的AST構造化クエリという2つの補完的な検索機構を組み合わせて、修復のための正確な言語対応コンテキストを構築し、これらのコンポーネントは、大規模で静的に型付けされたC++リポジトリにおいて、正確なローカライズと堅牢なパッチ合成を可能にする。 INFCODE-C++は、texttt{MultiSWE-bench-CPP}ベンチマークで評価され、25.58\%の解像度で、最強の先行エージェントを10.85ポイント上回り、MSWE-エージェントのパフォーマンスを倍増させる。アブレーションと行動学的研究は、C++問題解決における意味検索、構造解析、正確な再現の重要な役割を更に示している。 INFCODE-C++は、多言語ソフトウェアエージェントにおける言語対応推論の必要性を強調し、複雑な静的型付けされたエコシステムに対するスケーラブルでLLM駆動の修復に関する将来の研究の基礎を確立する。

関連論文リスト

Multi-CoLoR: Context-Aware Localization and Reasoning across Multi-Language Codebases [1.4216413758677147]
マルチ言語間におけるコンテキスト認識のローカライゼーションと推論のためのフレームワークであるMulti-CoLoRを提案する。複雑なソフトウェアエコシステムを横断するために、組織的知識検索とグラフベースの推論を統合する。
論文参考訳（メタデータ） (2026-02-23T00:54:59Z)
ATLAS: Automated Tree-based Language Analysis System for C and C++ source programs [1.0499611180329804]
本稿では,文レベル制御フローグラフ(CFG)と型認識データフローグラフ(DFG)を生成するPythonベースのコマンドラインインタフェース(CLI)であるATLASを紹介する。 ATLASは、下流のソフトウェアエンジニアリング(SE)と機械学習ベースのプログラム理解を改善するための実践的な基盤を提供する。
論文参考訳（メタデータ） (2025-12-14T01:11:11Z)
SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models [59.90381306452982]
ソフトウェアエンジニアリングのための大規模言語モデル(LLM)の評価は、タスクカバレッジの狭さ、言語バイアス、現実世界の開発者との整合性の不足によって制限されている。 SWE-1は、不均一なコード関連評価を構造化および生産整合性のあるフレームワークに統合する包括的なベンチマークである。 SWE-は8つのタスクタイプ、8つのプログラミングシナリオ、10のプログラミング言語にまたがる。
論文参考訳（メタデータ） (2025-11-07T18:01:32Z)
Comparative Analysis of the Code Generated by Popular Large Language Models (LLMs) for MISRA C++ Compliance [0.0]
安全クリティカルなシステムのソフトウェア開発には厳格なエンジニアリングプラクティスとアビオニクスのDO-178Cのような認定基準の遵守が必要です。 DO-178Cは、MISRA C++のようなよく定義されたソフトウェアコーディング標準に準拠する必要があるガイダンス文書である。 MISRA C++に準拠するために、人気のあるLLMが生成するC++コードの比較分析を行った。
論文参考訳（メタデータ） (2025-06-30T05:53:45Z)
The CodeInverter Suite: Control-Flow and Data-Mapping Augmented Binary Decompilation with LLMs [43.591384969171614]
バイナリ逆コンパイルを改善するためのCodeInverter Suiteを開発した。我々は、逆コンパイルを改善するために制御フローグラフと明示的なデータマッピングを使用します。我々のCIM-6.7Bは最先端の逆コンパイル性能を達成できる。
論文参考訳（メタデータ） (2025-03-10T11:52:48Z)
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models [58.45517851437422]
VsTP(Visually-situated text parsing)は、自動化された文書理解の需要が高まり、最近顕著な進歩を遂げている。既存のソリューションは、タスク固有のアーキテクチャと個々のタスクの目的に依存していることが多い。本稿では,テキストスポッティング,キー情報抽出,テーブル認識,レイアウト解析など,VsTPの典型的なタスクを統一する汎用モデルであるOmni V2を紹介する。
論文参考訳（メタデータ） (2025-02-22T09:32:01Z)
ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文参考訳（メタデータ） (2025-02-17T12:38:57Z)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。 LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。 LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳（メタデータ） (2023-10-30T17:55:02Z)
Adapting Language Models to Compress Contexts [71.98287002918941]
トランスフォーマーベースの言語モデル(LM)は強力で広く適用可能なツールであるが、その有用性は有限コンテキストウィンドウによって制限される。本稿では,事前学習したLMを,長いコンテキストをコンパクトな要約ベクトルに圧縮可能なAutoCompressorに適応させることを提案する。最大30,720個のトークンのシーケンスでOPTとLlama-2モデルを微調整し、AutoCompressorが長いコンテキストを使ってパープレキシティを向上できることを示す。
論文参考訳（メタデータ） (2023-05-24T06:42:44Z)
Beyond the C: Retargetable Decompilation using Neural Machine Translation [5.734661402742406]
我々は,新しい言語に容易に再ターゲティング可能なプロトタイプ・デコンパイラを開発した。トークン化やトレーニングデータ選択などのパラメータが逆コンパイルの品質に与える影響について検討する。トレーニングデータ、トレーニングされた逆コンパイルモデル、そして将来の言語に依存しない逆コンパイルの研究を促進するためのコードをリリースします。
論文参考訳（メタデータ） (2022-12-17T20:45:59Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。