論文の概要: Autonomous Issue Resolver: Towards Zero-Touch Code Maintenance
- arxiv url: http://arxiv.org/abs/2512.08492v1
- Date: Tue, 09 Dec 2025 11:11:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.932293
- Title: Autonomous Issue Resolver: Towards Zero-Touch Code Maintenance
- Title(参考訳): 自律的なイシューリゾルバ - ゼロタッチコードのメンテナンスを目指す
- Authors: Aliaksei Kaliutau,
- Abstract要約: 標準コードプロパティグラフからデータ変換グラフ(DTG)の概念へのパラダイムシフトを提案する。
本稿では,データ整合性ナビゲーションを制御フロー論理で整合するマルチエージェントフレームワークを提案する。
我々の手法はいくつかのSWEベンチマークで良い結果を示し、解像度は87.1%に達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in Large Language Models have revolutionized function-level code generation; however, repository-scale Automated Program Repair (APR) remains a significant challenge. Current approaches typically employ a control-centric paradigm, forcing agents to navigate complex directory structures and irrelevant control logic. In this paper, we propose a paradigm shift from the standard Code Property Graphs (CPGs) to the concept of Data Transformation Graph (DTG) that inverts the topology by modeling data states as nodes and functions as edges, enabling agents to trace logic defects through data lineage rather than control flow. We introduce a multi-agent framework that reconciles data integrity navigation with control flow logic. Our theoretical analysis and case studies demonstrate that this approach resolves the "Semantic Trap" inherent in standard RAG systems in modern coding agents. We provide a comprehensive implementation in the form of Autonomous Issue Resolver (AIR), a self-improvement system for zero-touch code maintenance that utilizes neuro-symbolic reasoning and uses the DTG structure for scalable logic repair. Our approach has demonstrated good results on several SWE benchmarks, reaching a resolution rate of 87.1% on SWE-Verified benchmark. Our approach directly addresses the core limitations of current AI code-assistant tools and tackles the critical need for a more robust foundation for our increasingly software-dependent world.
- Abstract(参考訳): 大規模言語モデルの最近の進歩は機能レベルのコード生成に革命をもたらしたが、リポジトリスケールの自動プログラム修復(APR)は依然として大きな課題である。
現在のアプローチでは一般的にコントロール中心のパラダイムを採用しており、エージェントは複雑なディレクトリ構造と無関係な制御ロジックをナビゲートせざるを得ない。
本稿では,標準のコードプロパティグラフ(CPG)からデータ変換グラフ(DTG)へのパラダイムシフトを提案し,データ状態をノードとして,関数をエッジとしてモデル化することでトポロジを逆転させる。
本稿では,データ整合性ナビゲーションを制御フロー論理で整合するマルチエージェントフレームワークを提案する。
我々の理論的解析とケーススタディは、現代の符号化エージェントにおける標準RAGシステムに固有の「意味的トラップ」を解くことを実証している。
本稿では,自律的問題解決システム(AIR)の形式で包括的な実装を提供する。これは,ニューロシンボリック推論を利用して,スケーラブルな論理修復にDTG構造を用いるゼロタッチコードメンテナンスのための自己改善システムである。
提案手法はいくつかのSWEベンチマークにおいて良好な結果を示し,SWE-Verifiedベンチマークでは87.1%の解像度に達した。
私たちのアプローチは、現在のAIコードアシストツールの中核的な制限に直接対処し、ますますソフトウェアに依存している世界のためのより堅牢な基盤に対する重要なニーズに対処します。
関連論文リスト
- From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning [65.20602712957725]
Cacoは、高品質で検証可能な多様な命令-CoT推論データの合成を自動化する新しいフレームワークである。
我々の研究は、人間の介入なしに自己持続的で信頼できる推論システムを構築するためのパラダイムを確立します。
論文 参考訳(メタデータ) (2025-10-05T07:59:24Z) - RationAnomaly: Log Anomaly Detection with Rationality via Chain-of-Thought and Reinforcement Learning [27.235259453535537]
RationAnomalyは、Chain-of-Thoughtファインチューニングと強化学習を相乗化することにより、ログの異常検出を強化する新しいフレームワークである。
コードとデータセットを含む、対応するリソースをリリースしました。
論文 参考訳(メタデータ) (2025-09-18T07:35:58Z) - VeriReason: Reinforcement Learning with Testbench Feedback for Reasoning-Enhanced Verilog Generation [9.07044866283158]
本稿では,教師付き微調整とガイド・リワード近似最適化(GRPO)によるRTL生成のための強化学習を統合するフレームワークであるVeriReasonを紹介する。
VerilogEvalベンチマークでは、VeriReasonは83.1%の機能的正当性を提供しており、比較可能なサイズのモデルと、GPT-4 Turboのようなはるかに大きな商用システムの両方を上回っている。
VeriReasonは、Verilog生成のための強化学習と明示的な推論機能をうまく統合する最初のシステムであり、自動RTL合成のための新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-05-17T05:25:01Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - PID Control-Based Self-Healing to Improve the Robustness of Large Language Models [23.418411870842178]
マイナーな摂動は、よく訓練された言語モデルの性能を大幅に低下させる。
我々は、望ましくないモデル行動を修正するために、計算効率の良い自己修復プロセスを構築した。
提案したPID制御による自己修復は、事前訓練された大規模言語モデルの堅牢性を改善するための低コストなフレームワークである。
論文 参考訳(メタデータ) (2024-03-31T23:46:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。