論文の概要: To What Extent Does Agent-generated Code Require Maintenance? An Empirical Study
- arxiv url: http://arxiv.org/abs/2605.06464v1
- Date: Thu, 07 May 2026 15:52:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.962147
- Title: To What Extent Does Agent-generated Code Require Maintenance? An Empirical Study
- Title(参考訳): エージェント生成コードの保守には何が必要か? : 実証的研究
- Authors: Shota Sawada, Tatsuya Shirai, Yutaro Kashiwa, Ken'ichi Yamaguchi, Hiroshi Iwata, Hajimu Iida,
- Abstract要約: 本研究では、AI生成ファイルの保守範囲、人間による関与、修正タイプを、人間によるコードに対して実証的に検討する。
私たちは1,000以上のファイルを分析し、100の人気のあるリポジトリから約3,200の変更を加えました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-based autonomous coding agents have reshaped software development. While these agents excel at code generation, open questions persist about the long-term maintainability of AI-generated code. This study empirically investigates the maintenance extent, human involvement, and modification types of AI-generated files versus human-authored code. Using the AIDev dataset of AI-generated pull requests and GitHub, we analyzed over 1,000 files and approximately 3,200 changes from 100 popular repositories. Our findings show that: (i) AI-generated files receive less frequent maintenance than human-authored code, with updates affecting only a small fraction of file size; (ii) the most frequent modifications to AI code are feature extensions, whereas human updates focus on bug fixes, and (iii) human developers perform the large majority of this maintenance.
- Abstract(参考訳): LLMベースの自律型コーディングエージェントは、ソフトウェア開発を再形成した。
これらのエージェントはコード生成に優れていますが、AI生成コードの長期的な保守性については、オープンな質問が続きます。
本研究では、AI生成ファイルの保守範囲、人間による関与、修正タイプを、人間によるコードに対して実証的に検討する。
AI生成したプルリクエストのAIDevデータセットとGitHubを使用して、1,000以上のファイルと、100の人気のあるリポジトリから約3,200の変更を分析しました。
我々の研究結果は以下のとおりである。
i) AI生成ファイルは、人間が作成したコードよりも頻繁なメンテナンスを受けられず、更新はファイルサイズにわずかしか影響を与えない。
(ii)AIコードの最も頻繁な修正は機能拡張であり、ヒューマンアップデートはバグ修正に重点を置いている。
(三) 人間の開発者は、このメンテナンスの大部分を実行します。
関連論文リスト
- SWE-chat: Coding Agent Interactions From Real Users in the Wild [70.18158706281724]
SWE-chatは、オープンソースの開発者から収集された実際のコーディングエージェントセッションの大規模なデータセットである。
現在、データセットには6000のセッションが含まれており、63,000以上のユーザプロンプトと355,000のエージェントツールコールが含まれている。
論文 参考訳(メタデータ) (2026-04-22T17:08:19Z) - Debt Behind the AI Boom: A Large-Scale Empirical Study of AI-Generated Code in the Wild [13.35459155979355]
我々は6,275のGitHubリポジトリから304,362の認証済みAI認証コミットのデータセットを構築します。
484,606の異なる問題を特定し、コードの臭いは最も一般的な型であり、すべての問題の89.1%を占めています。
これらの結果は、AI生成コードは、実際のソフトウェアプロジェクトに長期のメンテナンスコストをもたらす可能性があることを示している。
論文 参考訳(メタデータ) (2026-03-30T15:38:05Z) - AI builds, We Analyze: An Empirical Study of AI-Generated Build Code Quality [0.0]
ソフトウェア開発におけるAIコーディングエージェントの急速な採用は、それらが生成するコードの品質と保守性に関する重要な疑問を提起している。
このデータマイニングの課題は、実世界のGitHubリポジトリからエージェントプルリクエストをキャプチャする、最初の大規模でオープンソースのデータセットであるAIDevに焦点を当てている。
私たちは364のメンテナンス性とセキュリティ関連のビルドの臭いを、さまざまな重大度レベルにわたって特定しました。
論文 参考訳(メタデータ) (2026-01-23T15:40:28Z) - Will It Survive? Deciphering the Fate of AI-Generated Code in Open Source [3.6525095710982924]
一般的な仮説では、コードは"使い捨て"であり、すぐにマージされるが、その後すぐに破棄される。
我々は,201件のオープンソースプロジェクトの生存状況を分析し,AIエージェントが作成した20万件のコード修復ユニットを人に対して追跡する。
論文 参考訳(メタデータ) (2026-01-23T15:00:46Z) - AI Code in the Wild: Measuring Security Risks and Ecosystem Shifts of AI-Generated Code in Modern Software [12.708926174194199]
野生におけるAI生成コード(AIGCode)の大規模な実証的研究について紹介する。
我々はAIGCodeと人書きコードとを区別するための高精度検出パイプラインとベンチマークを構築した。
これにより、コミット、ファイル、関数を人間/AI軸に沿ってラベル付けし、AIGCodeがプロジェクトや脆弱性ライフサイクルをどう移動するかを追跡することができます。
論文 参考訳(メタデータ) (2025-12-21T02:26:29Z) - Toward Training Superintelligent Software Agents through Self-Play SWE-RL [66.11447353341926]
セルフプレイSWE-RLは、超知能ソフトウェアエージェントのトレーニングパラダイムに向けた第一歩である。
当社のアプローチでは,ソースコードとインストール済みの依存関係を備えたサンドボックスリポジトリへのアクセスのみを必要としています。
我々の成果は、早い段階で、エージェントが現実世界のソフトウェアリポジトリから広範囲にわたる学習経験を自律的に収集する道のりを示唆している。
論文 参考訳(メタデータ) (2025-12-21T00:49:40Z) - AgentPack: A Dataset of Code Changes, Co-Authored by Agents and Humans [46.56091965723774]
コード編集のための微調整された大きな言語モデルは、一般的にコミットのマイニングやプルリクエストに依存しています。
我々は、Claude Code、OpenAI Codex、Cursor Agentが共著した1.3Mコード編集コーパスであるAgentPackを紹介する。
AgentPackで微調整されたモデルは、以前の人間のみのコミットコーパスで訓練されたモデルより優れていることを示す。
論文 参考訳(メタデータ) (2025-09-26T05:28:22Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science [70.1638335489284]
高レベルの機械学習エンジニアリングタスクは、労働集約的で反復的である。
機械学習プロセスを形式化する包括的で分離されたフレームワークであるR&D-Agentを紹介します。
R&D-AgentはMLEを2つのフェーズと6つのコンポーネントに定義し、MLEのエージェント設計を原則としてテスト可能なプロセスに変える。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - Evaluating Software Development Agents: Patch Patterns, Code Quality, and Issue Complexity in Real-World GitHub Scenarios [13.949319911378826]
この調査は、500の現実のGitHubイシューで上位10のエージェントから4,892のパッチを評価した。
一人のエージェントが支配的であり、170の問題が未解決であり、改善の余地があった。
ほとんどのエージェントはコードの信頼性とセキュリティを維持し、新しいバグや脆弱性を避けた。
一部のエージェントはコードの複雑さを増し、多くの重複を減らし、コードの臭いを最小限にした。
論文 参考訳(メタデータ) (2024-10-16T11:33:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。