論文の概要: Agentic AI in the Software Development Lifecycle: Architecture, Empirical Evidence, and the Reshaping of Software Engineering
- arxiv url: http://arxiv.org/abs/2604.26275v1
- Date: Wed, 29 Apr 2026 04:06:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.250364
- Title: Agentic AI in the Software Development Lifecycle: Architecture, Empirical Evidence, and the Reshaping of Software Engineering
- Title(参考訳): ソフトウェア開発ライフサイクルにおけるエージェントAI: アーキテクチャ、実証的エビデンス、そしてソフトウェア工学の再構築
- Authors: Happy Bhati,
- Abstract要約: 現代のエージェントシステムは、リポジトリ、機能、アルゴリズムの粒度で機能する。
本稿ではエージェントソフトウェア工学システムのための6層参照アーキテクチャを提案する。
調査の中心的な対象は、コード生成から人事監督下での委任執行へと移行したと論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The arrival of large language models (LLMs) capable of multi-step reasoning, tool use, and long-horizon planning has produced a qualitative shift in software engineering. Where earlier code-completion tools such as GitHub Copilot operated at the granularity of a line or function, modern agentic systems -- Claude Code, OpenAI Codex CLI, Google Jules, Devin, OpenHands, SWE-agent, MetaGPT, ChatDev, and DeepMind's AlphaEvolve -- operate at the granularity of a repository, a feature, or an algorithm. We synthesize work from Anthropic, OpenAI, Google DeepMind, Microsoft Research, Princeton, Stanford, and the broader academic community to characterize this transition. We propose a six-layer reference architecture for agentic software engineering systems, contrast a traditional Software Development Lifecycle (SDLC) with an emerging Agentic SDLC (A-SDLC), and consolidate empirical evidence on performance (a rise from 1.96% to 78.4% on SWE-bench Verified between October 2023 and April 2026), productivity (13.6%-55.8% time savings across controlled studies), and labor-market impact (49% of jobs sampled by Anthropic in 2026 saw AI used for at least a quarter of their tasks). We argue that the central object of inquiry has shifted from code generation to delegated execution under human supervision, and we identify five open problems -- evaluation, governance, technical debt, skill redistribution, and the economics of attention -- that will determine whether the agentic transition is net-positive for the discipline.
- Abstract(参考訳): 大規模言語モデル(LLM)が登場し、多段階の推論、ツールの使用、長期計画が可能になったことで、ソフトウェア工学の質的な変化がもたらされた。
GitHub Copilotのような以前のコード補完ツールは、行や関数の粒度で動作していたが、現代のエージェントシステム -- Claude Code、OpenAI Codex CLI、Google Jules、Devin、OpenHands、SWE-agent、MetaGPT、ChatDev、DeepMindのAlphaEvolve -- は、リポジトリ、機能、アルゴリズムの粒度で動作している。
Anthropic, OpenAI, Google DeepMind, Microsoft Research, Princeton, Stanford, そして、この移行を特徴付ける広範な学術コミュニティの作品を合成します。
エージェントソフトウェアエンジニアリングシステムの6層参照アーキテクチャを提案する。従来のソフトウェア開発ライフサイクル(SDLC)と新しいエージェントSDLC(A-SDLC)を対比し、パフォーマンスに関する実証的証拠(2023年10月から2026年4月までに検証されたSWEベンチで1.96%から78.4%に上昇)、生産性(制御された研究間での省力化)、労働市場への影響(2026年にThropicがサンプリングした仕事の49%が、少なくとも4分の1のタスクでAIが使用されている。
調査の中心的な対象は、コード生成から人間の監督の下で委譲された実行へと移行し、評価、ガバナンス、技術的負債、スキルの再分配、注意の経済という5つのオープンな問題を特定し、エージェントの移行が規律に正のものであるかどうかを判断する。
関連論文リスト
- Workstream: A Local-First Developer Command Center for the AI-Augmented Engineering Workflow [0.0]
プルリクエスト、タスク管理、カレンダ、AIによるコードレビュー、履歴レビューインテリジェンス、レポジトリAI対応スコアリング、エージェントオブザーバビリティを単一のインターフェースに集約する、オープンソースのローカルファーストの開発者コマンドセンタであるWorkstreamを紹介します。
システムアーキテクチャ、新しい5カテゴリAI準備度スコアリングアルゴリズム、チーム固有のパターンの歴史的PRレビューをマイニングするレビューインテリジェンスパイプライン、モデルコンテキストプロトコル(MCP)、エージェント・ツー・エージェント(A2A)、エージェント・オブザーバビリティ・プロトコル(AOP)を実装するエージェント・オブザーバビリティ・レイヤについて説明する。
論文 参考訳(メタデータ) (2026-04-18T16:24:29Z) - Developers and Generative AI: A Study of Self-Admitted Usage in Open Source Projects [18.524728732046146]
我々は、64種類のChatGPTとGitHub Copilotの使用タスクの分類を7つのカテゴリに分類する。
我々は、どのように利用方法が拡大されたか、開発者がこのような生成AIの使用が有用であると感じている範囲、そして1年以上前に起きた懸念がもはや存在しないかを示す。
論文 参考訳(メタデータ) (2026-03-27T10:44:06Z) - AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access [60.37646376282544]
本稿では,全検索ランキング研究パイプラインを自動化したAI共同科学者フレームワークを提案する。
これは、AIの共同科学者フレームワークをアルゴリズム研究に利用した、ランキングコミュニティで初めての研究である。
論文 参考訳(メタデータ) (2026-03-23T09:29:08Z) - A Survey on Code Generation with LLM-based Agents [61.474191493322415]
大規模言語モデル(LLM)を利用したコード生成エージェントは、ソフトウェア開発パラダイムに革命をもたらしている。
LLMは3つのコア特徴によって特徴づけられる。
本稿では,LLMに基づくコード生成エージェントの分野を体系的に調査する。
論文 参考訳(メタデータ) (2025-07-31T18:17:36Z) - The Rise of AI Teammates in Software Engineering (SE) 3.0: How Autonomous Coding Agents Are Reshaping Software Engineering [10.252332355171237]
本稿では,このようなエージェントが野生でどのように動作するかを示す最初の大規模データセットであるAIDevを紹介する。
AIDevは5つの主要なエージェントによる45万6000件以上のプルリクエストに対処し、ソフトウェア開発において自律的なチームメイトを研究するための前例のない経験的な基盤を提供する。
データセットには、PR、著者、レビュータイムライン、コード変更、統合結果に関する豊富な情報が含まれている。
論文 参考訳(メタデータ) (2025-07-20T15:15:58Z) - Unified Software Engineering agent as AI Software Engineer [14.733475669942276]
大規模言語モデル(LLM)技術は、自動コーディングに対する期待を高めた。
本稿では,統一ソフトウェア工学エージェントやUSEagentを開発することによって,この問題を理解することを目的とする。
私たちはUSEagentを、AIと人間の両方を含む将来のソフトウェア開発チームのチームメンバーになる、将来のAIソフトウェアエンジニアの最初のドラフトとして考えています。
論文 参考訳(メタデータ) (2025-06-17T16:19:13Z) - Improving Performance of Commercially Available AI Products in a Multi-Agent Configuration [11.626057561212694]
クラウドボティックス PRD AIは、AIを使用してソフトウェア要件を生成するツールである。
GitHub Copilotは、AIペアプログラミングツールである。
PRD AIからビジネス要件を共有することで、GitHub Copilotのコード提案能力を13.8%改善し、開発者のタスク成功率を24.5%改善します。
論文 参考訳(メタデータ) (2024-10-29T15:28:19Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。