論文の概要: The Rise of AI Teammates in Software Engineering (SE) 3.0: How Autonomous Coding Agents Are Reshaping Software Engineering
- arxiv url: http://arxiv.org/abs/2507.15003v1
- Date: Sun, 20 Jul 2025 15:15:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.157595
- Title: The Rise of AI Teammates in Software Engineering (SE) 3.0: How Autonomous Coding Agents Are Reshaping Software Engineering
- Title(参考訳): ソフトウェアエンジニアリング(SE) 3.0におけるAIチームメイトの増加 - 自律的コーディングエージェントがソフトウェアエンジニアリングをどう変えているか
- Authors: Hao Li, Haoxiang Zhang, Ahmed E. Hassan,
- Abstract要約: 本稿では,このようなエージェントが野生でどのように動作するかを示す最初の大規模データセットであるAIDevを紹介する。
AIDevは5つの主要なエージェントによる45万6000件以上のプルリクエストに対処し、ソフトウェア開発において自律的なチームメイトを研究するための前例のない経験的な基盤を提供する。
データセットには、PR、著者、レビュータイムライン、コード変更、統合結果に関する豊富な情報が含まれている。
- 参考スコア(独自算出の注目度): 10.252332355171237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The future of software engineering--SE 3.0--is unfolding with the rise of AI teammates: autonomous, goal-driven systems collaborating with human developers. Among these, autonomous coding agents are especially transformative, now actively initiating, reviewing, and evolving code at scale. This paper introduces AIDev, the first large-scale dataset capturing how such agents operate in the wild. Spanning over 456,000 pull requests by five leading agents--OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code--across 61,000 repositories and 47,000 developers, AIDev provides an unprecedented empirical foundation for studying autonomous teammates in software development. Unlike prior work that has largely theorized the rise of AI-native software engineering, AIDev offers structured, open data to support research in benchmarking, agent readiness, optimization, collaboration modeling, and AI governance. The dataset includes rich metadata on PRs, authorship, review timelines, code changes, and integration outcomes--enabling exploration beyond synthetic benchmarks like SWE-bench. For instance, although agents often outperform humans in speed, their PRs are accepted less frequently, revealing a trust and utility gap. Furthermore, while agents accelerate code submission--one developer submitted as many PRs in three days as they had in three years--these are structurally simpler (via code complexity metrics). We envision AIDev as a living resource: extensible, analyzable, and ready for the SE and AI communities. Grounding SE 3.0 in real-world evidence, AIDev enables a new generation of research into AI-native workflows and supports building the next wave of symbiotic human-AI collaboration. The dataset is publicly available at https://github.com/SAILResearch/AI_Teammates_in_SE3. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Software Engineering Agent
- Abstract(参考訳): ソフトウェアエンジニアリングの未来--SE 3.0は、AIチームメイトの台頭と共に展開されている。
それらの中で、自律的なコーディングエージェントは特に変革的であり、大規模にコードを開始し、レビューし、進化させています。
本稿では,このようなエージェントが野生でどのように動作するかを示す最初の大規模データセットであるAIDevを紹介する。
OpenAI Codex、Devin、GitHub Copilot、Cursor、Claude Codeの5つの主要なエージェントによる456,000以上のプルリクエストに61,000のリポジトリと47,000の開発者が参加し、AIDevはソフトウェア開発において自律的なチームメイトを研究するための前例のない経験的な基盤を提供する。
AIネイティブなソフトウェアエンジニアリングの台頭をほとんど理論化した以前の作業とは異なり、AIDevは、ベンチマーク、エージェントの準備、最適化、コラボレーションモデリング、AIガバナンスの研究をサポートする構造化されたオープンデータを提供する。
データセットには、PR、著者、レビュータイムライン、コード変更、統合結果に関する豊富なメタデータが含まれている。
例えば、エージェントはスピードで人間より優れていることが多いが、PRはより頻繁に受け入れられず、信頼とユーティリティのギャップが明らかになる。
さらに、エージェントがコードの提出を加速する一方で、開発者は3年で3日でPRを提出する。
私たちはAIDevを、拡張可能で分析可能で、SEとAIコミュニティに準備ができている、生きたリソースとして想定しています。
SE 3.0を実世界のエビデンスとして、AIDevはAIネイティブワークフローに関する新たな世代の研究を可能にし、共生的な人間とAIのコラボレーションの次の波の構築をサポートする。
データセットはhttps://github.com/SAILResearch/AI_Teammates_in_SE3で公開されている。
>AIエージェント,エージェントAI,コーディングエージェント,エージェントコーディング,ソフトウェア工学エージェント
関連論文リスト
- Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [66.1850490474361]
コーディングエージェントとの開発者インタラクションを探求する最初の学術的研究を行う。
私たちは、GitHub CopilotとOpenHandsの2つの主要なコピロとエージェントコーディングアシスタントを評価します。
この結果から、エージェントは、コピロトを超越した方法で開発者を支援する可能性を示唆している。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [51.112225746095746]
本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。
XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文 参考訳(メタデータ) (2025-07-07T17:50:52Z) - Unified Software Engineering agent as AI Software Engineer [14.733475669942276]
大規模言語モデル(LLM)技術は、自動コーディングに対する期待を高めた。
本稿では,統一ソフトウェア工学エージェントやUSEagentを開発することによって,この問題を理解することを目的とする。
私たちはUSEagentを、AIと人間の両方を含む将来のソフトウェア開発チームのチームメンバーになる、将来のAIソフトウェアエンジニアの最初のドラフトとして考えています。
論文 参考訳(メタデータ) (2025-06-17T16:19:13Z) - R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution [60.80016554091364]
R&D-Agentは反復探索のための二重エージェントフレームワークである。
Researcherエージェントはパフォーマンスフィードバックを使用してアイデアを生成し、Developerエージェントはエラーフィードバックに基づいてコードを洗練する。
R&D-AgentはMLE-Benchで評価され、最高のパフォーマンスの機械学習エンジニアリングエージェントとして登場した。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [52.46737975742287]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文 参考訳(メタデータ) (2024-12-18T18:55:40Z) - ChatCollab: Exploring Collaboration Between Humans and AI Agents in Software Teams [1.3967206132709542]
ChatCollabの斬新なアーキテクチャは、エージェント(人間またはAI)が任意の役割でコラボレーションに参加することを可能にする。
ソフトウェアエンジニアリングをケーススタディとして使用することで、私たちのAIエージェントが彼らの役割と責任をうまく特定できることが分かりました。
ソフトウェア開発のための従来の3つのマルチエージェントAIシステムに関連して、ChatCollab AIエージェントはインタラクティブなゲーム開発タスクにおいて、同等またはより良いソフトウェアを生成する。
論文 参考訳(メタデータ) (2024-12-02T21:56:46Z) - Improving Performance of Commercially Available AI Products in a Multi-Agent Configuration [11.626057561212694]
クラウドボティックス PRD AIは、AIを使用してソフトウェア要件を生成するツールである。
GitHub Copilotは、AIペアプログラミングツールである。
PRD AIからビジネス要件を共有することで、GitHub Copilotのコード提案能力を13.8%改善し、開発者のタスク成功率を24.5%改善します。
論文 参考訳(メタデータ) (2024-10-29T15:28:19Z) - Towards AI-Native Software Engineering (SE 3.0): A Vision and a Challenge Roadmap [30.996760992473064]
Software Engineering 3.0 (SE 3.0)は、意図優先の会話指向開発を特徴とするAIネイティブなアプローチである。
私たちは、適応的でパーソナライズされたAIパートナーシップのためのTeammate.nextを含む、SE 3.0テクノロジスタックの重要なコンポーネントについて概説する。
本稿では,次世代のソフトウェア工学におけるAIの役割について,今後の議論の基盤を定めている。
論文 参考訳(メタデータ) (2024-10-08T15:04:07Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。