論文の概要: AutoDev: Automated AI-Driven Development
- arxiv url: http://arxiv.org/abs/2403.08299v1
- Date: Wed, 13 Mar 2024 07:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 15:16:04.991573
- Title: AutoDev: Automated AI-Driven Development
- Title(参考訳): AutoDev: AI駆動開発を自動化する
- Authors: Michele Tufano, Anisha Agarwal, Jinu Jang, Roshanak Zilouchian
Moghaddam, Neel Sundaresan
- Abstract要約: AutoDevは完全に自動化されたAI駆動ソフトウェア開発フレームワークである。
ユーザはAutoDevの自律AIエージェントに割り当てられる複雑なソフトウェアエンジニアリングの目標を定義することができる。
AutoDevは、Dockerコンテナ内のすべての操作を集約することで、セキュアな開発環境を確立する。
- 参考スコア(独自算出の注目度): 9.586330606828643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The landscape of software development has witnessed a paradigm shift with the
advent of AI-powered assistants, exemplified by GitHub Copilot. However,
existing solutions are not leveraging all the potential capabilities available
in an IDE such as building, testing, executing code, git operations, etc.
Therefore, they are constrained by their limited capabilities, primarily
focusing on suggesting code snippets and file manipulation within a chat-based
interface. To fill this gap, we present AutoDev, a fully automated AI-driven
software development framework, designed for autonomous planning and execution
of intricate software engineering tasks. AutoDev enables users to define
complex software engineering objectives, which are assigned to AutoDev's
autonomous AI Agents to achieve. These AI agents can perform diverse operations
on a codebase, including file editing, retrieval, build processes, execution,
testing, and git operations. They also have access to files, compiler output,
build and testing logs, static analysis tools, and more. This enables the AI
Agents to execute tasks in a fully automated manner with a comprehensive
understanding of the contextual information required. Furthermore, AutoDev
establishes a secure development environment by confining all operations within
Docker containers. This framework incorporates guardrails to ensure user
privacy and file security, allowing users to define specific permitted or
restricted commands and operations within AutoDev. In our evaluation, we tested
AutoDev on the HumanEval dataset, obtaining promising results with 91.5% and
87.8% of Pass@1 for code generation and test generation respectively,
demonstrating its effectiveness in automating software engineering tasks while
maintaining a secure and user-controlled development environment.
- Abstract(参考訳): ソフトウェア開発の状況は、GitHub Copilotが例証したように、AIによるアシスタントの出現とともにパラダイムシフトを目の当たりにした。
しかし、既存のソリューションは、ビルド、テスト、コードの実行、git操作など、IDEで利用可能な機能をすべて活用していない。
そのため、主にチャットベースのインターフェイス内でコードスニペットとファイル操作を提案することに焦点を当て、制限された機能に制約されている。
このギャップを埋めるために、私たちは、複雑なソフトウェアエンジニアリングタスクの自律的な計画と実行のために設計された、完全に自動化されたAI駆動ソフトウェア開発フレームワークであるAutoDevを紹介します。
AutoDevは、AutoDevの自律AIエージェントに割り当てられる複雑なソフトウェアエンジニアリングの目的を定義することができる。
これらのAIエージェントは、ファイル編集、検索、ビルドプロセス、実行、テスト、git操作を含む、コードベースでのさまざまな操作を実行することができる。
ファイルへのアクセス、コンパイラ出力、ビルドとテストのログ、静的解析ツールなどもある。
これにより、AIエージェントは、必要なコンテキスト情報を総合的に理解して、完全に自動化された方法でタスクを実行することができる。
さらにAutoDevは,Dockerコンテナ内のすべての操作を集約することで,セキュアな開発環境を確立する。
このフレームワークには、ユーザのプライバシとファイルセキュリティを確保するためのガードレールが含まれており、AutoDev内でユーザが特定の許可されたあるいは制限されたコマンドや操作を定義することができる。
評価では、AutoDevをHumanEvalデータセット上でテストし、コード生成とテスト生成のPass@1の91.5%と87.8%の有望な結果を得た。
関連論文リスト
- OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - A New Generation of Intelligent Development Environments [0.0]
プログラミングの実践は、AI支援開発(コパイロット)の導入と、新しいプログラミング言語の作成によって、革命を遂げている。
本稿では,統合開発環境を統合開発環境からインテリジェント開発環境へ転換するビジョンを提案する。
論文 参考訳(メタデータ) (2024-06-13T20:33:25Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - DevBots can co-design APIs [0.0]
DevBotsは、ソフトウェア開発をサポートするためにさまざまなタスクを実行する自動化ツールである。
ソフトウェア開発におけるDevBotsの利用状況について,24の論文を分析した。
論文 参考訳(メタデータ) (2023-12-10T02:29:05Z) - ProAgent: From Robotic Process Automation to Agentic Process Automation [87.0555252338361]
LLM(Large Language Models)は、人間のような知性を持つ言語である。
本稿では,ALMをベースとしたエージェントを用いた高度な自動化のための基盤的自動化パラダイムであるエージェントプロセス自動化(APA)を紹介する。
そして、人間の指示を駆使し、特殊エージェントの調整によって複雑な決定を下すように設計されたエージェントであるProAgentをインスタンス化する。
論文 参考訳(メタデータ) (2023-11-02T14:32:16Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。