論文の概要: Experimenting with Multi-Agent Software Development: Towards a Unified Platform
- arxiv url: http://arxiv.org/abs/2406.05381v1
- Date: Sat, 8 Jun 2024 07:27:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 20:04:51.619190
- Title: Experimenting with Multi-Agent Software Development: Towards a Unified Platform
- Title(参考訳): マルチエージェントソフトウェア開発の実験:統一プラットフォームを目指して
- Authors: Malik Abdul Sami, Muhammad Waseem, Zeeshan Rasheed, Mika Saari, Kari Systä, Pekka Abrahamsson,
- Abstract要約: 大規模言語モデルは、ソフトウェア開発プロセス全体を通してAI駆動技術を実装することで、ソフトウェア工学を再定義している。
本研究は,複数の人工知能エージェントを用いて,ユーザの要求を適切に構成された納品物に変換するプロセスを自動化する統一プラットフォームを開発することを目的とする。
プラットフォームはタスクを整理し、セキュリティとコンプライアンスを実行し、非機能要件の設計パターンと改善を提案する。
- 参考スコア(独自算出の注目度): 3.3485481369444674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models are redefining software engineering by implementing AI-powered techniques throughout the whole software development process, including requirement gathering, software architecture, code generation, testing, and deployment. However, it is still difficult to develop a cohesive platform that consistently produces the best outcomes across all stages. The objective of this study is to develop a unified platform that utilizes multiple artificial intelligence agents to automate the process of transforming user requirements into well-organized deliverables. These deliverables include user stories, prioritization, and UML sequence diagrams, along with the modular approach to APIs, unit tests, and end-to-end tests. Additionally, the platform will organize tasks, perform security and compliance, and suggest design patterns and improvements for non-functional requirements. We allow users to control and manage each phase according to their preferences. In addition, the platform provides security and compliance checks following European standards and proposes design optimizations. We use multiple models, such as GPT-3.5, GPT-4, and Llama3 to enable to generation of modular code as per user choice. The research also highlights the limitations and future research discussions to overall improve the software development life cycle. The source code for our uniform platform is hosted on GitHub, enabling additional experimentation and supporting both research and practical uses. \end
- Abstract(参考訳): 大規模言語モデルは、要件収集、ソフトウェアアーキテクチャ、コード生成、テスト、デプロイメントを含む、ソフトウェア開発プロセス全体にわたってAI駆動技術を実装することで、ソフトウェアエンジニアリングを再定義する。
しかし、すべての段階において最高の成果を連続的に生み出す、結束的なプラットフォームを開発することは依然として困難である。
本研究の目的は、複数の人工知能エージェントを用いて、ユーザの要求を適切に構成された配送物に変換するプロセスを自動化する統一プラットフォームを開発することである。
これらの成果物には、ユーザストーリ、優先順位付け、UMLシーケンスダイアグラム、APIへのモジュラーアプローチ、ユニットテスト、エンドツーエンドテストが含まれる。
さらに、プラットフォームはタスクを整理し、セキュリティとコンプライアンスを実行し、非機能要件の設計パターンと改善を提案する。
ユーザーは好みに応じて各フェーズを制御および管理できる。
さらに、このプラットフォームは欧州標準に従ってセキュリティとコンプライアンスのチェックを提供し、設計の最適化を提案する。
我々は、GPT-3.5、GPT-4、Llama3などの複数のモデルを使用して、ユーザー選択に応じてモジュラーコードを生成する。
この調査はまた、ソフトウェア開発ライフサイクルを全般的に改善するための制限と将来の研究の議論を強調している。
統一プラットフォーム用のソースコードはGitHubにホストされており、さらなる実験を可能にし、研究と実践の両方の使用をサポートする。
御前
関連論文リスト
- Chattronics: using GPTs to assist in the design of data acquisition systems [0.0]
本稿では,データ取得システムの設計段階を支援するために,汎用事前学習変換器を用いた新しい手法を提案する。
このソリューションは、LLMの会話的側面を保持するアプリケーションという形でパッケージ化されている。
160回の試行を経て、この研究はこれらのモデルがデータ取得システムの合成・補助ツールとして適切に機能する可能性があると結論付けている。
論文 参考訳(メタデータ) (2024-09-23T16:36:16Z) - Think-on-Process: Dynamic Process Generation for Collaborative Development of Multi-Agent System [13.65717444483291]
ToP (Think-on-Process) はソフトウェア開発のための動的プロセス生成フレームワークである。
本フレームワークはGPT-3.5とGPT-4の動的プロセス生成能力を著しく向上させる。
論文 参考訳(メタデータ) (2024-09-10T15:02:34Z) - SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents [50.82665351100067]
FlowGenは、複数のLarge Language Model (LLM)エージェントに基づいたソフトウェアプロセスモデルをエミュレートするコード生成フレームワークである。
FlowGenScrumをHumanEval、HumanEval-ET、MBPP、MBPP-ETの4つのベンチマークで評価した。
論文 参考訳(メタデータ) (2024-03-23T14:04:48Z) - DevBench: A Comprehensive Benchmark for Software Development [72.24266814625685]
DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。
GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。
本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文 参考訳(メタデータ) (2024-03-13T15:13:44Z) - MAgIC: Investigation of Large Language Model Powered Multi-Agent in
Cognition, Adaptability, Rationality and Collaboration [102.41118020705876]
大規模言語モデル(LLM)は自然言語処理の分野で大きな進歩を遂げている。
アプリケーションがマルチエージェント環境に拡張されるにつれ、包括的な評価フレームワークの必要性が高まっている。
この研究は、マルチエージェント設定内でLLMを評価するために特別に設計された新しいベンチマークフレームワークを導入している。
論文 参考訳(メタデータ) (2023-11-14T21:46:27Z) - TestLab: An Intelligent Automated Software Testing Framework [0.0]
TestLabは、一連のテストメソッドを収集し、人工知能を使ってそれらを自動化しようとする自動ソフトウェアテストフレームワークである。
最初の2つのモジュールは、異なる視点から脆弱性を特定することを目的としており、3番目のモジュールは、テストケースを自動的に生成することで、従来の自動ソフトウェアテストを強化する。
論文 参考訳(メタデータ) (2023-06-06T11:45:22Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Learning Multi-Objective Curricula for Deep Reinforcement Learning [55.27879754113767]
深部強化学習(DRL)のサンプル効率と最終性能を向上させるために,各種自動カリキュラム学習(ACL)手法が提案されている。
本稿では,多目的だがコヒーレントなカリキュラムを作成するための統合された自動カリキュラム学習フレームワークを提案する。
既存の手設計のカリキュラムパラダイムに加えて,抽象カリキュラムを学習するためのフレキシブルなメモリ機構を設計する。
論文 参考訳(メタデータ) (2021-10-06T19:30:25Z) - PHOTONAI -- A Python API for Rapid Machine Learning Model Development [2.414341608751139]
PHOTONAIは、機械学習モデル開発の簡素化と高速化を目的とした、ハイレベルなPython APIである。
これは統一フレームワークとして機能し、ユーザーは異なるツールボックスからのアルゴリズムをカスタムのアルゴリズムシーケンスに簡単にアクセスし、組み合わせることができる。
論文 参考訳(メタデータ) (2020-02-13T10:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。