論文の概要: Agyn: A Multi-Agent System for Team-Based Autonomous Software Engineering
- arxiv url: http://arxiv.org/abs/2602.01465v1
- Date: Sun, 01 Feb 2026 22:17:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.799147
- Title: Agyn: A Multi-Agent System for Team-Based Autonomous Software Engineering
- Title(参考訳): Agyn: チームベースの自律型ソフトウェアエンジニアリングのためのマルチエージェントシステム
- Authors: Nikita Benkovich, Vitalii Valkov,
- Abstract要約: 現実世界のソフトウェア開発は、共有方法論に従ってチームが共同で行う活動として組織されます。
ソフトウェア工学を組織プロセスとして明示的にモデル化する,完全に自動化されたマルチエージェントシステムを提案する。
我々の結果は、チーム構造、方法論、コミュニケーションの複製が、自律的なソフトウェアエンジニアリングの強力なパラダイムであることを示唆している。
- 参考スコア(独自算出の注目度): 0.09046463333989574
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models have demonstrated strong capabilities in individual software engineering tasks, yet most autonomous systems still treat issue resolution as a monolithic or pipeline-based process. In contrast, real-world software development is organized as a collaborative activity carried out by teams following shared methodologies, with clear role separation, communication, and review. In this work, we present a fully automated multi-agent system that explicitly models software engineering as an organizational process, replicating the structure of an engineering team. Built on top of agyn, an open-source platform for configuring agent teams, our system assigns specialized agents to roles such as coordination, research, implementation, and review, provides them with isolated sandboxes for experimentation, and enables structured communication. The system follows a defined development methodology for working on issues, including analysis, task specification, pull request creation, and iterative review, and operates without any human intervention. Importantly, the system was designed for real production use and was not tuned for SWE-bench. When evaluated post hoc on SWE-bench 500, it resolves 72.4% of tasks, outperforming single-agent baselines using comparable language models. Our results suggest that replicating team structure, methodology, and communication is a powerful paradigm for autonomous software engineering, and that future progress may depend as much on organizational design and agent infrastructure as on model improvements.
- Abstract(参考訳): 大規模言語モデルは、個々のソフトウェアエンジニアリングタスクにおいて強力な機能を示しているが、ほとんどの自律システムは、イシュー解決をモノリシックまたはパイプラインベースのプロセスとして扱い続けている。
対照的に、現実世界のソフトウェア開発は、共有方法論に従ってチームが共同で行う活動として組織され、明確な役割分離、コミュニケーション、レビューが行われます。
本研究では,ソフトウェアエンジニアリングを組織プロセスとして明示的にモデル化し,エンジニアリングチームの構造を再現する,完全に自動化されたマルチエージェントシステムを提案する。
エージェントチームを構成するためのオープンソースのプラットフォームであるagyn上に構築されたこのシステムは、調整、研究、実装、レビューといった役割に特別なエージェントを割り当て、実験用の独立したサンドボックスを提供し、構造化されたコミュニケーションを可能にする。
システムは、分析、タスク仕様、プルリクエストの作成、反復的なレビューなど、問題に取り組むための定義された開発方法論に従い、人間の介入なしに運用する。
重要なことに、このシステムは実運用用に設計され、SWEベンチ用に調整されなかった。
SWE-bench 500でのポストホックの評価では、72.4%のタスクを解決し、同等の言語モデルを使用してシングルエージェントベースラインを上回っている。
我々の結果は、チームの構造、方法論、コミュニケーションを複製することは、自律的なソフトウェアエンジニアリングの強力なパラダイムであり、将来の進歩は、モデルの改善と同じくらい、組織設計やエージェントのインフラに依存するかもしれないことを示唆している。
関連論文リスト
- Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - Engineering.ai: A Platform for Teams of AI Engineers in Computational Design [8.217119500224284]
計算設計におけるAIエンジニアのチームのためのプラットフォームであるEngineering.aiを紹介します。
このフレームワークは階層的なマルチエージェントアーキテクチャを採用しており、チーフエンジニアが特殊エージェントをコーディネートする。
このシステムはFreeCAD、Gmsh、OpenFOAM、CalculiX、BPM音響解析を統合し、並列多分野シミュレーションを可能にする。
論文 参考訳(メタデータ) (2025-10-31T08:00:48Z) - Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges [13.53016942028838]
大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
論文 参考訳(メタデータ) (2025-10-10T13:56:27Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - JoyAgent-JDGenie: Technical Report on the GAIA [27.025464023889853]
大規模言語モデルは、複雑な現実世界のタスクのための自律的なエージェントとして、ますます多くデプロイされている。
本稿では,計画および実行エージェントを批判モデル投票と統合する汎用エージェントアーキテクチャ,作業層,意味層,手続き層にまたがる階層型メモリシステム,検索,コード実行,マルチモーダル解析のための洗練されたツールスイートを提案する。
論文 参考訳(メタデータ) (2025-10-01T04:41:58Z) - Vibe Coding vs. Agentic Coding: Fundamentals and Practical Implications of Agentic AI [0.36868085124383626]
レビューでは、AI支援ソフトウェア開発の新たなパラダイムとして、バイブコーディングとエージェントコーディングの2つを包括的に分析している。
Vibeのコーディングは、インプットベースで対話的なインタラクションを通じて、直感的で、ループ内の人間間インタラクションを強調する。
エージェントコーディングは、最小限の介入でタスクを計画、実行、テスト、反復できる目標駆動エージェントを通じて、自律的なソフトウェア開発を可能にする。
論文 参考訳(メタデータ) (2025-05-26T03:00:21Z) - An LLM-enabled Multi-Agent Autonomous Mechatronics Design Framework [49.633199780510864]
本研究は, 機械設計, 最適化, エレクトロニクス, ソフトウェア工学の専門知識を統合した多エージェント自律メカトロニクス設計フレームワークを提案する。
このフレームワークは、言語駆動のワークフローを通じて運用され、構造化された人間のフィードバックを組み込んで、現実世界の制約下での堅牢なパフォーマンスを保証する。
完全に機能する自律型容器は、最適化された推進、コスト効率の高い電子機器、高度な制御を備えていた。
論文 参考訳(メタデータ) (2025-04-20T16:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。