論文の概要: EnvX: Agentize Everything with Agentic AI
- arxiv url: http://arxiv.org/abs/2509.08088v1
- Date: Tue, 09 Sep 2025 18:51:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.22798
- Title: EnvX: Agentize Everything with Agentic AI
- Title(参考訳): EnvX: エージェントAIですべてをエージェント化する
- Authors: Linyao Chen, Zimian Peng, Yingxuan Yang, Yikun Wang, Wenzheng Tom Tang, Hiroki H. Kobayashi, Weinan Zhang,
- Abstract要約: 私たちは、Agentic AIを活用してGitHubリポジトリをエージェント化するフレームワークであるEnvXを紹介します。
EnvXは3段階のプロセスを通じてリポジトリをアクティブエージェントとして再定義する。
我々はGitTaskBenchベンチマークでEnvXを評価し、画像処理、音声認識、文書分析、ビデオ操作など18の領域にわたるリポジトリを用いて評価した。
- 参考スコア(独自算出の注目度): 18.805404564291965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread availability of open-source repositories has led to a vast collection of reusable software components, yet their utilization remains manual, error-prone, and disconnected. Developers must navigate documentation, understand APIs, and write integration code, creating significant barriers to efficient software reuse. To address this, we present EnvX, a framework that leverages Agentic AI to agentize GitHub repositories, transforming them into intelligent, autonomous agents capable of natural language interaction and inter-agent collaboration. Unlike existing approaches that treat repositories as static code resources, EnvX reimagines them as active agents through a three-phase process: (1) TODO-guided environment initialization, which sets up the necessary dependencies, data, and validation datasets; (2) human-aligned agentic automation, allowing repository-specific agents to autonomously perform real-world tasks; and (3) Agent-to-Agent (A2A) protocol, enabling multiple agents to collaborate. By combining large language model capabilities with structured tool integration, EnvX automates not just code generation, but the entire process of understanding, initializing, and operationalizing repository functionality. We evaluate EnvX on the GitTaskBench benchmark, using 18 repositories across domains such as image processing, speech recognition, document analysis, and video manipulation. Our results show that EnvX achieves a 74.07% execution completion rate and 51.85% task pass rate, outperforming existing frameworks. Case studies further demonstrate EnvX's ability to enable multi-repository collaboration via the A2A protocol. This work marks a shift from treating repositories as passive code resources to intelligent, interactive agents, fostering greater accessibility and collaboration within the open-source ecosystem.
- Abstract(参考訳): オープンソースリポジトリが広く利用可能になったことで、再利用可能なソフトウェアコンポーネントの大規模なコレクションが生まれましたが、その利用は手作業で、エラーが発生し、接続が切れています。
開発者はドキュメントをナビゲートし、APIを理解し、統合コードを書く必要がある。
これを解決するために、Agentic AIを活用してGitHubリポジトリをエージェント化し、自然言語インタラクションとエージェント間コラボレーションが可能なインテリジェントで自律的なエージェントに変換するフレームワークであるEnvXを紹介します。
リポジトリを静的コードリソースとして扱う既存のアプローチとは違って、EnvXは、(1)TODO誘導環境の初期化、(2)必要な依存関係、データ、バリデーションデータセットの設定、(2)リポジトリ固有のエージェントが現実のタスクを自律的に実行できるようにするヒューマンアラインなエージェント自動化、(3)エージェント・ツー・エージェント(A2A)プロトコル、という3段階のプロセスを通じて、それらをアクティブなエージェントとして再定義する。
大きな言語モデル機能と構造化ツールの統合を組み合わせることで、EnvXはコード生成だけでなく、リポジトリ機能を理解し、初期化し、運用するプロセス全体を自動化します。
我々はGitTaskBenchベンチマークでEnvXを評価し、画像処理、音声認識、文書分析、ビデオ操作など18の領域にわたるリポジトリを用いて評価した。
その結果、EnvXは74.07%の実行完了率と51.85%のタスクパス率を達成し、既存のフレームワークを上回りました。
ケーススタディでは、A2Aプロトコルを介して複数リポジトリの協調を可能にするEnvXの機能をさらに実証している。
この作業は、リポジトリを受動的コードリソースとして扱うことから、インテリジェントでインタラクティブなエージェントへ移行し、オープンソースエコシステム内のアクセシビリティとコラボレーションを向上する。
関連論文リスト
- RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving [32.044286648565524]
RepoMasterは、複雑なタスクを解決するためにGitHubリポジトリを探索、再利用するために設計された、自律的なエージェントフレームワークである。
RepoMasterは関数呼び出しグラフ、モジュール依存グラフ、階層的なコードツリーを構築し、必須コンポーネントを特定する。
新たにリリースしたGitTaskBenchでは、RepoMasterがタスクパス率を40.7%から62.9%に引き上げ、トークン使用率を95%削減しました。
論文 参考訳(メタデータ) (2025-05-27T08:35:05Z) - Cerebrum (AIOS SDK): A Platform for Agent Development, Deployment, Distribution, and Discovery [33.89476893368382]
CerebrumはAIOS用のエージェントSDKで、3つの重要なコンポーネント間のギャップに対処します。
エージェント開発のためのモジュール型の4層アーキテクチャを備えた包括的なSDK,(2)エージェントの共有と発見のためのコミュニティ主導のエージェントハブ,(3)エージェントのテストと評価のためのインタラクティブなWebインターフェース。
Cerebrumは、エージェント開発を標準化する統一されたフレームワークを提供しながら、研究者や開発者がエージェントを革新し、配布する柔軟性を維持しながら、この分野を前進させる。
論文 参考訳(メタデータ) (2025-03-14T14:29:17Z) - RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.87660059104077]
RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。
RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文 参考訳(メタデータ) (2024-10-03T05:45:26Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - AutoDev: Automated AI-Driven Development [9.586330606828643]
AutoDevは完全に自動化されたAI駆動ソフトウェア開発フレームワークである。
ユーザはAutoDevの自律AIエージェントに割り当てられる複雑なソフトウェアエンジニアリングの目標を定義することができる。
AutoDevは、Dockerコンテナ内のすべての操作を集約することで、セキュアな開発環境を確立する。
論文 参考訳(メタデータ) (2024-03-13T07:12:03Z) - RepoAgent: An LLM-Powered Open-Source Framework for Repository-level
Code Documentation Generation [79.83270415843857]
コードドキュメンテーションを積極的に生成、保守、更新することを目的とした、大規模な言語モデルによるオープンソースフレームワークであるRepoAgentを紹介します。
RepoAgentは高品質なリポジトリレベルのドキュメントを生成するのに優れています。
論文 参考訳(メタデータ) (2024-02-26T15:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。