論文の概要: Confucius Code Agent: Scalable Agent Scaffolding for Real-World Codebases
- arxiv url: http://arxiv.org/abs/2512.10398v3
- Date: Tue, 16 Dec 2025 02:35:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 14:48:05.922074
- Title: Confucius Code Agent: Scalable Agent Scaffolding for Real-World Codebases
- Title(参考訳): Confucius Code Agent: 現実世界のコードベースのためのスケーラブルなエージェントの共有
- Authors: Zhaodong Wang, Zhenting Qi, Sherman Wong, Nathan Hu, Samuel Lin, Jun Ge, Erwin Gao, Wenlin Chen, Yilun Du, Minlan Yu, Ying Zhang,
- Abstract要約: 企業レベルで運用可能なスケーラブルなソフトウェアエンジニアリングエージェントであるConfucius Code Agent(CCA)を紹介します。
CCAはConfucius SDK上に構築されており、エージェントエクスペリエンス(AX)、ユーザエクスペリエンス(UX)、開発者エクスペリエンス(DX)の3つの補完的な視点に基づいて構成されているエージェント開発プラットフォームである。
さらに,ビルド-テスト-インプロブループを通じてエージェント構成の合成,評価,改善を自動化するメタエージェントを導入し,新しいタスクや環境,ツールスタックへの迅速な適応を可能にする。
- 参考スコア(独自算出の注目度): 44.366968508477235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world software engineering tasks require coding agents that can operate over massive repositories, sustain long-horizon sessions, and reliably coordinate complex toolchains at test time. Existing research-grade agents offer transparency but struggle when scaled to real-world workloads, while proprietary systems achieve strong practical performance but provide limited extensibility, interpretability, and controllability. We introduce the Confucius Code Agent (CCA), a scalable software engineering agent that can operate at enterprise-level codebases. CCA is built on top of the Confucius SDK, an agent development platform structured around three complementary perspectives: Agent Experience (AX), User Experience (UX), and Developer Experience (DX). The SDK integrates a unified orchestrator with hierarchical working memory for long-context operation, a persistent note-taking mechanism for cross-session continual learning, and a modular extension system for reliable tool use. In addition, we introduce a meta-agent that automates the synthesis, evaluation, and refinement of agent configurations through a build-test-improve loop, enabling rapid adaptation to new tasks, environments, and tool stacks. Instantiated with these mechanisms, CCA demonstrates strong performance on real-world software engineering tasks. On SWE-Bench-Pro, CCA achieves a Resolve@1 of 54.3%, surpassing both research-grade and proprietary coding agents under comparable model conditions. Together, the Confucius SDK and CCA form a general, extensible, and production-grade foundation for building robust coding agents, bridging the gap between research prototypes and practical large-scale deployment.
- Abstract(参考訳): 現実世界のソフトウェアエンジニアリングタスクには、大量のリポジトリ上で動作し、長期セッションを維持し、テスト時に複雑なツールチェーンを確実に調整するコーディングエージェントが必要です。
既存の研究グレードのエージェントは透明性を提供するが、現実のワークロードにスケールした場合に苦労する一方で、プロプライエタリなシステムは強力な実用的なパフォーマンスを実現するが、拡張性、解釈性、制御性は制限される。
エンタープライズレベルのコードベースで運用可能なスケーラブルなソフトウェアエンジニアリングエージェントであるConfucius Code Agent(CCA)を紹介します。
CCAはConfucius SDK上に構築されており、エージェントエクスペリエンス(AX)、ユーザエクスペリエンス(UX)、開発者エクスペリエンス(DX)の3つの補完的な視点に基づいて構成されているエージェント開発プラットフォームである。
このSDKは、統合オーケストレータと階層的な作業メモリを組み込んだ長文操作、クロスセッション連続学習のための永続的なメモ取り機構、信頼性の高いツール使用のためのモジュール拡張システムを統合する。
さらに,ビルド-テスト-インプロブループを通じてエージェント構成の合成,評価,改善を自動化するメタエージェントを導入し,新しいタスクや環境,ツールスタックへの迅速な適応を可能にする。
これらのメカニズムを具体化して、CCAは現実世界のソフトウェアエンジニアリングタスクに強いパフォーマンスを示す。
SWE-Bench-Proでは、CCAが54.3%のResolve@1を達成する。
Confucius SDKとCCAは共に、堅牢なコーディングエージェントを構築するための汎用的で拡張性があり、プロダクショングレードの基盤を形成し、研究プロトタイプと大規模デプロイメントのギャップを埋めている。
関連論文リスト
- The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents [46.254487394746725]
本稿では,ソフトウェア開発エージェントを実装するツールキットであるOpenHands Software Agent SDKを紹介する。
柔軟性を達成するために、デフォルトケースで数行のコードしか必要としないエージェントを実装するためのシンプルなインターフェースを設計する。
セキュリティと信頼性のために、シームレスなローカル-リモート実行ポータビリティ、REST/WebSocketサービスの統合を提供する。
論文 参考訳(メタデータ) (2025-11-05T18:16:44Z) - Open Agent Specification (Agent Spec): A Unified Representation for AI Agents [10.685555728094338]
我々はAIエージェントとエージェントを定義する宣言型言語Open Agent Specification(Agent Spec)を紹介する。
Agent Specは、コンポーネント、コントロールとデータフローのセマンティクス、スキーマの共通セットを定義し、エージェントを一度定義し、異なるランタイム間で実行できるようにする。
論文 参考訳(メタデータ) (2025-10-05T12:26:42Z) - AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - AgentMesh: A Cooperative Multi-Agent Generative AI Framework for Software Development Automation [0.0]
ソフトウェア開発タスクの自動化に複数のLCMエージェントを併用したPythonベースのフレームワークを提案する。
AgentMeshでは、Planner、Coder、Debugger、Reviewerといった特殊なエージェントが協力して、ハイレベルな要件を完全に実現されたコードに変換する。
論文 参考訳(メタデータ) (2025-07-26T10:10:02Z) - Unified Software Engineering agent as AI Software Engineer [14.733475669942276]
大規模言語モデル(LLM)技術は、自動コーディングに対する期待を高めた。
本稿では,統一ソフトウェア工学エージェントやUSEagentを開発することによって,この問題を理解することを目的とする。
私たちはUSEagentを、AIと人間の両方を含む将来のソフトウェア開発チームのチームメンバーになる、将来のAIソフトウェアエンジニアの最初のドラフトとして考えています。
論文 参考訳(メタデータ) (2025-06-17T16:19:13Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。