論文の概要: Confucius Code Agent: An Open-sourced AI Software Engineer at Industrial Scale
- arxiv url: http://arxiv.org/abs/2512.10398v2
- Date: Fri, 12 Dec 2025 16:59:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 13:50:29.188186
- Title: Confucius Code Agent: An Open-sourced AI Software Engineer at Industrial Scale
- Title(参考訳): Confucius Code Agent: 産業規模のAIソフトウェアエンジニア
- Authors: Zhaodong Wang, Zhenting Qi, Sherman Wong, Nathan Hu, Samuel Lin, Jun Ge, Erwin Gao, Yining Yang, Ben Maurer, Wenlin Chen, David Recordon, Yilun Du, Minlan Yu, Ying Zhang,
- Abstract要約: 現実世界のAIソフトウェアエンジニアリングは、大量のリポジトリを推論し、長いセッションで耐久性のあるメモリを維持し、テスト時に複雑なツールチェーンを堅牢にコーディネートするコーディングエージェントを要求する。
我々は、産業規模で運用可能なオープンソースのAIソフトウェアエンジニアであるConfucius Code Agent(CCA)を紹介する。
- 参考スコア(独自算出の注目度): 41.97197079740127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world AI software engineering demands coding agents that can reason over massive repositories, maintain durable memory across and within long sessions, and robustly coordinate complex toolchains at test time. Existing open-source coding agents provide transparency but frequently fall short when pushed to these industrial-scale workloads, while proprietary coding agents offer strong practical performance but limited extensibility, interpretability, and controllability. We present the Confucius Code Agent (CCA), an open-sourced AI software engineer that can operate at an industrial scale. CCA is built atop the Confucius SDK, an open-sourced agent development platform designed around three complementary perspectives: Agent Experience (AX), User Experience (UX), and Developer Experience (DX). The SDK introduces a unified orchestrator with hierarchical working memory for long-context reasoning, a persistent note-taking system for cross-session continual learning, and a modular extension module for robust tool use. Moreover, a meta-agent automates the synthesis, evaluation, and refinement of agent configurations through a build-test-improve loop, enabling rapid agent development on new tasks, environments, and tool stacks. Instantiated on Confucius SDK with these mechanisms, CCA delivers strong performance on real-world software engineering tasks. On SWE-Bench-Pro, CCA achieves a state-of-the-art Resolve@1 performance of 54.3%, substantially improving over prior coding agents. Together, the Confucius SDK and CCA provide a transparent, extensible, and reproducible foundation for AI agents, bridge gaps between research prototypes and production-grade systems, and support agent development and deployment at industrial scale.
- Abstract(参考訳): 現実世界のAIソフトウェアエンジニアリングは、大量のリポジトリを推論し、長いセッションで耐久性のあるメモリを維持し、テスト時に複雑なツールチェーンを堅牢にコーディネートするコーディングエージェントを要求する。
既存のオープンソースコーディングエージェントは透明性を提供するが、これらの産業規模のワークロードにプッシュされると、しばしば不足する。
我々は、産業規模で運用可能なオープンソースのAIソフトウェアエンジニアであるConfucius Code Agent(CCA)を紹介する。
CCAは、エージェントエクスペリエンス(AX)、ユーザエクスペリエンス(UX)、開発者エクスペリエンス(DX)の3つの相補的な視点に基づいて設計された、オープンソースのエージェント開発プラットフォームであるConfucius SDKの上に構築されている。
SDKには、長期コンテキスト推論のための階層的なワーキングメモリを備えた統一的なオーケストレータ、クロスセッション連続学習のための永続的なメモ取りシステム、堅牢なツール使用のためのモジュール拡張モジュールが導入されている。
さらに、メタエージェントは、ビルド-テスト-インプロブループを通じてエージェント構成の合成、評価、改善を自動化することで、新しいタスク、環境、ツールスタック上でのエージェントの迅速な開発を可能にする。
Confucius SDKにこれらのメカニズムを組み込んだCCAは、現実世界のソフトウェアエンジニアリングタスクに強力なパフォーマンスを提供する。
SWE-Bench-Proでは、CCAは最先端のResolve@1のパフォーマンスを54.3%向上させ、従来のコーディングエージェントよりも大幅に改善した。
Confucius SDKとCCAは共に、AIエージェントの透明で拡張可能で再現可能な基盤、研究プロトタイプとプロダクショングレードシステムの間の橋渡し、産業規模でのエージェントの開発とデプロイメントのサポートを提供する。
関連論文リスト
- The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents [46.254487394746725]
本稿では,ソフトウェア開発エージェントを実装するツールキットであるOpenHands Software Agent SDKを紹介する。
柔軟性を達成するために、デフォルトケースで数行のコードしか必要としないエージェントを実装するためのシンプルなインターフェースを設計する。
セキュリティと信頼性のために、シームレスなローカル-リモート実行ポータビリティ、REST/WebSocketサービスの統合を提供する。
論文 参考訳(メタデータ) (2025-11-05T18:16:44Z) - Open Agent Specification (Agent Spec): A Unified Representation for AI Agents [10.685555728094338]
我々はAIエージェントとエージェントを定義する宣言型言語Open Agent Specification(Agent Spec)を紹介する。
Agent Specは、コンポーネント、コントロールとデータフローのセマンティクス、スキーマの共通セットを定義し、エージェントを一度定義し、異なるランタイム間で実行できるようにする。
論文 参考訳(メタデータ) (2025-10-05T12:26:42Z) - AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - AgentMesh: A Cooperative Multi-Agent Generative AI Framework for Software Development Automation [0.0]
ソフトウェア開発タスクの自動化に複数のLCMエージェントを併用したPythonベースのフレームワークを提案する。
AgentMeshでは、Planner、Coder、Debugger、Reviewerといった特殊なエージェントが協力して、ハイレベルな要件を完全に実現されたコードに変換する。
論文 参考訳(メタデータ) (2025-07-26T10:10:02Z) - Unified Software Engineering agent as AI Software Engineer [14.733475669942276]
大規模言語モデル(LLM)技術は、自動コーディングに対する期待を高めた。
本稿では,統一ソフトウェア工学エージェントやUSEagentを開発することによって,この問題を理解することを目的とする。
私たちはUSEagentを、AIと人間の両方を含む将来のソフトウェア開発チームのチームメンバーになる、将来のAIソフトウェアエンジニアの最初のドラフトとして考えています。
論文 参考訳(メタデータ) (2025-06-17T16:19:13Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。