論文の概要: Inside the Scaffold: A Source-Code Taxonomy of Coding Agent Architectures
- arxiv url: http://arxiv.org/abs/2604.03515v1
- Date: Fri, 03 Apr 2026 23:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.617669
- Title: Inside the Scaffold: A Source-Code Taxonomy of Coding Agent Architectures
- Title(参考訳): Scaffoldの内部: コーディングエージェントアーキテクチャのソースコード分類
- Authors: Benjamin Rombaut,
- Abstract要約: LLMベースのコーディングエージェントは、バグをローカライズし、パッチを生成し、人間の監視を減らしてテストを実行することができる。
言語モデル(制御ループ、ツール定義、状態管理、コンテキスト戦略)を取り巻く足場コードは、まだ理解されていないままです。
本稿では,13個のオープンソースコーディングエージェントの足場の解析から得られた,ソースコードレベルのアーキテクチャ分類について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based coding agents can localize bugs, generate patches, and run tests with diminishing human oversight, yet the scaffolding code that surrounds the language model (the control loop, tool definitions, state management, and context strategy) remains poorly understood. Existing surveys classify agents by abstract capabilities (tool use, planning, reflection) that cannot distinguish between architecturally distinct systems, and trajectory studies observe what agents do without examining the scaffold code that determines why. This paper presents a source-code-level architectural taxonomy derived from analysis of 13 open-source coding agent scaffolds at pinned commit hashes. Each agent is characterized across 12 dimensions organized into three layers: control architecture, tool and environment interface, and resource management. The analysis reveals that scaffold architectures resist discrete classification: control strategies range from fixed pipelines to Monte Carlo Tree Search, tool counts range from 0 to 37, and context compaction spans seven distinct strategies. Five loop primitives (ReAct, generate-test-repair, plan-execute, multi-attempt retry, tree search) function as composable building blocks that agents layer in different combinations; 11 of 13 agents compose multiple primitives rather than relying on a single control structure. Dimensions converge where external constraints dominate (tool capability categories, edit formats, execution isolation) and diverge where open design questions remain (context compaction, state management, multi-model routing). All taxonomic claims are grounded in file paths and line numbers, providing a reusable reference for researchers studying agent behavior and practitioners designing new scaffolds.
- Abstract(参考訳): LLMベースのコーディングエージェントは、バグをローカライズし、パッチを生成し、人間の監視を減らしながらテストを実行することができるが、言語モデル(制御ループ、ツール定義、状態管理、コンテキスト戦略)を取り巻く足場コードは、いまだに理解されていない。
既存の調査では、抽象的な能力(ツールの使用、計画、リフレクション)によってエージェントを分類しているが、アーキテクチャ的に異なるシステムを区別できない。
本稿では,13個のオープンソースコーディングエージェントをピン付きコミットハッシュで解析した結果から,ソースコードレベルのアーキテクチャ分類法を提案する。
各エージェントは,コントロールアーキテクチャ,ツールと環境インターフェース,リソース管理という,12の次元にまたがる3つのレイヤで構成されている。
コントロール戦略は固定パイプラインからモンテカルロ木探索、ツールカウントは0から37、コンテキスト圧縮は7つの異なる戦略にまたがる。
5つのループプリミティブ(ReAct, generate-test-repair, plan-execute, multi-attempt retry, tree search)は、異なる組み合わせをエージェントとする構成可能なビルディングブロックとして機能する。
ディメンジョンは、外部制約が支配する部分(ツール機能カテゴリ、フォーマットの編集、実行隔離)と、オープンデザインの疑問が残る部分(コンテキストのコンパクト化、状態管理、マルチモデルルーティング)に収束する。
すべての分類学的クレームはファイルパスと行番号に基礎を置いており、エージェントの振る舞いを研究する研究者や新しい足場を設計する実践者にとって再利用可能な参照を提供する。
関連論文リスト
- OrgAgent: Organize Your Multi-Agent System like a Company [75.47076168155817]
企業スタイルの階層型マルチエージェントフレームワークであるOrgAgentを紹介します。
企業スタイルの階層で組織されたマルチエージェントシステムは、一般的に他の組織構造よりも優れています。
論文 参考訳(メタデータ) (2026-04-01T15:21:14Z) - Improving Coherence and Persistence in Agentic AI for System Optimization [9.443037059325086]
Engramは、反復的にメカニズムを設計、テスト、分析する一連のエージェントを探索する。
本研究では,マルチクラウドマルチキャスト推論,LLM要求ルーティング,自然言語クエリを用いたデータベースにおけるKVキャッシュ再利用の最適化など,さまざまな領域において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2026-03-22T17:04:50Z) - Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文 参考訳(メタデータ) (2026-03-02T12:50:40Z) - Theory of Code Space: Do Code Agents Understand Software Architecture? [0.0]
コードエージェントは、分離されたタスクで優れているが、アーキテクチャの理解を必要とするマルチファイルソフトウェアエンジニアリングと苦労する。
エージェントがAI探索中に一貫性のあるアーキテクチャの信念を構築し、維持し、更新できるかどうかを評価するベンチマークである、コード空間の理論(ToCS)を紹介する。
論文 参考訳(メタデータ) (2026-02-28T11:40:17Z) - A Hierarchical Multi-Agent System for Autonomous Discovery in Geoscientific Data Archives [0.0]
PANGAEA-GPTは、自律的なデータ発見と分析のために設計された階層型マルチエージェントフレームワークである。
標準のLarge Language Model (LLM)ラッパーとは異なり、我々のアーキテクチャは集中型スーパーバイザ-ワーバートポロジを実装している。
人間の介入を最小限に抑えながら、複雑な多段階決定論的ランタイムを実行するシステムの能力を実証する。
論文 参考訳(メタデータ) (2026-02-24T20:37:38Z) - LogicLens: Leveraging Semantic Code Graph to explore Multi Repository large systems [0.2519906683279152]
複雑なソフトウェアシステムの探索を支援するリアクティブ対話エージェントであるLogicLensを紹介する。
本稿では,システムのアーキテクチャを提示し,創発的行動について議論し,実世界のマルチリポジトリのシナリオ上での有効性を評価する。
論文 参考訳(メタデータ) (2026-01-15T15:35:23Z) - OctoBench: Benchmarking Scaffold-Aware Instruction Following in Repository-Grounded Agentic Coding [57.39403818250357]
ここでは,レポジトリベースエージェントコーディングにおける足場認識命令のベンチマークを行うOctoBenchを紹介する。
OctoBenchは34の環境と217のタスクを3つの足場タイプでインスタンス化し、7,098の客観的チェックリストアイテムとペアリングする。
実験により、タスク解決と足場対応の体系的なギャップが明らかになり、トレーニングと評価の必要性が強調される。
論文 参考訳(メタデータ) (2026-01-15T12:36:08Z) - Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。