論文の概要: TDD Governance for Multi-Agent Code Generation via Prompt Engineering
- arxiv url: http://arxiv.org/abs/2604.26615v1
- Date: Wed, 29 Apr 2026 12:43:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.398167
- Title: TDD Governance for Multi-Agent Code Generation via Prompt Engineering
- Title(参考訳): プロンプトエンジニアリングによるマルチエージェントコード生成のためのTDDガバナンス
- Authors: Tarlan Hasanli, Shahbaz Siddeeq, Bishwash Khanal, Pyry Kotilainen, Tommi Mikkonen, Pekka Abrahamsson,
- Abstract要約: 大規模言語モデル(LLM)はソフトウェア開発を加速するが、不安定性、非決定性、制約のない状況下での開発の規律への弱い固執を示すことが多い。
我々は、古典的なTDD原則を構造化されたプロンプトレベルおよびワークフローレベルのガバナンスメカニズムとして運用する、AIネイティブなTDDフレームワークを提案する。
- 参考スコア(独自算出の注目度): 2.013170973610094
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large language models (LLMs) accelerate software development but often exhibit instability, non-determinism, and weak adherence to development discipline in unconstrained workflows. While test-driven development (TDD) provides a structured Red-Green-Refactor process, existing LLM-based approaches typically use tests as auxiliary inputs rather than enforceable process constraints. We present an AI-native TDD framework that operationalizes classical TDD principles as structured prompt-level and workflow-level governance mechanisms. Extracted principles are formalized in a machine-readable manifesto and distributed across planning, generation, repair, and validation stages within a layered architecture that separates model proposal from deterministic engine authority. The system enforces phase ordering, bounded repair loops, validation gates, and atomic mutation control to improve stability and reproducibility. We describe architecture and discuss encoding software engineering discipline directly into prompt orchestration, which we think offers a promising direction for reliable LLM-assisted development.
- Abstract(参考訳): 大規模言語モデル(LLM)はソフトウェア開発を加速するが、不安定性、非決定性、制約のないワークフローにおける開発の規律への弱い固執を示すことが多い。
テスト駆動開発(TDD)は構造化されたRed-Green-Refactorプロセスを提供するが、既存のLCMベースのアプローチでは、強制可能なプロセス制約ではなく、補助的な入力としてテストを使用するのが一般的である。
我々は、古典的なTDD原則を構造化されたプロンプトレベルおよびワークフローレベルのガバナンスメカニズムとして運用する、AIネイティブなTDDフレームワークを提案する。
抽出された原則は、マシン可読なマニフェストで形式化され、決定論的エンジン権限からモデル提案を分離する階層アーキテクチャ内の計画、生成、修復、検証段階に分散されます。
このシステムは、安定性と再現性を改善するために、位相整列、境界修復ループ、バリデーションゲート、原子突然変異制御を実行する。
アーキテクチャを記述し,ソフトウェア工学の規律を直接,迅速なオーケストレーションに変換する方法について論じる。
関連論文リスト
- Shift-Up: A Framework for Software Engineering Guardrails in AI-native Software Development -- Initial Findings [1.1523102135577732]
Generative AI(GenAI)は、開発を手作業によるコーディングからエージェント駆動の実装に移行することで、ソフトウェアエンジニアリングを再構築する。
本稿では,GenAIネイティブ開発のための構造的ガードレールとして,実行可能な要件(BDD)やアーキテクチャモデリング(C4),アーキテクチャ決定記録(ADR)といった,確立したソフトウェアエンジニアリングプラクティスを再解釈するフレームワークであるShift-Upを提案する。
論文 参考訳(メタデータ) (2026-04-22T10:55:57Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture [0.0]
Agentic AIは、ステートレスでプロンプト駆動型生成モデルからゴール指向システムへのアーキテクチャ移行を表す。
本稿では、知的エージェント理論と現代のLCM中心のアプローチを結びつけることによって、この遷移を考察する。
この研究は、標準化されたエージェントループ、登録、監査可能な制御機構への収束を特定する。
論文 参考訳(メタデータ) (2026-02-11T03:34:48Z) - Monadic Context Engineering [59.95390010097654]
本稿では,エージェント設計の正式な基盤を提供するために,モナディックコンテキストエンジニアリング(MCE)を紹介する。
我々は、モナドがロバストなコンポジションをどのように実現し、Applicativesが並列実行に原則化された構造を提供し、また、モナドトランスフォーマーがこれらの機能の体系的なコンポジションをどのように可能にしているかを実証する。
この階層化されたアプローチにより、開発者は、単純で独立した検証可能なコンポーネントから、複雑でレジリエントで効率的なAIエージェントを構築することができる。
論文 参考訳(メタデータ) (2025-12-27T01:52:06Z) - KAT-Coder Technical Report [48.00975798131211]
KAT-Coderは、中期訓練、監視ファインチューニング(SFT)、強化ファインチューニング(RFT)、強化デプロイ適応(Reinforcement-to-Deployment Adaptation)を含む多段階のカリキュラムを通じて訓練された大規模なエージェントコードモデルである。
これらの段階により、KAT-Coderは堅牢なツール使用信頼性、命令アライメント、長いコンテキスト推論を実現することができる。
論文 参考訳(メタデータ) (2025-10-21T16:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。