論文の概要: AI-Generated Smells: An Analysis of Code and Architecture in LLM and Agent-Driven Development
- arxiv url: http://arxiv.org/abs/2605.02741v1
- Date: Mon, 04 May 2026 15:41:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.385412
- Title: AI-Generated Smells: An Analysis of Code and Architecture in LLM and Agent-Driven Development
- Title(参考訳): AI生成スメル: LLMとエージェント駆動開発におけるコードとアーキテクチャの分析
- Authors: Yuecai Zhu, Nikolaos Tsantalis, Peter C. Rigby,
- Abstract要約: 本稿では,AI生成ソフトウェアにおける技術的負債の体系的な監査について述べる。
AIは欠陥を排除せず、むしろ欠陥のマシンシグネチャを導入している。
将来的な進歩は、彼らが構築するソフトウェアが単に機能的であるだけでなく、メンテナンス可能であることを保証するために、明示的なアーキテクチャの展望を持つエージェントの装備に依存する、と結論付けています。
- 参考スコア(独自算出の注目度): 1.980498913496519
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The promise of Large Language Models in automated software engineering is often measured by functional correctness, overlooking the critical issue of long term maintainability. This paper presents a systematic audit of technical debt in AI-generated software, revealing that AI does not eliminate flaws but rather introduces a distinct machine signature of defects. Our multi-scale analysis, spanning single-file algorithmic tasks and complex, agent generated systems, identifies a fundamental Reasoning-Complexity Trade-off: as models become more capable, they generate increasingly bloated and coupled code. This architectural decay is so pronounced that we establish a Volume-Quality Inverse Law, where code volume is a near perfect predictor of structural degradation. Crucially, we demonstrate that neither functional correctness nor detailed prompting mitigates this decay. These findings challenge the current paradigm of prompt-driven generation, reframing the central problem of AI-based software engineering from one of code generation to one of architectural complexity management. We conclude that future progress depends on equipping agents with explicit architectural foresight to ensure the software they build is not just functional, but also maintainable.
- Abstract(参考訳): 自動ソフトウェアエンジニアリングにおける大規模言語モデルの約束はしばしば機能的正確性によって測定され、長期的な保守性の重要な問題を見落としている。
本稿では、AI生成ソフトウェアにおける技術的負債の体系的な監査を行い、AIが欠陥を排除せず、欠陥のマシンシグネチャを別々に導入することを明らかにする。
私たちのマルチスケール分析は、単一ファイルのアルゴリズムタスクと複雑なエージェント生成システムにまたがって、基本的な推論・複雑さのトレードオフを特定します。
このアーキテクチャの崩壊は、コードボリュームが構造劣化のほぼ完全な予測因子であるボリューム品質逆法(Volume-Quality Inverse Law)を確立するために非常に顕著である。
重要なことに、機能的正当性や詳細なプロンプトは、この崩壊を緩和しない。
これらの発見は、AIベースのソフトウェアエンジニアリングの中心的な問題を、コード生成の1つからアーキテクチャの複雑さ管理の1つに反映して、プロンプト駆動生成の現在のパラダイムに挑戦する。
将来的な進歩は、彼らが構築するソフトウェアが単に機能的であるだけでなく、メンテナンス可能であることを保証するために、明示的なアーキテクチャの展望を持つエージェントの装備に依存する、と結論付けています。
関連論文リスト
- Cognitive Atrophy and Systemic Collapse in AI-Dependent Software Engineering [0.0]
本稿では、技術者が論理的導出に代えて受動的AI検証を行う際に生じる隠れた搬送コストである"Epistemological Debt"を紹介する。
この負債は、根本原因分析に不可欠なメンタルモデルを侵食し、システムの複雑さと人間の理解のギャップを広げます。
2026年のAmazonの障害をケーススタディとして、この研究は「機械的収束」がシステム的脆弱性にどのように寄与するかを示した。
論文 参考訳(メタデータ) (2026-04-29T16:20:25Z) - Towards Automated Ontology Generation from Unstructured Text: A Multi-Agent LLM Approach [1.029029220360574]
大規模言語モデル(LLM)は将来性を示すが、どのアーキテクチャ設計が生成品質を駆動するかは定かではない。
本研究は、ドメイン固有の保険契約を用いて、これらの課題を調査するための制御された実験的研究である。
その結果,マルチエージェントアプローチは構造的品質を著しく向上し,クエリ可能性も適度に向上することがわかった。
論文 参考訳(メタデータ) (2026-04-25T00:58:17Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain [0.0]
品質駆動型推論時間スキャフォールドであるQoTを導入し,ユーザ目標をエンジニアリングステップの順序付きシーケンスに変換する。
QoTは、API設計、データ通信、ファイルシステムの3つの代表的なバックエンドエンジニアリング領域にまたがって評価する。
論文 参考訳(メタデータ) (2026-03-10T23:49:09Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - Lost in Code Generation: Reimagining the Role of Software Models in AI-driven Software Engineering [1.3124479769761592]
このシフトは、ソフトウェアモデルの再構築を動機付けている、と私たちは主張する。
事前の青写真としてのみ機能するのではなく、AI生成コードからモデルを取り出すことができる。
この役割では、モデルは人間の意図、AI生成、長期システムの進化の間の仲介者として機能する。
論文 参考訳(メタデータ) (2025-11-04T11:03:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。