論文の概要: IACDM: Interactive Adversarial Convergence Development Methodology -- A Structured Framework for AI-Assisted Software Development
- arxiv url: http://arxiv.org/abs/2604.16399v2
- Date: Thu, 30 Apr 2026 14:42:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.964394
- Title: IACDM: Interactive Adversarial Convergence Development Methodology -- A Structured Framework for AI-Assisted Software Development
- Title(参考訳): IACDM:AI支援ソフトウェア開発のための構造化フレームワーク
- Authors: Jasmine Moreira,
- Abstract要約: この記事では、障害は構造的な原因 – 検証のギャップ – を共有している、と論じる。
我々は,外部検証エージェントによる検証ギャップに対処するために,構造化された8フェーズフレームワークであるIACDMを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread adoption of AI-assisted development tools in 2025 -- and the emergence of vibe coding, a practice of generating complete applications from natural language without verification -- exposed a critical and tool-agnostic failure pattern: experienced developers who used frontier AI models were measurably slower in objective evaluations despite believing they were faster. Concurrently, 10.3% of AI-generated applications in a production showcase contained critical security flaws. This paper argues that these failures share a structural cause -- the verification gap: every large language model (LLM), regardless of interface or capability, operates as a stochastic generator with zero internal semantic verification capability. The tool is irrelevant; the process is determinative. We present IACDM (Interactive Adversarial Convergence Development Methodology), a structured 8-phase framework designed to address the verification gap through external verification agents (VA) operating at discrete gates. Its three pillars are: (1) deep problem discovery via Hierarchical Semantic Analysis before any technical solution; (2) persistent knowledge management across sessions; and (3) systematic adversarial critique through specialized lenses before implementation. The methodology is tool-agnostic by construction, grounded in established software engineering tradition, and applied across more than 20 projects by multiple practitioners in a production R&D environment. Limitations are formalized as testable hypotheses for future empirical validation.
- Abstract(参考訳): 2025年にAI支援開発ツールが広く採用され、検証なしで自然言語から完全なアプリケーションを生成するプラクティスであるビブコーディングが出現したことで、批判的でツールに依存しない障害パターンが明らかになった。
同時に、プロダクションにおけるAI生成アプリケーションの10.3%には、重大なセキュリティ欠陥が含まれている。
本稿では,これらの障害が構造的原因 – 検証ギャップ – インターフェースや能力に関わらず,すべての大規模言語モデル (LLM) が,内部的セマンティック検証能力がゼロな確率的生成器として機能する,と主張している。
ツールは無関係で、プロセスは決定的です。
IACDM(Interactive Adversarial Convergence Development Methodology, Interactive Adversarial Convergence Development Methodology, IACDM)は, 個別ゲートで動作している外部検証エージェント(VA)を介して, 検証ギャップに対処するための構造化8フェーズフレームワークである。
その3つの柱は,(1) 技術的解決前の階層的セマンティック分析による深い問題発見,(2) セッション間の永続的知識管理,(3) 実装前の特殊レンズによる体系的敵対的批判である。
この方法論は、構築によってツールに依存しず、確立されたソフトウェアエンジニアリングの伝統に根ざし、プロダクションR&D環境で複数の実践者が20以上のプロジェクトに適用します。
限界は将来の経験的検証のための検証可能な仮説として定式化される。
関連論文リスト
- Reasoning-Aware AIGC Detection via Alignment and Reinforcement [55.09684020007737]
REVEALは、分類の前に解釈可能な推論チェーンを生成するフレームワークである。
複数のベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-04-21T07:29:55Z) - XAI for Coding Agent Failures: Transforming Raw Execution Traces into Actionable Insights [0.0]
我々は、生エージェントの実行トレースを構造化された人間解釈可能な説明に変換する、体系的な説明可能なAI(XAI)アプローチを提案する。
提案手法では,障害原因の同定を2.8倍高速に行うことができ,実際の実行トレースよりも73%高い精度で修正を提案する。
論文 参考訳(メタデータ) (2026-03-06T06:18:20Z) - Agentic Problem Frames: A Systematic Approach to Engineering Reliable Domain Agents [0.0]
大きな言語モデル(LLM)は、自律的なエージェントへと進化していますが、現在の"フレームワークレス"な開発は、あいまいな自然言語に基づいています。
本研究では,内部モデルインテリジェンスからエージェントと環境間の構造的相互作用に焦点を移すシステム工学フレームワークであるエージェント問題フレーム(APF)を提案する。
論文 参考訳(メタデータ) (2026-02-22T06:32:32Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - PenForge: On-the-Fly Expert Agent Construction for Automated Penetration Testing [13.699270001160302]
PenForgeは、事前に用意されたエージェントに頼るのではなく、テスト中に専門家エージェントを動的に構築するフレームワークである。
CVE-Benchのエクスプロイト成功率は30.0%で、特に難しいゼロデイ設定では、最先端よりも3倍改善されている。
論文 参考訳(メタデータ) (2026-01-11T13:29:32Z) - LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering [90.84806758077536]
textbfLoCoBench-Agentは,大規模言語モデル(LLM)エージェントを現実的,長期的ソフトウェア工学で評価するための総合的な評価フレームワークである。
我々のフレームワークは、LoCoBenchの8000のシナリオを対話型エージェント環境に拡張し、マルチターン会話の体系的評価を可能にする。
我々のフレームワークは,8つの特殊なツール(ファイル操作,検索,コード解析)をエージェントに提供し,それを10Kから1Mトークンの範囲で評価する。
論文 参考訳(メタデータ) (2025-11-17T23:57:24Z) - A Survey of Vibe Coding with Large Language Models [93.88284590533242]
視覚符号化(Vibe Coding)は、開発者が成果観察を通じてAI生成の実装を検証する開発手法である。
変革の可能性にもかかわらず、この創発的パラダイムの有効性は未解明のままである。
この調査は、大規模な言語モデルによるVibe Codingの総合的かつ体系的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-10-14T11:26:56Z) - Towards the Next Generation of Software: Insights from Grey Literature on AI-Native Applications [13.876049229274114]
AIネイティブアプリケーションは、ソフトウェアの設計、開発、進化の方法を根本的に再定義する、ソフトウェアエンジニアリングの新しいパラダイムである。
人気が高まっているにもかかわらず、AIネイティブアプリケーションには、統一されたエンジニアリング定義とアーキテクチャの青写真がない。
本研究は、AIネイティブアプリケーションの定義特性、キー品質特性、および典型的な技術スタックを識別することにより、AIネイティブアプリケーションの包括的な理解を確立することを目的とする。
論文 参考訳(メタデータ) (2025-09-16T15:01:23Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。