論文の概要: The End of Code Review: Coding Agents Supersede Human Inspection
- arxiv url: http://arxiv.org/abs/2606.13175v1
- Date: Thu, 11 Jun 2026 10:43:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.732495
- Title: The End of Code Review: Coding Agents Supersede Human Inspection
- Title(参考訳): コードレビューの終わり:コーディングエージェントが人間の検査に取って代わる
- Authors: Martin Monperrus,
- Abstract要約: コーディングエージェントは、従来のヒューマンコードレビューがもはやソフトウェア品質パイプラインに必要なコンポーネントではないような、能力のしきい値を越えた、と私たちは主張しています。
コードレビューの指示されたすべてのゴールは、より低コストで高いスループットでエージェントによって提供されます。
- 参考スコア(独自算出の注目度): 7.017303286271101
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code review has been the primary quality gate in software development since Fagan formalised code inspection in 1976. For five decades, having a human examine and comment on a colleague's changes before merge has been a cornerstone practice at organisations of every size. Coding agents are large language model (LLM)-based autonomous systems capable of reading, writing, testing, and repairing software. We argue that coding agents have crossed a threshold of capability at which traditional human code review is no longer a necessary component of a software quality pipeline. Our argument rests on two claims: every stated goal of code review can be served by agents at lower cost and higher throughput; the naive integration in which agents write code and humans remain the mandatory reviewers is a dead end because it neither provides meaningful assurance nor scales with AI-assisted throughput.
- Abstract(参考訳): コードレビューは、1976年にファーガンがコードインスペクションを公式化して以来、ソフトウェア開発における主要な品質ゲートとなっている。
合併前は、人間による検査と同僚の変更についてコメントすることが、あらゆる規模の組織において基礎となる実践であった。
コーディングエージェントは、大規模言語モデル(LLM)ベースの自律システムで、ソフトウェアを読み書き、テストし、修復することができる。
コーディングエージェントは、従来のヒューマンコードレビューがもはやソフトウェア品質パイプラインに必要なコンポーネントではないような、能力のしきい値を越えた、と私たちは主張しています。
エージェントがコードを書き、人間を必須のレビュアーとして残すことは、意味のある保証もAI支援のスループットのスケールも提供しないため、致命的な統合です。
関連論文リスト
- Code as Agent Harness [107.31925305395957]
新興のエージェントシステムでは、コードはもはや単なる目標出力ではない。
コードはエージェントの推論、行動、環境モデリング、実行ベースの検証のための運用上の基盤としてますます役立っている。
この調査は、実行可能、検証可能、ステートフルなAIエージェントシステムに向けた統一されたロードマップを提供する。
論文 参考訳(メタデータ) (2026-05-18T17:59:03Z) - Rethinking Code Review in the Age of AI: A Vision for Agentic Code Review [2.2807488730605296]
本稿では,AIを利用したコードレビューワークフローの構想について述べる。
信頼性、バイアス、プライバシー、自動化バイアス、透明性、評価など、責任ある採用に対する大きなオープンな課題を特定します。
論文 参考訳(メタデータ) (2026-05-17T17:04:21Z) - SlopCodeBench: Benchmarking How Coding Agents Degrade Over Long-Horizon Iterative Tasks [55.76734816061826]
我々は20の問題と93のチェックポイントからなる言語に依存しないベンチマークであるSlopCodeBenchを紹介する。
我々は、冗長性、重複コードの割合、構造的侵食という2つの軌道レベルの品質信号を追跡する。
11モデルにまたがるエンドツーエンドの問題を解決するエージェントは存在しない。
論文 参考訳(メタデータ) (2026-03-25T19:26:44Z) - Code Review Agent Benchmark [11.281773600529212]
AIエージェントが動作するためのコードレビューデータセットをキュレートします。
評価フレームワークは、コードレビューエージェントのレビュー機能を評価することができる。
これがコード生成エージェント、テスト生成エージェント、コードレビューエージェントの今後のコラボレーションにとって何を意味するのかは、まだ調査されていない。
論文 参考訳(メタデータ) (2026-03-24T17:19:32Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文 参考訳(メタデータ) (2024-10-02T09:11:10Z) - CodeAgent: Autonomous Communicative Agents for Code Review [12.163258651539236]
コードレビュー自動化のための新しいマルチエージェント大規模言語モデル(LLM)システムであるツールを紹介する。
CodeAgentは、すべてのエージェントのコントリビューションが初期レビュー問題に対処するように、監督エージェントであるQA-Checkerを組み込んでいる。
結果はCodeAgentの有効性を実証し、コードレビュー自動化の新たな最先端に寄与している。
論文 参考訳(メタデータ) (2024-02-03T14:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。