論文の概要: Collaborator or Assistant? How AI Coding Agents Partition Work Across Pull Request Lifecycles
- arxiv url: http://arxiv.org/abs/2605.08017v2
- Date: Wed, 13 May 2026 02:55:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.797089
- Title: Collaborator or Assistant? How AI Coding Agents Partition Work Across Pull Request Lifecycles
- Title(参考訳): 協力者かアシスタントか?AIのコーディングエージェントは、プルリクエストライフサイクル全体にわたってどのように機能するか
- Authors: Young Jo, Chung, Safwat Hassan,
- Abstract要約: Initiator xr 分類法と6つの相互作用シナリオを用いて29,585のPRライフサイクルを分析した。
私たちは、協力者支援のスペクトルに沿ってツールを特徴付け、イニシアチブを再編成し、監視し、支持します。
我々は、PRにおける自動化、監視、およびガバナンスの研究のために、分類学、ツールごとのステートマシン、複製パッケージにコントリビュートする。
- 参考スコア(独自算出の注目度): 0.8777271346549705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When AI coding agents open branches and submit pull requests (PRs), two questions co-determine oversight design: who starts the work (operational agency) and who authorizes its completion (merge governance). We characterize tools along a Collaborator-Assistant spectrum in how they redistribute initiative, oversight, and endorsement, while merge governance remains predominantly human across five tools (OpenAI, Copilot, Devin, Cursor, Claude Code). We analyze 29,585 PR lifecycles using an Initiator x Approver taxonomy with six interaction scenarios; lifecycle reconstruction supplies the how behind those roles. Collaborator tools (Cursor, Devin, Copilot) concentrate operational initiative in agents that open and carry PR work forward, with humans retaining review and endorsement on the path to merge; Assistant tools (OpenAI, Claude) leave task direction primarily with humans and supply bounded support within human-led workflows. Across the spectrum, agency and governance decouple: Collaborator workflows are >=96% agent initiated, yet terminal merge authority remains almost exclusively human, with agent-classified approvers confined to a small fraction of PRs. Where automation executes a merge, logs record the executor but not the decision-maker, marking a boundary of observation. We contribute the taxonomy, per-tool state machines, and a replication package for research on automation, oversight, and governance in PR workflows.
- Abstract(参考訳): AIコーディングエージェントがブランチを開いてプルリクエスト(PR)を提出する場合、作業開始者(運用機関)と完了を承認する者(管理統合)という、2つの質問がオーバー監視設計を共同決定する。
私たちが特徴付けているのは、彼らがイニシアチブを再編成し、監視し、支持するのに対して、マージガバナンスは、主に5つのツール(OpenAI、Copilot、Devin、Cursor、Claude Code)にまたがって人間的です。
Initiator x Approver分類を用いて29,585のPRライフサイクルを6つの相互作用シナリオで分析する。
コラボレーションツール(Cursor, Devin, Copilot)は、PR作業のオープンと実行を行うエージェントに、人間によるマージのパスのレビューと支持を継続するとともに、運用上のイニシアティブに集中する。
協力者のワークフローは >=96% のエージェントが起動するが、ターミナルマージ権限はほぼ人間に限られており、エージェント分類の承認者は少数のPRに制限される。
自動化がマージを実行する場合、ログは実行者を記録するが、意思決定者ではない。
PRワークフローにおける自動化、監視、ガバナンスの研究のために、分類学、ツールごとのステートマシン、レプリケーションパッケージをコントリビュートします。
関連論文リスト
- Workstream: A Local-First Developer Command Center for the AI-Augmented Engineering Workflow [0.0]
プルリクエスト、タスク管理、カレンダ、AIによるコードレビュー、履歴レビューインテリジェンス、レポジトリAI対応スコアリング、エージェントオブザーバビリティを単一のインターフェースに集約する、オープンソースのローカルファーストの開発者コマンドセンタであるWorkstreamを紹介します。
システムアーキテクチャ、新しい5カテゴリAI準備度スコアリングアルゴリズム、チーム固有のパターンの歴史的PRレビューをマイニングするレビューインテリジェンスパイプライン、モデルコンテキストプロトコル(MCP)、エージェント・ツー・エージェント(A2A)、エージェント・オブザーバビリティ・プロトコル(AOP)を実装するエージェント・オブザーバビリティ・レイヤについて説明する。
論文 参考訳(メタデータ) (2026-04-18T16:24:29Z) - Humans Integrate, Agents Fix: How Agent-Authored Pull Requests Are Referenced in Practice [4.359007050137919]
エージェント-エージェント間およびエージェント-エージェント間相互作用におけるエージェント-認可されたPR参照の意図を特徴付けるための分類法を導入する。
我々の分析によると、人間はエージェントによるPRへの参照をほとんど開始するが、これらの相互作用の大部分はAIによる支援である。
参照/参照型PRは, 孤立型PRと比較して, 寿命とレビュー時間が著しく長いことが判明した。
論文 参考訳(メタデータ) (2026-04-05T11:04:46Z) - AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access [60.37646376282544]
本稿では,全検索ランキング研究パイプラインを自動化したAI共同科学者フレームワークを提案する。
これは、AIの共同科学者フレームワークをアルゴリズム研究に利用した、ランキングコミュニティで初めての研究である。
論文 参考訳(メタデータ) (2026-03-23T09:29:08Z) - Why Are AI Agent Involved Pull Requests (Fix-Related) Remain Unmerged? An Empirical Study [5.127121704630949]
AIDEV POPデータセットから広く使用されている5つのAIコーディングエージェントによって作成された8,106の修正関連PRを分析した。
以上の結果から,他のPRによるテストケース障害や,同じ問題に対する事前解決が,非統合の最も一般的な原因であることが示唆された。
論文 参考訳(メタデータ) (2026-01-29T22:06:58Z) - Early-Stage Prediction of Review Effort in AI-Generated Pull Requests [0.0]
我々は,2,807リポジトリにわたるAIDevデータセットから,エージェントによるPR33,707件を分析した。
本稿では,高解像度PRを生成時に予測するサーキットブレーカートリアージモデルを提案する。
論文 参考訳(メタデータ) (2026-01-02T17:18:01Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - WHALES: A Multi-Agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving [14.977628973132099]
WHALESは,通信対応エージェントスケジューリングとスケーラブルな協調認識のベンチマークのために設計された,最初の大規模V2Xデータセットである。
WHALESは、シーンごとに平均8.4の協調エージェントと、さまざまな交通シナリオにまたがる2100万の注釈付き3Dオブジェクトを備えている。
リアルタイム通信ボトルネックをエミュレートするために、詳細な通信メタデータを組み込んでおり、スケジューリング戦略の厳密な評価を可能にしている。
論文 参考訳(メタデータ) (2024-11-20T14:12:34Z) - ProAgent: From Robotic Process Automation to Agentic Process Automation [87.0555252338361]
LLM(Large Language Models)は、人間のような知性を持つ言語である。
本稿では,ALMをベースとしたエージェントを用いた高度な自動化のための基盤的自動化パラダイムであるエージェントプロセス自動化(APA)を紹介する。
そして、人間の指示を駆使し、特殊エージェントの調整によって複雑な決定を下すように設計されたエージェントであるProAgentをインスタンス化する。
論文 参考訳(メタデータ) (2023-11-02T14:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。