論文の概要: AgenticFlict: A Large-Scale Dataset of Merge Conflicts in AI Coding Agent Pull Requests on GitHub
- arxiv url: http://arxiv.org/abs/2604.03551v1
- Date: Sat, 04 Apr 2026 02:36:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.634129
- Title: AgenticFlict: A Large-Scale Dataset of Merge Conflicts in AI Coding Agent Pull Requests on GitHub
- Title(参考訳): AgenticFlict: GitHub上のAIコーディングエージェントプルリクエストにおけるマージ競合の大規模データセット
- Authors: Daniel Ogenrwot, John Businge,
- Abstract要約: AIコーディングエージェントプルリクエスト(Agentic PR)におけるマージ競合の大規模データセットを提案する。
パイプラインは、マージ競合を示す29K以上のPRを特定し、競合率は27.67%となり、336K以上のきめ細かい競合領域を抽出する。
我々の予備的な探索分析は、マージコンフリクトがAIによるコントリビューションにおいて頻繁かつ頻繁であることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software Engineering 3.0 marks a paradigm shift in software development, in which AI coding agents are no longer just assistive tools but active contributors. While prior empirical studies have examined productivity gains and acceptance patterns in AI-assisted development, the challenges associated with integrating agent-generated contributions remain less understood. In particular, merge conflicts, a fundamental aspect of collaborative software development, remain underexplored in this context. In this paper, we present AgenticFlict, a large-scale dataset of textual merge conflicts in AI coding agent pull requests (Agentic PRs). The dataset comprises 142K+ Agentic PRs collected from 59K+ repositories, of which 107K+ are successfully processed through deterministic merge simulation. Our pipeline identifies 29K+ PRs exhibiting merge conflicts, yielding a conflict rate of 27.67%, and extracts 336K+ fine-grained conflict regions across these instances. Our preliminary exploratory analysis indicates that merge conflicts are both frequent and often substantial in AI-generated contributions, with noticeable variation across agents, emphasizing the need to better understand and manage integration challenges in AI-assisted software development. The dataset, code and supplementary materials are available in zenodo: https://doi.org/10.5281/zenodo.19396917.
- Abstract(参考訳): ソフトウェアエンジニアリング 3.0は、AIコーディングエージェントがもはや単なる補助ツールではなく、積極的なコントリビュータである、ソフトウェア開発のパラダイムシフトである。
これまでの実証研究では、AI支援開発における生産性向上と受容パターンについて検討されてきたが、エージェント生成コントリビューションの統合に関わる課題は理解されていない。
特に、コラボレーションソフトウェア開発の基本的な側面であるマージコンフリクトは、この文脈では未熟である。
本稿では,AI符号化エージェントプルリクエスト(Agentic PR)におけるテキストマージ競合の大規模データセットであるAgenticFlictを提案する。
このデータセットは、59K+リポジトリから収集された142K+エージェントPRで構成され、うち107K+は決定論的マージシミュレーションによってうまく処理される。
パイプラインは、マージ競合を示す29K以上のPRを特定し、コンフリクトレートが27.67%となり、これらのインスタンスにわたって336K以上のきめ細かいコンフリクト領域を抽出する。
我々の予備的な探索分析は、マージコンフリクトがAIが生成するコントリビューションにおいて頻繁かつしばしば実質的であり、エージェント間で顕著なばらつきがあり、AI支援ソフトウェア開発における統合課題をよりよく理解し管理する必要性を強調していることを示している。
データセット、コード、補足資料は zenodo: https://doi.org/10.5281/zenodo. 19396917. で利用可能である。
関連論文リスト
- Effective Strategies for Asynchronous Software Engineering Agents [52.76455094324273]
本稿では,集中型タスクデリゲート,非同期実行,独立したワークスペースという,3つのSWEプリミティブに根ざした構造化マルチエージェント協調パラダイムを導入する。
CAIDは,紙再生タスク(PaperBench)では26.7%,Pythonライブラリ開発タスクでは14.3%,単一エージェントベースラインでは26.7%の精度向上を実現している。
論文 参考訳(メタデータ) (2026-03-23T02:26:35Z) - When AI Teammates Meet Code Review: Collaboration Signals Shaping the Integration of Agent-Authored Pull Requests [0.0]
公開AIDevデータセットを用いて,統合結果,分解速度,レビュータイムの協調信号について検討した。
レビューア・エンゲージメントは、成功裏に最も強い相関関係があるのに対して、大きな変更サイズと調整中断アクションは、マージの可能性の低下に関連している。
論文 参考訳(メタデータ) (2026-02-23T02:20:56Z) - AIDev: Studying AI Coding Agents on GitHub [9.1677959533705]
AIDevはエージェントによるプルリクエスト(Agentic-PR)に焦点を当てた大規模なデータセットで、現実のGitHubリポジトリに導入しています。
AIDevは、OpenAI Codex、Devin、GitHub Copilot、Cursor、Claude Codeという5つのエージェントによって生成された932,791のエージェント-PRを集約する。
さらに、AIDevには、100以上の星を持つ2,807のリポジトリから33,596のAgentic-PRのキュレートされたサブセットが含まれており、コメント、レビュー、コミット、関連する問題などのさらなる情報を提供している。
論文 参考訳(メタデータ) (2026-02-09T20:45:58Z) - Why Are AI Agent Involved Pull Requests (Fix-Related) Remain Unmerged? An Empirical Study [5.127121704630949]
AIDEV POPデータセットから広く使用されている5つのAIコーディングエージェントによって作成された8,106の修正関連PRを分析した。
以上の結果から,他のPRによるテストケース障害や,同じ問題に対する事前解決が,非統合の最も一般的な原因であることが示唆された。
論文 参考訳(メタデータ) (2026-01-29T22:06:58Z) - AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development [12.50615284537175]
大規模言語モデル(LLM)ベースのコーディングエージェントは、プルリクエストの生成とマージを行う自律的なコントリビュータとして機能するようになっている。
本稿では,オープンソースリポジトリにおけるエージェント導入の経時的因果関係について検討する。
論文 参考訳(メタデータ) (2026-01-20T04:51:56Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - CoDA: Agentic Systems for Collaborative Data Visualization [57.270599188947294]
深層研究はデータ分析に革命をもたらしたが、データサイエンティストは依然として手作業による視覚化にかなりの時間を費やしている。
単純なシングルエージェントシステムやマルチエージェントシステムを含む既存のアプローチは、しばしばタスクを単純化する。
本稿では,メタデータ分析,タスク計画,コード生成,自己回帰に特殊なLLMエージェントを利用するマルチエージェントシステムであるCoDAを紹介する。
論文 参考訳(メタデータ) (2025-10-03T17:30:16Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。