論文の概要: A Large-Scale Empirical Study of AI-Generated Code in Real-World Repositories
- arxiv url: http://arxiv.org/abs/2603.27130v2
- Date: Fri, 03 Apr 2026 07:17:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 12:42:34.075353
- Title: A Large-Scale Empirical Study of AI-Generated Code in Real-World Repositories
- Title(参考訳): 実世界のリポジトリにおけるAI生成コードの大規模実証的研究
- Authors: Tianhao Mao, Dongfang Zhao, Haixu Tang, Xiaofeng Wang, Hang Zhang,
- Abstract要約: 実世界のリポジトリから収集したAI生成コードについて,大規模な実証的研究を行った。
複雑度,構造特性,欠陥関連指標などのコードレベルの特性について検討する。
我々の研究は、AI支援開発が従来の人間主導開発とどのように異なるかを強調した。
- 参考スコア(独自算出の注目度): 11.883159173351743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly used in software development, generating code that ranges from short snippets to substantial project components. As AI-generated code becomes more common in real-world repositories, it is important to understand how it differs from human-written code and how AI assistance may influence development practices. However, existing studies have largely relied on small-scale or controlled settings, leaving a limited understanding of AI-generated code in the wild. In this work, we present a large-scale empirical study of AI-generated code collected from real-world repositories. We examine both code-level properties, including complexity, structural characteristics, and defect-related indicators, and commit-level characteristics, such as commit size, activity patterns, and post-commit evolution. To support this study, we develop a detection pipeline that combines heuristic filtering with LLM-based classification to identify AI-generated code and construct a large-scale dataset for analysis. Our study provides a comprehensive view of the characteristics of AI-generated code in practice and highlights how AI-assisted development differs from conventional human-driven development. These findings contribute to a better understanding of the real-world impact of AI-assisted programming and offer an empirical basis for future research on AI-generated software.
- Abstract(参考訳): 大規模言語モデル(LLM)は、短いスニペットから実質的なプロジェクトコンポーネントまで、様々なコードを生成するソフトウェア開発でますます使われている。
AI生成コードが現実のリポジトリで一般的になるにつれて、人間が書いたコードとどのように違うのか、AIアシストが開発プラクティスにどのように影響するかを理解することが重要です。
しかし、既存の研究は、主に小規模または制御された設定に依存しており、AI生成コードの理解は限られている。
本研究では,実世界のリポジトリから収集したAI生成コードについて,大規模な実証的研究を行う。
複雑度,構造特性,欠陥関連指標などのコードレベルの特性とコミットサイズ,アクティビティパターン,コミット後の進化といったコミットレベルの特性について検討した。
この研究を支援するために、ヒューリスティックフィルタリングとLLMに基づく分類を組み合わせた検出パイプラインを開発し、AI生成コードを特定し、分析のための大規模データセットを構築する。
本研究は,AI生成コードの特徴を包括的に把握し,AI支援開発が従来の人間による開発とどのように異なるかを明らかにする。
これらの発見は、AI支援プログラミングの現実世界への影響をよりよく理解し、AI生成ソフトウェアに関する将来の研究の実証的な基礎を提供する。
関連論文リスト
- From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - Embodied AI: From LLMs to World Models [65.68972714346909]
人工知能(AI)は、人工知能(AGI)を実現するためのインテリジェントシステムパラダイムである。
近年のLarge Language Models(LLMs)とWorld Models(WMs)のブレークスルーは、AIを具現化する上で大きな注目を集めている。
論文 参考訳(メタデータ) (2025-09-24T11:37:48Z) - A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code [49.009041488527544]
A.S.Eは、AI生成コードのセキュリティを評価するためのリポジトリレベルの評価ベンチマークである。
現在の大規模言語モデル(LLM)は、セキュアなコーディングに苦戦している。
大きな推論予算は、必ずしもより良いコード生成につながるとは限らない。
論文 参考訳(メタデータ) (2025-08-25T15:11:11Z) - Synthetic Data Generation Using Large Language Models: Advances in Text and Code [0.0]
大規模言語モデル(LLM)は、自然言語とコードドメインの両方で合成トレーニングデータ生成を変換している。
我々は、プロンプトベースの生成、検索拡張パイプライン、反復的な自己精製といった重要なテクニックを強調した。
本稿では,生成テキストにおける事実的不正確性,文体的あるいは分布的リアリズムの不足,バイアス増幅のリスクなど,関連する課題について論じる。
論文 参考訳(メタデータ) (2025-03-18T08:34:03Z) - Bridging LLM-Generated Code and Requirements: Reverse Generation technique and SBC Metric for Developer Insights [0.0]
本稿では,SBCスコアと呼ばれる新しいスコアリング機構を提案する。
これは、大規模言語モデルの自然言語生成能力を活用するリバースジェネレーション技術に基づいている。
直接コード解析とは異なり、我々のアプローチはAI生成コードからシステム要求を再構築し、元の仕様と比較する。
論文 参考訳(メタデータ) (2025-02-11T01:12:11Z) - An Empirical Study on Automatically Detecting AI-Generated Source Code: How Far Are We? [8.0988059417354]
本稿では,AI生成コード検出の性能向上のための様々な手法を提案する。
我々の最良のモデルは最先端のAI生成コード検出器(GPTSniffer)より優れており、F1スコアは82.55である。
論文 参考訳(メタデータ) (2024-11-06T22:48:18Z) - When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。
具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。
コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文 参考訳(メタデータ) (2023-08-29T17:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。