論文の概要: Self-Admitted GenAI Usage in Open-Source Software
- arxiv url: http://arxiv.org/abs/2507.10422v2
- Date: Tue, 15 Jul 2025 07:34:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 15:29:04.888853
- Title: Self-Admitted GenAI Usage in Open-Source Software
- Title(参考訳): オープンソースソフトウェアにおけるSelf-Admitted GenAI利用
- Authors: Tao Xiao, Youmei Fan, Fabio Calefato, Christoph Treude, Raula Gaikovina Kula, Hideaki Hata, Sebastian Baltes,
- Abstract要約: 我々は、開発者がソフトウェアアーティファクトのコンテンツ作成にGenAIツールを使うことを明示的に言及する、自称GenAI利用の概念を紹介した。
我々は25万以上のGitHubリポジトリのキュレートされたサンプルを分析し、コミットメッセージ、コードコメント、プロジェクトドキュメントで156リポジトリにまたがる1292の自己承認を識別した。
我々の調査によると、開発者はプロジェクトにおいてGenAIがどのように使われているのかを積極的に管理し、プロジェクトレベルの透明性の必要性を強調しています。
- 参考スコア(独自算出の注目度): 14.503048663131574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread adoption of generative AI (GenAI) tools such as GitHub Copilot and ChatGPT is transforming software development. Since generated source code is virtually impossible to distinguish from manually written code, their real-world usage and impact on open-source software development remain poorly understood. In this paper, we introduce the concept of self-admitted GenAI usage, that is, developers explicitly referring to the use of GenAI tools for content creation in software artifacts. Using this concept as a lens to study how GenAI tools are integrated into open-source software projects, we analyze a curated sample of more than 250,000 GitHub repositories, identifying 1,292 such self-admissions across 156 repositories in commit messages, code comments, and project documentation. Using a mixed methods approach, we derive a taxonomy of 32 tasks, 10 content types, and 11 purposes associated with GenAI usage based on 284 qualitatively coded mentions. We then analyze 13 documents with policies and usage guidelines for GenAI tools and conduct a developer survey to uncover the ethical, legal, and practical concerns behind them. Our findings reveal that developers actively manage how GenAI is used in their projects, highlighting the need for project-level transparency, attribution, and quality control practices in the new era of AI-assisted software development. Finally, we examine the impact of GenAI adoption on code churn in 151 repositories with self-admitted GenAI usage and find no general increase, contradicting popular narratives on the impact of GenAI on software development.
- Abstract(参考訳): GitHub CopilotやChatGPTといったジェネレーティブAI(GenAI)ツールの普及が、ソフトウェア開発を変革している。
生成されたソースコードは手書きのコードと区別することは事実上不可能であるため、実際の使用状況やオープンソースソフトウェア開発への影響は理解されていないままである。
本稿では、開発者がソフトウェアアーティファクトのコンテンツ作成にGenAIツールを使うことを明確に言及する。
この概念を、GenAIツールがオープンソースソフトウェアプロジェクトにどのように統合されているかを研究するためのレンズとして使用し、25万以上のGitHubリポジトリのキュレートされたサンプルを分析し、コミットメッセージ、コードコメント、プロジェクトドキュメントにおいて、156のリポジトリにまたがる1292の自己承認を識別する。
混合手法を用いて,32のタスク,10のコンテントタイプ,および284の定性的コード化された言及に基づくGenAI使用に関する11の目的の分類を導出する。
次に、GenAIツールのポリシーと使用ガイドラインを用いて13の文書を分析し、その背景にある倫理的、法的、実践的な懸念を明らかにするために、開発者調査を実施します。
我々の調査によると、開発者はプロジェクトにおいてGenAIがどのように使われているのかを積極的に管理し、AI支援ソフトウェア開発の新しい時代のプロジェクトレベルの透明性、属性、品質管理プラクティスの必要性を強調します。
最後に,GenAIの採用が151リポジトリのコードチャーンに与える影響について検討した。
関連論文リスト
- An Empirical Study of GenAI Adoption in Open-Source Game Development: Tools, Tasks, and Developer Challenges [1.4299470464639639]
生成AI(GenAI)は、コンテンツ作成、ゲームプレイシミュレーション、デザインアイデアのための新しいツールを提供することで、ゲームの設計と開発方法を再構築し始めている。
GenAIが現実世界のコンテキスト、特にオープンソースコミュニティにおいて、開発者によってどのように採用されているか、という経験的な理解は限られています。
本研究の目的は、GitHub上の課題議論を分析し、GenAI技術がどのように議論され、採用され、オープンソースゲーム開発に統合されるかを検討することである。
論文 参考訳(メタデータ) (2025-07-24T02:03:12Z) - Survey of GenAI for Automotive Software Development: From Requirements to Executable Code [4.909409341455637]
自動車ソフトウェア開発はGenAI採用にとって重要な領域だと考えられている。
3つのGenAI関連技術は最先端の言語モデル(LLM)、検索言語生成(RAG)、ビジョン言語モデル(VLM)に網羅されている。
論文 参考訳(メタデータ) (2025-07-20T16:21:51Z) - The Impact of Generative AI on Code Expertise Models: An Exploratory Study [0.0]
本稿では、知識モデルとトラックファクターアルゴリズムがGenAIの利用によってどのように影響するかを探索分析する。
この結果から,GenAIが開発に深く統合されるにつれ,これらの指標の信頼性が低下する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-10T20:43:08Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [66.1850490474361]
コーディングエージェントとの開発者インタラクションを探求する最初の学術的研究を行う。
私たちは、GitHub CopilotとOpenHandsの2つの主要なコピロとエージェントコーディングアシスタントを評価します。
この結果から、エージェントは、コピロトを超越した方法で開発者を支援する可能性を示唆している。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - Using Generative AI in Software Design Education: An Experience Report [0.6827423171182154]
学生はチームベースの課題を完了するためにGenAIを使用する必要があった。
学生はChatGPTがデザインプロセスで役立った多くの方法を特定した。
我々は、ソフトウェア設計クラスにGenAIを効果的にデプロイする方法について、教育者にとって重要な教訓をいくつか挙げた。
論文 参考訳(メタデータ) (2025-06-26T18:40:16Z) - From Recall to Reasoning: Automated Question Generation for Deeper Math Learning through Large Language Models [44.99833362998488]
先進数学のためのコンテンツ生成を最適化する第1ステップについて検討した。
我々は、GenAIがコース内容に関連する高品質な実践問題を生み出す能力について検討した。
論文 参考訳(メタデータ) (2025-05-17T08:30:10Z) - The Roles of Generative Artificial Intelligence in Internet of Electric Vehicles [65.14115295214636]
我々は特に、電気自動車のインターネット(IoEV)について検討し、GenAI for IoEVを4つの異なる層に分類する。
IoEVアプリケーションの各レイヤで使用されるさまざまなGenAI技術を紹介します。
GenAIモデルのトレーニングに利用可能なパブリックデータセットを要約する。
論文 参考訳(メタデータ) (2024-09-24T05:12:10Z) - Ethics of Software Programming with Generative AI: Is Programming without Generative AI always radical? [0.32985979395737786]
ソフトウェアコード生成におけるGenAIの変換能力を認めている。
GenAIは代替ではなく、ソフトウェアコードを書くための補完的なツールである、と仮定する。
厳格な倫理的ガイドラインを提唱する論文では、倫理的考慮が最重要である。
論文 参考訳(メタデータ) (2024-08-20T05:35:39Z) - Genetic Auto-prompt Learning for Pre-trained Code Intelligence Language Models [54.58108387797138]
コードインテリジェンスタスクにおける即時学習の有効性について検討する。
既存の自動プロンプト設計手法は、コードインテリジェンスタスクに限られている。
本稿では、精巧な遺伝的アルゴリズムを用いてプロンプトを自動設計する遺伝的オートプロンプト(GenAP)を提案する。
論文 参考訳(メタデータ) (2024-03-20T13:37:00Z) - Generative Artificial Intelligence for Software Engineering -- A
Research Agenda [8.685607624226037]
我々は、GenAI for Software Engineeringの研究アジェンダを開発するために、文献レビューと5ヶ月間のフォーカスグループを実施しました。
この結果から,GenAIを部分的自動化に適用し,すべてのソフトウェア開発活動における意思決定を支援することが可能であることが示唆された。
GenAIを実装する際の一般的な考慮事項は、業界レベルの評価、信頼性と正確性、データアクセシビリティ、透明性、技術に関連する持続可能性といった点である。
論文 参考訳(メタデータ) (2023-10-28T09:14:39Z) - Investigating Explainability of Generative AI for Code through
Scenario-based Design [44.44517254181818]
生成AI(GenAI)技術は成熟し、ソフトウェア工学のようなアプリケーションドメインに適用されています。
私たちは43人のソフトウェアエンジニアと9つのワークショップを開催しました。そこでは、最先端のジェネレーティブAIモデルの実例を使って、ユーザの説明可能性のニーズを導き出しました。
我々の研究は、GenAIのコードに対する説明可能性の必要性を探求し、新しいドメインにおけるXAIの技術開発を人間中心のアプローチがいかに促進するかを実証する。
論文 参考訳(メタデータ) (2022-02-10T08:52:39Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - AI Explainability 360: Impact and Design [120.95633114160688]
2019年、私たちはAI Explainability 360(Arya et al. 2020)を開発しました。
本稿では,いくつかのケーススタディ,統計,コミュニティフィードバックを用いて,ツールキットが与える影響について検討する。
また,ツールキットのフレキシブルな設計,使用例,利用者が利用可能な教育資料や資料についても述べる。
論文 参考訳(メタデータ) (2021-09-24T19:17:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。