論文の概要: Using LLMs in Software Design: An Empirical Study of GitHub and A Practitioner Survey
- arxiv url: http://arxiv.org/abs/2605.01392v1
- Date: Sat, 02 May 2026 11:29:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.746211
- Title: Using LLMs in Software Design: An Empirical Study of GitHub and A Practitioner Survey
- Title(参考訳): ソフトウェア設計におけるLLMの利用 - GitHubと実践者調査の実証的研究
- Authors: Yifei Wang, Ruiyin Li, Peng Liang, Yangxiao Cai, Zengyang Li, Mojtaba Shahin, Arif Ali Khan, Qiong Feng,
- Abstract要約: 本稿では,ソフトウェア設計におけるLarge Language Models (LLM) の利用状況について実験的に考察する。
アーキテクチャ設計,データモデル設計,デザインパターンの利用など,ChatGPTがサポートしているデザインタスクの9つのカテゴリが明らかになった。
この研究は、ソフトウェア設計にLLMを使うことによる7つの重要な利点を、より良い技術選択や設計上の欠陥の早期発見など、開発者が認識するものとして挙げている。
- 参考スコア(独自算出の注目度): 12.049060426664298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in Large Language Models (LLMs) have demonstrated significant potential across a wide range of software engineering tasks, including software design, an area traditionally regarded as highly dependent on human expertise and judgment. However, there has been little research focusing on how LLMs are used in software design, nor on the associated benefits and drawbacks. This paper aims to bridge this gap by empirically investigating how software developers utilize LLMs in the context of software design. We conduct a mixed-methods study, combining a mining study of 291 developer-ChatGPT conversations shared on GitHub with a survey of 65 software practitioners. Our findings reveal nine distinct categories of design tasks supported by ChatGPT, including architecture design, data model design, and the use of design patterns. We further characterize developer-ChatGPT interactions, showing that developers primarily use ChatGPT for knowledge acquisition and design-related code generation, with most tasks situated at the detailed design level. The study identifies seven key benefits of utilizing LLMs in software design as perceived by developers, such as better technology selection and the early detection of design flaws. We also uncover six limitations, including the generation of overly lengthy and difficult-to-read outputs, the creation of inexecutable or incorrect code, and a heavy reliance on context that can lead to hallucinated results. These findings provide an evidence-based characterization of current LLM use in software design from both open-source and practitioner perspectives, highlighting a tension between perceived benefits and limitations, which lays a foundation for future research and the development of effective techniques and tools to integrate LLMs into software design practices.
- Abstract(参考訳): 近年のLarge Language Models (LLM) の進歩は、ソフトウェア設計を含む幅広いソフトウェアエンジニアリングタスクにおいて大きな可能性を示している。
しかしながら、LCMがソフトウェア設計でどのように使われているか、関連する利点や欠点についてはほとんど研究されていない。
本稿では,ソフトウェア設計におけるLCMの活用を実証的に検討することにより,このギャップを埋めることを目的とする。
私たちは、GitHubで共有されている開発者とチャットGPTの会話291件のマイニング調査と、65人のソフトウェア実践者の調査を組み合わせた、混合メソッドの調査を行います。
アーキテクチャ設計,データモデル設計,デザインパターンの利用など,ChatGPTがサポートしているデザインタスクの9つのカテゴリが明らかになった。
さらに開発者とChatGPTのインタラクションを特徴付け、開発者は知識獲得と設計関連のコード生成にChatGPTを主に使用し、ほとんどのタスクは詳細な設計レベルにあります。
この研究は、ソフトウェア設計にLLMを使うことによる7つの重要な利点を、より良い技術選択や設計上の欠陥の早期発見など、開発者が認識するものとして挙げている。
また、過度に長く読みにくいアウトプットの生成、実行不可能なコードや不正なコードの作成、そして幻覚的な結果につながる可能性のあるコンテキストに依存する6つの制限も明らかにしました。
これらの発見は、オープンソースと実践者の両面から、ソフトウェア設計における現在のLLMの使用のエビデンスに基づく特徴付けを提供し、認識されるメリットと制限の間の緊張を強調し、将来の研究の基礎と、LCMをソフトウェア設計プラクティスに統合するための効果的な技術とツールの開発を可能にします。
関連論文リスト
- The Role of LLMs in Collaborative Software Design [9.27915132566963]
大規模言語モデル(LLM)は、ソフトウェア工学における協調グループワークを形作る。
本研究は,このような協調作業,すなわちソフトウェア設計に焦点をあてる。
論文 参考訳(メタデータ) (2026-04-10T09:00:33Z) - From What to How: Bridging User Requirements with Software Development Using Large Language Models [6.699393078605002]
大規模言語モデル (LLM) は開発効率を高めるために広く利用されており、性能評価のためのベンチマークが多数行われている。
本稿では,3 つのソフトウェア設計関連タスク上で LLM を評価するための設計対応ベンチマークである DesBench を提案する。
DesBenchを用いて3つのDeepSeek R1、2つのQwen2.5、2つのGPTモデルを含む7つの最先端LCMを評価した。
論文 参考訳(メタデータ) (2026-02-14T05:52:09Z) - From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - Novice Developers' Perspectives on Adopting LLMs for Software Development: A Systematic Literature Review [17.22501688824729]
我々は2022年4月から2025年6月までに発行された80研究の体系的な文献レビューを行い、4つの研究課題(RQ)に答えた。
RQ1では,研究モチベーションと方法論的アプローチを分類した。
RQ2では、初心者開発者がLLMを使用するソフトウェア開発タスクを特定した。
RQ3では,研究で議論されたメリット,課題,レコメンデーションを分類した。
論文 参考訳(メタデータ) (2025-03-10T17:25:24Z) - Assessing LLMs for Front-end Software Architecture Knowledge [0.0]
大規模言語モデル(LLM)は、ソフトウェア開発タスクの自動化において大きな可能性を証明している。
本研究では,VIPER アーキテクチャ内の構造を理解し,再現し,生成する LLM の機能について検討する。
実験の結果、ChatGPT 4 Turbo 2024-04-09 を用いて、LLM は評価や作成といった高次タスクに優れていたが、アーキテクチャの詳細の正確な検索を必要とする低次タスクでは課題に直面していたことが明らかとなった。
論文 参考訳(メタデータ) (2025-02-26T19:33:35Z) - Prompting Large Language Models to Tackle the Full Software Development Lifecycle: A Case Study [72.24266814625685]
DevEvalでソフトウェア開発ライフサイクル全体にわたって、大きな言語モデル(LLM)のパフォーマンスを調査します。
DevEvalは4つのプログラミング言語、複数のドメイン、高品質なデータ収集、各タスクに対して慎重に設計および検証されたメトリクスを備えている。
GPT-4を含む現在のLLMは、DevEvalで提示される課題を解決できないことが実証研究によって示されている。
論文 参考訳(メタデータ) (2024-03-13T15:13:44Z) - CREATOR: Tool Creation for Disentangling Abstract and Concrete Reasoning of Large Language Models [74.22729793816451]
大規模言語モデル(LLM)はツールの利用において大きな進歩を遂げているが、その能力はAPIの可用性によって制限されている。
我々は、LCMがドキュメンテーションとコード実現を使って独自のツールを作成できる新しいフレームワークCREATORを提案する。
我々は,MATH と TabMWP のベンチマークで CREATOR を評価する。
論文 参考訳(メタデータ) (2023-05-23T17:51:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。