論文の概要: Strategies for Guiding LLMs to Use Software Design Patterns: A Case of Singleton
- arxiv url: http://arxiv.org/abs/2605.26898v1
- Date: Tue, 26 May 2026 11:58:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.989544
- Title: Strategies for Guiding LLMs to Use Software Design Patterns: A Case of Singleton
- Title(参考訳): ソフトウェアデザインパターンをLLMに導く方策:Singletonを例に
- Authors: Viktor Kjellberg, Farnaz Fotrousi, Miroslaw Staron,
- Abstract要約: 大規模言語モデル(LLM)は、自然言語のプロンプトから関数型ソースコードを生成することができるが、高いレベルのアーキテクチャ構造や設計パターンに一貫して従わないことが多い。
本稿では,LLMが生成したソースコードに設計パターンを組み込むための戦略について述べる。
- 参考スコア(独自算出の注目度): 2.7400724993677703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) can generate functional source code from natural-language prompts, but often fail to consistently follow higher-level architectural structures or design patterns. Since LLMs are increasingly used in software engineering, their ability to apply established design principles to generated code is crucial to the long-term success of software products. Therefore, the goal of this paper is to identify strategies for guiding LLMs to incorporate design patterns into the generated source code. We designed a computational experiment to evaluate the ability of 13 LLMs to generate code that follows the Singleton design pattern, using four prompting strategies: instructions, binary automated feedback, extensive automated feedback, and extensive feedback with few-shot prompts, in 164 Java coding challenges from HumanEval-X. Our results shows that the optimal strategy to guide LLMs to include design patterns depends heavily on the type of model. Still, overall, iterative binary feedback provides the best alignment with Singleton while preserving or improving the code's functionality. With guiding with instructions, Llama 3.3 generated Singleton classes in 100% of cases and improved code functionality, increasing the number of tests passed by 34.1 percentage points. It achieved a similar result with guidance through instructions and binary feedback. Qwen 3 (8B) increased the alignment with Singleton to 99.2% and the functionality to 58.6% using binary feedback. Our result suggests that even simple strategies can be used to guide LLMs to use design patterns.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自然言語のプロンプトから関数型ソースコードを生成することができるが、高いレベルのアーキテクチャ構造や設計パターンに一貫して従わないことが多い。
LLMはソフトウェア工学でますます使われているため、ソフトウェア製品の長期的な成功には、既存の設計原則を生成コードに適用する能力が不可欠である。
そこで本論文の目的は,LLMを設計パターンを生成ソースコードに組み込むための戦略を特定することである。
我々は,HumanEval-Xによる164のJavaコーディング課題において,命令,バイナリ自動フィードバック,広範囲な自動フィードバック,数発のプロンプトによる広範囲なフィードバックという4つのプロンプト戦略を用いて,シングルトン設計パターンに従うコードを生成するための13のLLMの能力を評価する計算実験を設計した。
この結果から,LLMを設計パターンに含めるための最適戦略は,モデルの種類に大きく依存していることが示唆された。
それでも全体として、反復的なバイナリフィードバックは、コードの機能を保存または改善しながら、Singletonと最高の整合性を提供します。
命令を導くことで、Llama 3.3はケースの100%でシングルトンクラスを生成し、コード機能を改善し、テスト数が34.1ポイント増加した。
インストラクションとバイナリフィードバックによるガイダンスによって、同様の結果を得た。
Qwen 3 (8B) はシングルトンとのアライメントを99.2%に、機能は58.6%に増やした。
以上の結果から,LCMを設計パターンの活用に導くための単純な戦略が可能であることが示唆された。
関連論文リスト
- Reliability of Large Language Models for Design Synthesis: An Empirical Study of Variance, Prompt Sensitivity, and Method Scaffolding [2.1843439591862333]
大規模言語モデル(LLM)は、ソフトウェアエンジニアリングタスクの自動化にますます適用されています。
本研究では,LLMがダイアグラム変換を超えて設計合成を行うことができるかどうかを検討する。
論文 参考訳(メタデータ) (2026-04-01T13:05:09Z) - From What to How: Bridging User Requirements with Software Development Using Large Language Models [6.699393078605002]
大規模言語モデル (LLM) は開発効率を高めるために広く利用されており、性能評価のためのベンチマークが多数行われている。
本稿では,3 つのソフトウェア設計関連タスク上で LLM を評価するための設計対応ベンチマークである DesBench を提案する。
DesBenchを用いて3つのDeepSeek R1、2つのQwen2.5、2つのGPTモデルを含む7つの最先端LCMを評価した。
論文 参考訳(メタデータ) (2026-02-14T05:52:09Z) - Teaching LLM to Reason: Reinforcement Learning from Algorithmic Problems without Code [76.80306464249217]
本稿では,LLMにより良い理性を教えることを目的としたTeaRを提案する。
TeaRは、注意深いデータキュレーションと強化学習を活用して、コード関連のタスクを通じて最適な推論パスを発見するモデルをガイドする。
我々は、2つのベースモデルと3つの長いCoT蒸留モデルを用いて広範な実験を行い、モデルのサイズは15億から32億のパラメータから、Math、Knowledge、Code、Logical Reasoningにまたがる17のベンチマークにまたがる。
論文 参考訳(メタデータ) (2025-07-10T07:34:05Z) - Enhancing LLM-Based Code Generation with Complexity Metrics: A Feedback-Driven Approach [6.289275189295223]
本稿では,コード複雑度と大言語モデル生成コードの成功との関係について検討する。
提案手法では,既往の故障した出力からの複雑性メトリクスに基づいて,LCMに正しいコードを生成するための反復的フィードバック手法を提案する。
実験結果から,本手法は特に小型LCMでは顕著な改善が見られた。
論文 参考訳(メタデータ) (2025-05-29T19:06:14Z) - Comments as Natural Logic Pivots: Improve Code Generation via Comment Perspective [85.48043537327258]
本稿では, MANGO (comMents As Natural loGic pivOts) を提案する。
その結果、MANGOは強いベースラインに基づいてコードパス率を大幅に改善することがわかった。
論理的なコメントの復号化戦略の堅牢性は、考えの連鎖よりも顕著に高い。
論文 参考訳(メタデータ) (2024-04-11T08:30:46Z) - If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code
Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練される
コードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文 参考訳(メタデータ) (2024-01-01T16:51:20Z) - What Makes for Good Visual Instructions? Synthesizing Complex Visual Reasoning Instructions for Visual Instruction Tuning [111.01953096869947]
マルチモーダル大言語モデル(MLLM)のゼロショット一般化能力向上に視覚的指導チューニングが不可欠である
我々は,高品質な視覚的推論命令を自動生成する体系的手法を開発した。
実験結果から, MLLMの強化性能が一貫した結果を得た。
論文 参考訳(メタデータ) (2023-11-02T15:36:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。