論文の概要: On Integrating Large Language Models and Scenario-Based Programming for Improving Software Reliability
- arxiv url: http://arxiv.org/abs/2509.09194v1
- Date: Thu, 11 Sep 2025 07:10:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 16:52:24.25662
- Title: On Integrating Large Language Models and Scenario-Based Programming for Improving Software Reliability
- Title(参考訳): ソフトウェア信頼性向上のための大規模言語モデルとシナリオベースプログラミングの統合について
- Authors: Ayelet Berzack, Guy Katz,
- Abstract要約: 大規模言語モデル(LLM)は、ソフトウェア開発者にとって急速に欠かせないツールになりつつある。
LLMは、しばしば重大なエラーを導入し、説得力のある信頼を持って間違ったコードを提示する。
本研究では,LLMと従来のソフトウェア工学技術を組み合わせる手法を構造化された方法で提案する。
- 参考スコア(独自算出の注目度): 2.2058293096044586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) are fast becoming indispensable tools for software developers, assisting or even partnering with them in crafting complex programs. The advantages are evident -- LLMs can significantly reduce development time, generate well-organized and comprehensible code, and occasionally suggest innovative ideas that developers might not conceive on their own. However, despite their strengths, LLMs will often introduce significant errors and present incorrect code with persuasive confidence, potentially misleading developers into accepting flawed solutions. In order to bring LLMs into the software development cycle in a more reliable manner, we propose a methodology for combining them with ``traditional'' software engineering techniques in a structured way, with the goal of streamlining the development process, reducing errors, and enabling users to verify crucial program properties with increased confidence. Specifically, we focus on the Scenario-Based Programming (SBP) paradigm -- an event-driven, scenario-based approach for software engineering -- to allow human developers to pour their expert knowledge into the LLM, as well as to inspect and verify its outputs. To evaluate our methodology, we conducted a significant case study, and used it to design and implement the Connect4 game. By combining LLMs and SBP we were able to create a highly-capable agent, which could defeat various strong existing agents. Further, in some cases, we were able to formally verify the correctness of our agent. Finally, our experience reveals interesting insights regarding the ease-of-use of our proposed approach. The full code of our case-study will be made publicly available with the final version of this paper.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソフトウェア開発者にとっては急速に欠かせないツールになりつつある。
LLMは開発時間を著しく削減し、十分に整理され、理解可能なコードを生成します。
しかし、その強みにもかかわらず、LLMは、しばしば重大なエラーを導入し、説得力のある自信を持って間違ったコードを提示し、開発者が欠陥のあるソリューションを受け入れることを誤解させる可能性がある。
LLMをより信頼性の高い方法でソフトウェア開発サイクルに導入するために、我々は、開発プロセスの合理化、エラーの低減、ユーザが信頼性を高めて重要なプログラムプロパティの検証を可能にすることを目的として、構造化された方法で'伝統的な'ソフトウェアエンジニアリング技術と組み合わせるための方法論を提案する。
具体的には、シナリオベースプログラミング(SBP)パラダイム – ソフトウェアエンジニアリングのためのイベント駆動のシナリオベースのアプローチ – に注目して、専門家の知識をLLMに注ぐと同時に、アウトプットの検査と検証を可能にします。
提案手法を評価するために,我々は重要なケーススタディを行い,Connect4ゲームの設計と実装に利用した。
LLMとSBPを組み合わせることで、さまざまな強力な既存のエージェントを倒すことができる高い能力を持つエージェントを作れるようになりました。
さらに,ある場合には,エージェントの正当性を確認することができた。
最後に、私たちの経験から、提案手法の使いやすさに関する興味深い洞察が浮かび上がっています。
ケーススタディの全コードは、この記事の最終バージョンで公開されます。
関連論文リスト
- Generative AI for Object-Oriented Programming: Writing the Right Code and Reasoning the Right Logic [2.170361965861349]
大規模言語モデル (LLM) は、財務、常識知識グラフ、医学、視覚分析にまたがる様々な応用がある。
私たちの研究は、OOPタスクに関わる主要な利害関係者の視点からビジョンを提示することで、このギャップに対処することを目的としています。
さらに,既存の論理的推論とコード記述を強化し,最終的にプログラミング体験を向上させる方法を提案する。
論文 参考訳(メタデータ) (2025-08-07T03:38:17Z) - Large Language Model Unlearning for Source Code [65.42425213605114]
PRODは、LLMがコード生成能力を保ちながら、望ましくないコード内容を忘れることができる新しいアンラーニングアプローチである。
本評価は,既存の未学習アプローチと比較して,忘れ品質とモデルユーティリティのバランスが良好であることを示す。
論文 参考訳(メタデータ) (2025-06-20T16:27:59Z) - LLMs' Reshaping of People, Processes, Products, and Society in Software Development: A Comprehensive Exploration with Early Adopters [3.4069804433026314]
OpenAI ChatGPT、Google Gemini、GitHub Copilotといった大規模言語モデル(LLM)は、ソフトウェア業界で急速に注目を集めている。
私たちの研究は、LLMがソフトウェア開発のランドスケープをどう形作っているのか、微妙に理解しています。
論文 参考訳(メタデータ) (2025-03-06T22:27:05Z) - Human-In-the-Loop Software Development Agents [12.830816751625829]
大規模言語モデル(LLM)ベースのソフトウェアエンジニアリングのためのマルチエージェントパラダイムを導入し、ソフトウェア開発タスクを自動的に解決する。
本稿では,ソフトウェア開発のためのHuman-in-the-loop LLMベースのエージェントフレームワーク(HULA)を紹介する。
私たちは社内使用のために、HULAフレームワークをAtlassianに設計、実装、デプロイしています。
論文 参考訳(メタデータ) (2024-11-19T23:22:33Z) - Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文 参考訳(メタデータ) (2024-06-24T15:45:22Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。