論文の概要: Promptware Engineering: Software Engineering for LLM Prompt Development
- arxiv url: http://arxiv.org/abs/2503.02400v1
- Date: Tue, 04 Mar 2025 08:43:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:22:29.084353
- Title: Promptware Engineering: Software Engineering for LLM Prompt Development
- Title(参考訳): プロンプトウェアエンジニアリング - LLM プロンプト開発のためのソフトウェアエンジニアリング
- Authors: Zhenpeng Chen, Chong Wang, Weisong Sun, Guang Yang, Xuanzhe Liu, Jie M. Zhang, Yang Liu,
- Abstract要約: 大規模言語モデル(LLM)は、ソフトウェアアプリケーションに統合され、プロンプトが主要な'プログラミング'インターフェースとして機能する。
その結果,新たなソフトウェアパラダイムであるプロンプトウェアが出現し,自然言語のプロンプトを使ってLLMと対話する。
フォーマルなプログラミング言語や決定論的ランタイム環境に依存する従来のソフトウェアとは異なり、プロンプトウェアはあいまいで非構造的で文脈に依存した自然言語に基づいている。
- 参考スコア(独自算出の注目度): 22.788377588087894
- License:
- Abstract: Large Language Models (LLMs) are increasingly integrated into software applications, with prompts serving as the primary 'programming' interface to guide their behavior. As a result, a new software paradigm, promptware, has emerged, using natural language prompts to interact with LLMs and enabling complex tasks without traditional coding. Unlike traditional software, which relies on formal programming languages and deterministic runtime environments, promptware is based on ambiguous, unstructured, and context-dependent natural language and operates on LLMs as runtime environments, which are probabilistic and non-deterministic. These fundamental differences introduce unique challenges in prompt development. In practice, prompt development is largely ad hoc and experimental, relying on a time-consuming trial-and-error process - a challenge we term the 'promptware crisis.' To address this, we propose promptware engineering, a new methodology that adapts established software engineering principles to the process of prompt development. Building on decades of success in traditional software engineering, we envision a systematic framework that includes prompt requirements engineering, design, implementation, testing, debugging, and evolution. Unlike traditional software engineering, our framework is specifically tailored to the unique characteristics of prompt development. This paper outlines a comprehensive roadmap for promptware engineering, identifying key research directions and offering actionable insights to advance LLM-based software development.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソフトウェアアプリケーションにますます統合され、その振る舞いをガイドする主要な「プログラミング」インターフェースとして機能する。
結果として、自然言語のプロンプトを使用してLLMと対話し、従来のコーディングなしで複雑なタスクを可能にする、新しいソフトウェアパラダイムであるプロンプトウェアが登場した。
フォーマルなプログラミング言語や決定論的実行環境に依存する従来のソフトウェアとは異なり、プロンプトウェアはあいまいで非構造的でコンテキストに依存した自然言語に基づいており、確率的で非決定論的な実行環境としてLLM上で動作する。
これらの根本的な違いは、迅速な開発に固有の課題をもたらす。
実際には、迅速な開発は、主にアドホックで実験的であり、時間を要する試行錯誤プロセスに依存しています。
そこで我々は,既存のソフトウェア工学の原則を迅速な開発プロセスに適応させる新しい方法論である,プロンプトウェアエンジニアリングを提案する。
従来のソフトウェアエンジニアリングにおける何十年にもわたっての成功の上に、私たちは、要求エンジニアリング、設計、実装、テスト、デバッグ、進化の促進を含む、体系的なフレームワークを構想しています。
従来のソフトウェアエンジニアリングとは異なり、当社のフレームワークは、迅速な開発の特徴に特化しています。
本稿では,プロンプトウェアエンジニアリングの総合的なロードマップを概説し,主要な研究方向を特定し,LCMベースのソフトウェア開発を進めるための実用的な洞察を提供する。
関連論文リスト
- Every Software as an Agent: Blueprint and Case Study [0.6655461660736298]
我々は、ソフトウェア内部(ソースコードとランタイムコンテキスト)へのアクセスと、生成したコードを動的にソフトウェアに注入して実行することを許可することで、大きな言語モデル(LLM)を実現することを提唱する。
ウェブベースの2つのデスクトップアプリケーションの設計アーキテクチャとケーススタディについて述べる。
論文 参考訳(メタデータ) (2025-02-07T08:29:09Z) - Conversation Routines: A Prompt Engineering Framework for Task-Oriented Dialog Systems [0.21756081703275998]
本研究では,Large Language Models (LLMs) を用いたタスク指向対話システムの開発のための,構造化されたプロンプトエンジニアリングフレームワークである Conversation Routines (CR) を紹介する。
提案したCRフレームワークは,自然言語仕様による会話エージェントシステム(CAS)の開発を可能にする。
このフレームワークの有効性を,Train Booking SystemとInteractive Ticket Copilotという2つの概念実証実装を通じて実証する。
論文 参考訳(メタデータ) (2025-01-20T17:19:02Z) - NoviCode: Generating Programs from Natural Language Utterances by Novices [59.71218039095155]
初心者非プログラマによるAPIと自然言語記述を入力とする新しいNLプログラミングタスクであるNoviCodeを提示する。
我々は、NoviCodeがコード合成領域における挑戦的なタスクであることを示し、非技術的命令から複雑なコードを生成することは、現在のText-to-Codeパラダイムを超えている。
論文 参考訳(メタデータ) (2024-07-15T11:26:03Z) - Meaning-Typed Programming: Language-level Abstractions and Runtime for GenAI Applications [8.308424118055981]
ソフトウェアは、論理コードから、生成的AIとアプリケーション機能に大規模言語モデル(LLM)を活用する神経統合アプリケーションへと、急速に進化している。
本稿では,神経統合型アプリケーションの作成を簡略化する新しい手法として,意味型プログラミング(MTP)を提案する。
論文 参考訳(メタデータ) (2024-05-14T21:12:01Z) - A Framework to Model ML Engineering Processes [1.9744907811058787]
機械学習(ML)ベースのシステムの開発は複雑で、多様なスキルセットを持つ複数の学際的なチームが必要である。
現在のプロセスモデリング言語は、そのようなシステムの開発を説明するには適していない。
ドメイン固有言語を中心に構築されたMLベースのソフトウェア開発プロセスのモデリングフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-04-29T09:17:36Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - Achieving Guidance in Applied Machine Learning through Software
Engineering Techniques [0.0]
現在開発環境とML APIを使用しており、MLアプリケーションの開発者に提供しています。
現在のMLツールは、いくつかの基本的なソフトウェアエンジニアリングのゴールドスタンダードを満たすには足りません。
この結果から,ML固有のソフトウェア工学の研究に十分な機会があることが示唆された。
論文 参考訳(メタデータ) (2022-03-29T12:54:57Z) - OpenPrompt: An Open-source Framework for Prompt-learning [59.17869696803559]
PLM上でのプロンプト学習を行うための統一的な使いやすさツールキットであるOpenPromptを提案する。
OpenPromptは、効率性、モジュール性、拡張性を備えた、リサーチフレンドリーなフレームワークである。
論文 参考訳(メタデータ) (2021-11-03T03:31:14Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。