論文の概要: Autonomous Prompt Engineering in Large Language Models
- arxiv url: http://arxiv.org/abs/2407.11000v1
- Date: Tue, 25 Jun 2024 10:14:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 12:39:32.134408
- Title: Autonomous Prompt Engineering in Large Language Models
- Title(参考訳): 大規模言語モデルにおける自律型プロンプトエンジニアリング
- Authors: Daan Kepel, Konstantina Valogianni,
- Abstract要約: 本研究は, GPT-4が自律的に迅速な工学的手法を適用可能なAutomatic Prompt Engineering Toolbox(APET)を紹介する。
APETはGPT-4にプロンプトを動的に最適化する権限を与え、Word Sortingのようなタスクを大幅に改善する。
この研究はAI開発における大きな飛躍であり、自律型AIシステムにおける将来のイノベーションのための堅牢なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Prompt engineering is a crucial yet challenging task for optimizing the performance of large language models (LLMs) on customized tasks. This pioneering research introduces the Automatic Prompt Engineering Toolbox (APET), which enables GPT-4 to autonomously apply prompt engineering techniques. By leveraging sophisticated strategies such as Expert Prompting, Chain of Thought, and Tree of Thoughts, APET empowers GPT-4 to dynamically optimize prompts, resulting in substantial improvements in tasks like Word Sorting (4.4% increase) and Geometric Shapes (6.8% increase). Despite encountering challenges in complex tasks such as Checkmate in One (-14.8%), these findings demonstrate the transformative potential of APET in automating complex prompt optimization processes without the use of external data. Overall, this research represents a significant leap in AI development, presenting a robust framework for future innovations in autonomous AI systems and highlighting the ability of GPT-4 to bring prompt engineering theory to practice. It establishes a foundation for enhancing performance in complex task performance and broadening the practical applications of these techniques in real-world scenarios.
- Abstract(参考訳): プロンプトエンジニアリングは、カスタマイズされたタスクで大規模言語モデル(LLM)のパフォーマンスを最適化する上で、非常に難しいタスクである。
この先駆的な研究はAutomatic Prompt Engineering Toolbox (APET)を導入した。
Expert Prompting、Chain of Thoughts、Tree of Thoughtsといった高度な戦略を活用することで、APETはGPT-4にプロンプトを動的に最適化する権限を与え、Word Sorting(4.4%)やGeometric Shapes(6.8%)といったタスクを大幅に改善した。
Checkmate in One (-14.8%)のような複雑なタスクの課題に遭遇したにもかかわらず、これらの発見は、外部データを使用しない複雑なプロンプト最適化プロセスの自動化におけるAPETの変換可能性を示している。
全体として、この研究はAI開発における大きな飛躍であり、自律型AIシステムにおける将来のイノベーションのための堅牢なフレームワークを示し、GPT-4による迅速なエンジニアリング理論を実践する能力を強調している。
複雑なタスクのパフォーマンスを向上させる基盤を確立し、現実のシナリオにおけるこれらのテクニックの実践的応用を拡大する。
関連論文リスト
- Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement [62.94719119451089]
Lingma SWE-GPTシリーズは、現実世界のコード提出活動から学び、シミュレーションする。
Lingma SWE-GPT 72BはGitHubの30.20%の問題を解決する。
論文 参考訳(メタデータ) (2024-11-01T14:27:16Z) - On the role of Artificial Intelligence methods in modern force-controlled manufacturing robotic tasks [0.0]
ロボットマニピュレータの強化におけるAIの役割は、スマートマニュファクチャリングにおける重要なイノベーションに急速に結びついている。
この記事では、これらのイノベーションを実効力によって制御されたアプリケーションにまとめ、高品質な生産標準を維持する必要性を強調します。
この分析は、AI技術を検証するための共通のパフォーマンスメトリクスの必要性を強調した、将来の研究方向性の視点で締めくくっている。
論文 参考訳(メタデータ) (2024-09-25T11:29:26Z) - AI based Multiagent Approach for Requirements Elicitation and Analysis [3.9422957660677476]
本研究では,大規模言語モデル(LLM)を用いた要求分析タスクの自動化の有効性を実証的に検討する。
我々は,GPT-3.5,GPT-4 Omni,LLaMA3-70,Mixtral-8Bの4つのモデルをデプロイし,実世界の4つのプロジェクトにおける要件を分析する実験を行った。
予備的な結果は,各モデルにおけるタスク完了の顕著な変化を示している。
論文 参考訳(メタデータ) (2024-08-18T07:23:12Z) - Unleashing the potential of prompt engineering in Large Language Models: a comprehensive review [1.6006550105523192]
大規模言語モデル(LLM)の能力を解き放つ上で,迅速なエンジニアリングが果たす重要な役割を概観する
自己整合性、思考の連鎖、そして生成された知識などの技術を含む、素早い工学の基礎的方法論と先進的な方法論の両方を検査する。
レビューはまた、AI能力の進歩におけるエンジニアリングの急進的な役割を反映し、将来の研究と応用のための構造化されたフレームワークを提供する。
論文 参考訳(メタデータ) (2023-10-23T09:15:18Z) - The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision) [121.42924593374127]
我々は,最新のモデルであるGPT-4Vを分析し,LMMの理解を深める。
GPT-4Vは、任意にインターリーブされたマルチモーダル入力を処理するという前例のない能力により、強力なマルチモーダルジェネラリストシステムとなっている。
GPT-4Vの、入力画像に描かれた視覚マーカーを理解するユニークな能力は、新しい人間とコンピュータの相互作用方法をもたらす。
論文 参考訳(メタデータ) (2023-09-29T17:34:51Z) - AutoML-GPT: Automatic Machine Learning with GPT [74.30699827690596]
本稿では,タスク指向のプロンプトを開発し,大規模言語モデル(LLM)を自動的に活用して学習パイプラインを自動化することを提案する。
本稿では,多様なAIモデルのブリッジとしてGPTを用いたAutoML-GPTを提案する。
このアプローチはコンピュータビジョン、自然言語処理、その他の課題領域において顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-05-04T02:09:43Z) - Can GPT-4 Perform Neural Architecture Search? [56.98363718371614]
ニューラルアーキテクチャサーチ(NAS)におけるGPT-4の可能性について検討する。
提案手法である textbfGPT-4 textbfEnhanced textbfNeural archtextbfItecttextbfUre textbfSearch (GENIUS)
我々は、いくつかのベンチマークでGENIUSを評価し、既存のNAS技術と比較し、その効果を実証した。
論文 参考訳(メタデータ) (2023-04-21T14:06:44Z) - Performance of ChatGPT on the US Fundamentals of Engineering Exam:
Comprehensive Assessment of Proficiency and Potential Implications for
Professional Environmental Engineering Practice [0.0]
本研究は, GPT-4 モデルである ChatGPT を用いて, 工学基礎(FE) 環境評価における良好な性能を実現することの実現可能性と有効性について検討する。
この結果は、ChatGPTモデルの連続反復における数学的能力の顕著な改善を反映し、複雑な工学的問題を解く可能性を示している。
論文 参考訳(メタデータ) (2023-04-20T16:54:34Z) - Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1188263570629]
OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。
我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。
我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文 参考訳(メタデータ) (2023-03-22T16:51:28Z) - GPT-4 Technical Report [116.90398195245983]
GPT-4は大規模なマルチモーダルモデルであり、画像やテキストの入力を受け取り、テキスト出力を生成することができる。
試験受験者の上位10%のスコアで模擬試験に合格するなど、さまざまな専門的、学術的なベンチマークで人間レベルのパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-03-15T17:15:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。