論文の概要: OverPrompt: Enhancing ChatGPT through Efficient In-Context Learning
- arxiv url: http://arxiv.org/abs/2305.14973v2
- Date: Thu, 14 Dec 2023 16:17:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-16 04:55:31.413844
- Title: OverPrompt: Enhancing ChatGPT through Efficient In-Context Learning
- Title(参考訳): OverPrompt: 効率的なインコンテキスト学習によるチャットGPTの強化
- Authors: Jiazheng Li, Runcong Zhao, Yongxin Yang, Yulan He, Lin Gui
- Abstract要約: 複数のタスク入力を処理するために,LLMのコンテキスト内学習機能を活用したOverPromptを提案する。
本実験により,OverPromptはタスク性能を著しく損なうことなく,コスト効率の良いゼロショット分類を実現することができることがわかった。
- 参考スコア(独自算出の注目度): 49.38867353135258
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The remarkable performance of pre-trained large language models has
revolutionised various natural language processing applications. Due to huge
parametersizes and extensive running costs, companies or organisations tend to
transfer the models to the target task by zero-shot prompting techniques.
However, the prohibitive costs of tokens and time have hindered their adoption
in applications. We propose OverPrompt, leveraging the in-context learning
capability of LLMs to handle multiple task inputs, thereby reducing token and
time costs. This approach could potentially improve task performance during API
queries due to better conditional distribution mapping. Evaluated across
diverse classification datasets, our experiments show that OverPrompt can
achieve cost-efficient zero-shot classification without causing significant
detriment to task performance, and in some cases, even improving it. An
ablation study conducted on various LLMs, along with an investigation into the
robustness of our prompting strategy to different input ordering, offers
valuable insights into the broader applicability of our method across diverse
tasks. These findings also suggest a more seamless integration of our method
with LLMs through an API.
- Abstract(参考訳): 事前訓練された大規模言語モデルの顕著な性能は、様々な自然言語処理アプリケーションに革命をもたらした。
巨大なパラメータ化と広範な実行コストのため、企業や組織はモデルをゼロショットプロンプト技術でターゲットタスクに転送する傾向があります。
しかし、トークンと時間の禁止コストは、アプリケーションへの採用を妨げている。
本稿では,複数のタスク入力を処理するために,llmsのコンテキスト内学習機能を活用し,トークンと時間コストを削減するoverpromptを提案する。
このアプローチは、条件付き分散マッピングの改善により、APIクエリ中のタスクパフォーマンスを改善する可能性がある。
多様な分類データセットから評価したところ、OverPromptはタスク性能に大きな損なうことなくコスト効率の良いゼロショット分類を達成でき、場合によってはその改善も可能であることがわかった。
様々なLSMで行ったアブレーション研究は、異なる入力順序付けへの促す戦略の堅牢性の調査とともに、様々なタスクにまたがる手法の適用性に関する貴重な洞察を提供する。
これらの結果から,APIによるLCMとメソッドのシームレスな統合が示唆された。
関連論文リスト
- Characterization of Large Language Model Development in the Datacenter [57.49531095113406]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - An Experimental Design Framework for Label-Efficient Supervised
Finetuning of Large Language Models [56.494109292472835]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - INTERS: Unlocking the Power of Large Language Models in Search with
Instruction Tuning [59.07490387145391]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な機能を示している。
情報検索(IR)タスクへのそれらの適用は、自然言語における多くのIR固有の概念の頻繁な発生のため、いまだに困難である。
我々は,3つの基本IRカテゴリにまたがる20のタスクを含む新しいインストラクションチューニングデータセット InterS を導入する。
論文 参考訳(メタデータ) (2024-01-12T12:10:28Z) - OrchestraLLM: Efficient Orchestration of Language Models for Dialogue
State Tracking [18.047158624848546]
大規模言語モデル (LLM) は自然言語処理システムの状況に革命をもたらしたが、計算コストは高い。
従来,Small Language Models (SLMs) の可能性を,大規模言語に対する費用対効果の代替手段として活用するための様々なアプローチが検討されてきた。
本研究では,計算効率の向上とタスク性能の向上を目的とした新しいSLM/LLMルーティングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-16T10:30:55Z) - A Practical Survey on Zero-shot Prompt Design for In-context Learning [0.0]
大規模言語モデル(LLM)は自然言語処理(NLP)タスクを大幅に改善した。
本稿では,異なる種類のプロンプトに着目した,コンテキスト内学習手法の総合的なレビューを行う。
本稿では,手動設計や最適化アルゴリズム,評価手法など,設計を促すための様々なアプローチについて検討する。
論文 参考訳(メタデータ) (2023-09-22T23:00:34Z) - Active Prompting with Chain-of-Thought for Large Language Models [16.9127713032405]
本稿では,大規模言語モデルを異なるタスクに適応させる新しい手法であるActive-Promptを提案する。
不確実性に基づくアクティブラーニングの関連問題からアイデアを借用することにより、不確実性を特徴づける指標をいくつか導入する。
実験により,提案手法の優位性を実証し,8つの複雑な推論タスクの最先端化を図った。
論文 参考訳(メタデータ) (2023-02-23T18:58:59Z) - Instance-wise Prompt Tuning for Pretrained Language Models [72.74916121511662]
インスタンスワイドのPrompt Tuning(IPT)は、入力データインスタンスからプロンプトに知識を注入する最初のプロンプト学習パラダイムである。
IPTはタスクベースのプロンプト学習法を著しく上回り、調律パラメータのわずか0.5%から1.5%で従来の微調整に匹敵する性能を達成している。
論文 参考訳(メタデータ) (2022-06-04T10:08:50Z) - Making Pre-trained Language Models End-to-end Few-shot Learners with
Contrastive Prompt Tuning [41.15017636192417]
CP-Tuning(CP-Tuning)は、言語モデルのための最初のエンドツーエンドのPrompt Tuningフレームワークである。
完全にトレーニング可能なプロンプトパラメータを持つタスク不変の連続プロンプトエンコーディング技術と統合されている。
IRシステムや異なるPLMで使用される様々な言語理解タスクの実験は、CP-Tuningが最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2022-04-01T02:24:24Z) - CINS: Comprehensive Instruction for Few-shot Learning in Task-oriented
Dialog Systems [56.302581679816775]
本稿では,タスク固有の命令でPLMを利用する包括的インストラクション(CINS)を提案する。
命令のスキーマ(定義、制約、プロンプト)と、ToDの3つの重要な下流タスクに対するカスタマイズされた実現を設計する。
これらのToDタスクに対して,小さな検証データを用いた現実的な数ショット学習シナリオで実験を行った。
論文 参考訳(メタデータ) (2021-09-10T03:23:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。