論文の概要: AskIt: Unified Programming Interface for Programming with Large Language
Models
- arxiv url: http://arxiv.org/abs/2308.15645v2
- Date: Wed, 27 Dec 2023 15:25:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 22:21:45.306584
- Title: AskIt: Unified Programming Interface for Programming with Large Language
Models
- Title(参考訳): AskIt: 大規模言語モデルによるプログラミングのための統一プログラミングインターフェース
- Authors: Katsumi Okuda, Saman Amarasinghe
- Abstract要約: 大規模言語モデル(LLM)は創発能力として知られるユニークな現象を示し、多くのタスクにまたがって適応性を示す。
本稿では,LLM用に特別に設計されたドメイン固有言語であるAskItを紹介する。
50タスクにわたって、AskItは簡潔なプロンプトを生成し、ベンチマークよりも16.14パーセントのプロンプト長の削減を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) exhibit a unique phenomenon known as emergent
abilities, demonstrating adeptness across numerous tasks, from text
summarization to code generation. While these abilities open up novel avenues
in software design and crafting, their incorporation presents substantial
challenges. Developers face decisions regarding the use of LLMs for directly
performing tasks within applications as well as for generating and executing
code to accomplish these tasks. Moreover, effective prompt design becomes a
critical concern, given the necessity of extracting data from natural language
outputs. To address these complexities, this paper introduces AskIt, a
domain-specific language (DSL) specifically designed for LLMs. AskIt simplifies
LLM integration by providing a unified interface that not only allows for
direct task execution using LLMs but also supports the entire cycle of code
generation and execution. This dual capability is achieved through (1)
type-guided output control, (2) template-based function definitions, and (3)
prompt generation for both usage modes. Our evaluations underscore AskIt's
effectiveness. Across 50 tasks, AskIt generated concise prompts, achieving a
16.14 % reduction in prompt length compared to benchmarks. Additionally, by
enabling a seamless transition between using LLMs directly in applications and
for generating code, AskIt achieved significant efficiency improvements, as
observed in our GSM8K benchmark experiments. The implementations of AskIt in
TypeScript and Python are available at https://github.com/katsumiok/ts-askit
and https://github.com/katsumiok/pyaskit, respectively.
- Abstract(参考訳): 大規模言語モデル(LLM)は創発的能力として知られるユニークな現象を示し、テキストの要約からコード生成に至るまで、多くのタスクで有効性を示す。
これらの能力は、ソフトウェア設計とクラフトの新たな道を開く一方で、その法人化には大きな課題がある。
開発者は、アプリケーション内で直接タスクを実行するためのLLMの使用と、これらのタスクを達成するためのコードの生成と実行に関する決定に直面します。
さらに、自然言語出力からデータを抽出する必要性から、効果的なプロンプト設計が重要な関心事となる。
これらの複雑さに対処するために、LLM用に特別に設計されたドメイン固有言語(DSL)であるAskItを紹介します。
AskItは、LLMを使用して直接タスクを実行することができるだけでなく、コード生成と実行のサイクル全体をサポートする統一インターフェースを提供することで、LLM統合を単純化する。
このデュアル機能は、(1)型誘導出力制御、(2)テンプレートベースの関数定義、(3)両方の使用モードのプロンプト生成によって実現される。
我々の評価はAskItの有効性を裏付けるものである。
50タスクにわたって、AskItは簡潔なプロンプトを生成し、ベンチマークよりも16.14パーセントのプロンプト長を短縮した。
さらに、アプリケーションでLLMを直接使用してコードを生成するためのシームレスな移行を可能にすることで、GSM8Kベンチマーク実験で見られるように、AskItは大幅な効率改善を実現しました。
TypeScriptとPythonのAskItの実装は、https://github.com/katsumiok/ts-askitとhttps://github.com/katsumiok/pyaskitでそれぞれ提供されている。
関連論文リスト
- zsLLMCode: An Effective Approach for Functional Code Embedding via LLM with Zero-Shot Learning [6.976968804436321]
大型言語モデル(LLM)はゼロショット学習の能力を持ち、訓練や微調整を必要としない。
LLMを用いた関数型コード埋め込みを生成する新しいアプローチであるzsLLMCodeを提案する。
論文 参考訳(メタデータ) (2024-09-23T01:03:15Z) - INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning [59.07490387145391]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な機能を示している。
情報検索(IR)タスクへのそれらの適用は、自然言語における多くのIR固有の概念の頻繁な発生のため、いまだに困難である。
我々は,3つの基本IRカテゴリにまたがる20のタスクを含む新しいインストラクションチューニングデータセット InterS を導入する。
論文 参考訳(メタデータ) (2024-01-12T12:10:28Z) - If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code
Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練される
コードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文 参考訳(メタデータ) (2024-01-01T16:51:20Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - Testing LLMs on Code Generation with Varying Levels of Prompt
Specificity [0.0]
大規模言語モデル (LLM) は、人間のようなテキスト生成と処理を模倣する非並列的な技術を示している。
自然言語のプロンプトを実行可能なコードに変換する可能性は、ソフトウェア開発プラクティスの大きな変化を約束します。
論文 参考訳(メタデータ) (2023-11-10T23:41:41Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Low-code LLM: Graphical User Interface over Large Language Models [115.08718239772107]
本稿では,人間-LLMインタラクションフレームワークであるLow-code LLMを紹介する。
より制御可能で安定した応答を実現するために、6種類のシンプルなローコードビジュアルプログラミングインタラクションを組み込んでいる。
ユーザフレンドリなインタラクション,制御可能な生成,広い適用性という,低コード LLM の3つの利点を強調した。
論文 参考訳(メタデータ) (2023-04-17T09:27:40Z) - Check Your Facts and Try Again: Improving Large Language Models with
External Knowledge and Automated Feedback [127.75419038610455]
大規模言語モデル(LLM)は、ダウンストリームタスクの多くに対して、人間のような、流動的な応答を生成することができる。
本稿では,プラグ・アンド・プレイモジュールのセットでブラックボックスのLSMを増強するLSM-Augmenterシステムを提案する。
論文 参考訳(メタデータ) (2023-02-24T18:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。