論文の概要: Extensible Prompts for Language Models on Zero-shot Language Style
Customization
- arxiv url: http://arxiv.org/abs/2212.00616v2
- Date: Thu, 30 Nov 2023 20:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 19:19:21.616514
- Title: Extensible Prompts for Language Models on Zero-shot Language Style
Customization
- Title(参考訳): ゼロショット言語スタイルカスタマイズにおける言語モデルの拡張性プロンプト
- Authors: Tao Ge, Jing Hu, Li Dong, Shaoguang Mao, Yan Xia, Xun Wang, Si-Qing
Chen, Furu Wei
- Abstract要約: X-Promptは、自然言語(NL)を超えた大きな言語モデル(LLM)を指示する
新しい想像的単語を登録することで、LLMにNL単語で記述するのが難しい概念を理解するよう指示することができる。
これらの虚構語は、様々なプロンプトでNL語のように(再)使用できるように、分布外頑健であるように設計されている。
- 参考スコア(独自算出の注目度): 89.1622516945109
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose eXtensible Prompt (X-Prompt) for prompting a large language model
(LLM) beyond natural language (NL). X-Prompt instructs an LLM with not only NL
but also an extensible vocabulary of imaginary words. Registering new imaginary
words allows us to instruct the LLM to comprehend concepts that are difficult
to describe with NL words, thereby making a prompt more descriptive. Also,
these imaginary words are designed to be out-of-distribution (OOD) robust so
that they can be (re)used like NL words in various prompts, distinguishing
X-Prompt from soft prompt that is for fitting in-distribution data. We propose
context-augmented learning (CAL) to learn imaginary words for general
usability, enabling them to work properly in OOD (unseen) prompts. We
experiment X-Prompt for zero-shot language style customization as a case study.
The promising results of X-Prompt demonstrate its potential to facilitate
advanced interaction beyond the natural language interface, bridging the
communication gap between humans and LLMs.
- Abstract(参考訳): 本稿では,自然言語(nl)を超えた大規模言語モデル(llm)の推進を目的とした拡張性プロンプト(x-prompt)を提案する。
X-Prompt は、NL だけでなく、想像上の単語の拡張可能な語彙で LLM を指示する。
新しい想像上の単語を登録することで、llmにnlの単語で記述するのが難しい概念を理解させるように指示することができる。
また、これらの想像上の単語は、様々なプロンプトでnl単語のように(再)使われるように、分散(ood)が堅牢であるように設計されており、x-promptと、分散データに適合するソフトプロンプトとを区別している。
本稿では,一般ユーザビリティのための仮想単語学習のための文脈拡張学習(CAL)を提案し,OOD(unseen)プロンプトで適切に機能させる。
ゼロショット言語スタイルカスタマイズのためのx-promptをケーススタディとして実験する。
X-Promptの有望な結果は、自然言語インターフェースを超えて高度な対話を促進する可能性を示し、人間とLLM間のコミュニケーションギャップを埋める。
関連論文リスト
- ExpressivityArena: Can LLMs Express Information Implicitly? [5.93216512770653]
大規模言語モデル(LLM)は特定の次元において顕著な性能を示した。
人間の効果的なコミュニケーションに使用する暗黙の言語的手がかりを表現できる能力は、いまだに不明である。
本稿では,LLMの暗黙的通信能力を測定するPythonライブラリであるExpressivityArenaについて述べる。
論文 参考訳(メタデータ) (2024-11-12T18:35:28Z) - Understanding and Mitigating Language Confusion in LLMs [76.96033035093204]
我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。
Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。
言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文 参考訳(メタデータ) (2024-06-28T17:03:51Z) - Large Language Models are Interpretable Learners [53.56735770834617]
本稿では,Large Language Models(LLM)とシンボルプログラムの組み合わせによって,表現性と解釈可能性のギャップを埋めることができることを示す。
自然言語プロンプトを持つ事前訓練されたLLMは、生の入力を自然言語の概念に変換することができる解釈可能な膨大なモジュールセットを提供する。
LSPが学んだ知識は自然言語の記述と記号規則の組み合わせであり、人間(解釈可能)や他のLLMに容易に転送できる。
論文 参考訳(メタデータ) (2024-06-25T02:18:15Z) - AlignedCoT: Prompting Large Language Models via Native-Speaking Demonstrations [52.43593893122206]
Alignedcotは、大規模言語モデルを呼び出すためのコンテキスト内学習技術である。
ゼロショットシナリオでは、一貫した正しいステップワイズプロンプトを達成する。
数学的推論とコモンセンス推論の実験を行う。
論文 参考訳(メタデータ) (2023-11-22T17:24:21Z) - The language of prompting: What linguistic properties make a prompt
successful? [13.034603322224548]
LLMは、多くのNLPタスクにおいて、印象的なゼロショットまたは少数ショットのパフォーマンスを達成するよう促すことができる。
しかし、プロンプトの言語的特性がタスクのパフォーマンスとどのように関連しているかについての体系的な理解はいまだに欠けている。
モーメント,テンション,アスペクト,モダリティなどの文法的性質と,同義語の使用による語彙・意味の変化について検討する。
論文 参考訳(メタデータ) (2023-11-03T15:03:36Z) - Establishing Vocabulary Tests as a Benchmark for Evaluating Large
Language Models [2.7013338932521416]
我々は,大言語モデル(LLM)の性能を評価する貴重なツールとして,語彙テストの復活を提唱する。
2つの言語にまたがる2つの語彙テスト形式を用いて7つのLSMを評価し,その語彙的知識の驚くべきギャップを明らかにする。
論文 参考訳(メタデータ) (2023-10-23T08:45:12Z) - Translate to Disambiguate: Zero-shot Multilingual Word Sense
Disambiguation with Pretrained Language Models [67.19567060894563]
事前訓練された言語モデル(PLM)は、豊富な言語間知識を学習し、多様なタスクでうまく機能するように微調整することができる。
C-WLT(Contextual Word-Level Translation)を用いた言語間単語感覚の捉え方の検討を行った。
モデルのサイズが大きくなるにつれて、PLMはより言語間単語認識の知識をエンコードし、WLT性能を改善するためのコンテキストを良くする。
論文 参考訳(メタデータ) (2023-04-26T19:55:52Z) - Revisiting Language Encoding in Learning Multilingual Representations [70.01772581545103]
言語埋め込みを置き換えるクロスリンガル言語投影(Cross-lingual Language Projection, XLP)と呼ばれる新しいアプローチを提案する。
XLPは単語埋め込みを言語固有の意味空間に投影し、投影された埋め込みはTransformerモデルに供給される。
実験により、xlpは広範囲の多言語ベンチマークデータセットのモデル性能を自由かつ著しく向上できることが示された。
論文 参考訳(メタデータ) (2021-02-16T18:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。