Fugu-MT 論文翻訳(概要): What's the Magic Word? A Control Theory of LLM Prompting

論文の概要: What's the Magic Word? A Control Theory of LLM Prompting

arxiv url: http://arxiv.org/abs/2310.04444v2
Date: Tue, 10 Oct 2023 10:15:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-12 18:41:00.517372
Title: What's the Magic Word? A Control Theory of LLM Prompting
Title（参考訳）: 魔法の言葉って何? LLMプロンプティングの制御理論
Authors: Aman Bhargava, Cameron Witkowski, Manav Shah, Matt Thomson
Abstract要約: LLMの最適制御問題として,プロンプトエンジニアリングを定式化する。トークンのシーケンスが与えられたら、常に LLM が最終トークンを正確に予測できるようなプロンプトが存在するだろうか? 5,000のWikiText因果的言語モデリングタスクにおいて、Falcon-7b、Llama-7b、Falcon-40bを含む大規模な言語モデルのパネルの$k-epsilon$制御可能性を計算する。
参考スコア（独自算出の注目度）: 0.8192907805418581
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Prompt engineering is effective and important in the deployment of LLMs but is poorly understood mathematically. Here, we formalize prompt engineering as an optimal control problem on LLMs -- where the prompt is considered a control variable for modulating the output distribution of the LLM. Within this framework, we ask a simple question: given a sequence of tokens, does there always exist a prompt we can prepend that will steer the LLM toward accurately predicting the final token? We call such an optimal prompt the magic word since prepending the prompt causes the LLM to output the correct answer. If magic words exist, can we find them? If so, what are their properties? We offer analytic analysis on the controllability of the self-attention head where we prove a bound on controllability as a function of the singular values of its weight matrices. We take inspiration from control theory to propose a metric called $k-\epsilon$ controllability to characterize LLM steerability. We compute the $k-\epsilon$ controllability of a panel of large language models, including Falcon-7b, Llama-7b, and Falcon-40b on 5000 WikiText causal language modeling tasks. Remarkably, we find that magic words of 10 tokens or less exist for over 97% of WikiText instances surveyed for each model.
Abstract（参考訳）: プロンプト工学はLLMの展開において効果的で重要であるが、数学的には理解されていない。そこで我々は, LLMの出力分布を制御変数として, LLMの最適制御問題としてプロンプト工学を定式化する。このフレームワークの中で、簡単な質問をする: トークンのシーケンスが与えられたら、常に、最終トークンを正確に予測するために LLM を制御できるプロンプトが存在するだろうか? LLMが正しい答えを出力する原因となるプロンプトを事前に予測するため、このような最適なプロンプトをマジックワードと呼ぶ。魔法の言葉があれば、見つけられるだろうか? もしそうなら、それらの特性は何でしょう? 重み行列の特異値の関数としての可制御性に対する有界性を証明する自己アテンションヘッドの可制御性の解析的解析を行う。我々は制御理論からインスピレーションを得て、LLMステアビリティを特徴づけるための$k-\epsilon$ controllabilityという計量を提案する。 5000 wikitextの因果的言語モデリングタスクで、falcon-7b、llama-7b、falcon-40bを含む多数の大きな言語モデルのパネルで、$k-\epsilon$の制御可能性を計算する。注目すべきは、各モデルで調査されたWikiTextインスタンスの97%以上に対して、10トークン以下のマジックワードが存在することだ。

関連論文リスト

Learning on LLM Output Signatures for gray-box LLM Behavior Analysis [52.81120759532526]
大きな言語モデル(LLM)は広く採用されていますが、その振る舞いに対する私たちの理解は限定的です。我々は,既存の手法の近似を理論的に保証するプロセスに対して,トランスフォーマーに基づくアプローチを開発する。提案手法は,グレーボックス設定における幻覚およびデータ汚染検出における優れた性能を実現する。
論文参考訳（メタデータ） (2025-03-18T09:04:37Z)
Demystifying Singular Defects in Large Language Models [61.98878352956125]
大規模言語モデル(LLM)では、ハイノームトークンの根本原因は未解明のままである。理論的な洞察と経験的検証の両方を、近年のモデルで提供します。量子化方式の改良とLCMシグネチャの設計の2つの実用的応用について述べる。
論文参考訳（メタデータ） (2025-02-10T20:09:16Z)
WALL-E: World Alignment by Rule Learning Improves World Model-based LLM Agents [55.64361927346957]
大規模言語モデル(LLM)による規則の勾配なし学習のためのニューロシンボリックアプローチを提案する。我々のLLMエージェントWALL-Eはモデル予測制御(MPC)上に構築されている MinecraftとALFWorldにおけるオープンワールドの課題について、WALL-Eは既存の方法よりも高い成功率を達成する。
論文参考訳（メタデータ） (2024-10-09T23:37:36Z)
LaMsS: When Large Language Models Meet Self-Skepticism [3.1410859223862113]
本稿では,大規模言語モデルの意味理解能力と自己懐疑性を組み合わせたLaMsSを提案する。 LaMsSは、マルチ選択質問とオープンドメイン質問回答ベンチマークの両方のベースラインよりも優れたパフォーマンスを実現している。我々の研究は、さらなる人工知能の自己懐疑論モデルに光を当てている。
論文参考訳（メタデータ） (2024-09-10T15:51:15Z)
LLMs are Not Just Next Token Predictors [0.0]
LLMは、次のトークン予測目標を持つ勾配降下による言語学習の統計モデルである。 LLMは次のトークン予測を用いて設計され、このタスクの成功に基づいてトレーニングされていますが、次のトークン予測器への還元はLLMを短く販売する、というのが私たちの見解です。これを引き出すため、遺伝子の観点から進化と発達を説明する生物学におけるかつての著名な研究プログラムと類似する。
論文参考訳（メタデータ） (2024-08-06T16:36:28Z)
Decoding with Limited Teacher Supervision Requires Understanding When to Trust the Teacher [11.136112399898481]
小規模大規模言語モデル(LLM)は、LLMの監督を効果的に活用して、その生成品質を向上するにはどうすればよいのか? 我々は,初期トークン上でのLLMおよびLLM予測を効果的に集約するアルゴリズムを開発した。提案手法は,従来の復号法よりも一貫した手法であることを示す。
論文参考訳（メタデータ） (2024-06-26T01:16:12Z)
Implicit Multimodal Alignment: On the Generalization of Frozen LLMs to Multimodal Inputs [63.29737699997859]
大規模言語モデル(LLM)は、マルチモーダルな微調整をせずに、マルチモーダルなタスクにおいて印象的なパフォーマンスを示した。本研究では,画像,ビデオ,音声,テキストの入力に凍結LDMを公開し,内部表現を解析する。
論文参考訳（メタデータ） (2024-05-26T21:31:59Z)
Potential and Limitations of LLMs in Capturing Structured Semantics: A Case Study on SRL [78.80673954827773]
大きな言語モデル(LLM)は、言語理解を高め、解釈可能性を改善し、バイアスを減らすために構造化セマンティクスをキャプチャする上で重要な役割を果たす。セマンティック・ロール・ラベルリング(SRL)を,構造化意味論を抽出するLLMの能力を探るための基本課題として用いることを提案する。 LLMは実際にセマンティック構造をキャプチャすることができ、スケールアップは常にポテンシャルを反映するわけではない。エラーのかなりの重複は、LLMと訓練されていない人間の両方によって行われ、全てのエラーの約30%を占めることに私たちは驚いています。
論文参考訳（メタデータ） (2024-05-10T11:44:05Z)
Can Large Language Models Play Games? A Case Study of A Self-Play Approach [61.15761840203145]
LLM(Large Language Models)は、インターネットからの広範なデータを利用して、幅広い事前知識を格納する。 Monte-Carlo Tree Search (MCTS)は、信頼性の高い意思決定ソリューションを提供する検索アルゴリズムである。この研究は、ターンベースのゼロサムゲームを効率的に解決するために、MCTSセルフプレイでLLMを活性化させる革新的なアプローチを導入している。
論文参考訳（メタデータ） (2024-03-08T19:16:29Z)
IntactKV: Improving Large Language Model Quantization by Keeping Pivot Tokens Intact [46.32830393597601]
大規模言語モデル(LLM)は自然言語処理に優れるが、集中的な計算を必要とする。本稿では,LLMにおける従来見過ごされていた外れ値について紹介する。 IntactKVを提案することで、完全精度モデルからピボットトークンのKVキャッシュを損失なく生成する。
論文参考訳（メタデータ） (2024-03-02T16:05:26Z)
Characterizing Large Language Model Geometry Helps Solve Toxicity Detection and Generation [15.77263269398368]
大規模言語モデル(LLM)は、現在のAIのブレークスルーを促進する。我々は幾何学のレンズを通してLLMの内部機構に光を当てた。我々は,任意の(事前学習された)LLMから抽出できる解釈可能な幾何学的特徴を導出する。
論文参考訳（メタデータ） (2023-12-04T06:01:32Z)
On Learning Latent Models with Multi-Instance Weak Supervision [57.18649648182171]
本稿では,複数の入力インスタンスに関連付けられた遷移関数$sigma$ラベルによって,教師信号が生成される弱い教師付き学習シナリオについて考察する。我々の問題は、潜在的な構造学習やニューロシンボリックな統合など、さまざまな分野で満たされている。
論文参考訳（メタデータ） (2023-06-23T22:05:08Z)
SatLM: Satisfiability-Aided Language Models Using Declarative Prompting [68.40726892904286]
本研究では,大規模言語モデル (LLM) の推論能力を向上させるために,新しい満足度支援言語モデリング (SatLM) 手法を提案する。我々はLLMを用いて命令型プログラムではなく宣言型タスク仕様を生成し、既製の自動定理証明器を利用して最終解を導出する。我々はSATLMを8つの異なるデータセット上で評価し、命令パラダイムにおいてプログラム支援されたLMよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2023-05-16T17:55:51Z)
Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes [54.13559879916708]
EVAPORATEは大規模言語モデル(LLM)を利用したプロトタイプシステムである。コード合成は安価だが、各文書をLSMで直接処理するよりもはるかに正確ではない。直接抽出よりも優れた品質を実現する拡張コード実装EVAPORATE-CODE+を提案する。
論文参考訳（メタデータ） (2023-04-19T06:00:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。