Fugu-MT 論文翻訳(概要): Parameter Efficient Tuning Allows Scalable Personalization of LLMs for Text Entry: A Case Study on Abbreviation Expansion

論文の概要: Parameter Efficient Tuning Allows Scalable Personalization of LLMs for Text Entry: A Case Study on Abbreviation Expansion

arxiv url: http://arxiv.org/abs/2312.14327v1
Date: Thu, 21 Dec 2023 22:52:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-25 16:37:05.966284
Title: Parameter Efficient Tuning Allows Scalable Personalization of LLMs for Text Entry: A Case Study on Abbreviation Expansion
Title（参考訳）: テキスト入力のためのLLMのスケーラブルなパーソナライズを可能にするパラメータ効率的なチューニング:省略拡大の一事例
Authors: Katrin Tomanek, Shanqing Cai, Subhashini Venugopalan
Abstract要約: 省略拡張は、タイピングの量を制限し、言語モデルを使用して拡張を提案することによって通信を高速化する戦略である。本稿では,事前会話に基づくLarge Language Model(LLM)の提案をパーソナライズして,予測の妥当性を高める。我々は、短縮入力のための拡張テキスト提案の微調整、即時調整、検索の強化生成を比較した。
参考スコア（独自算出の注目度）: 14.366537646319946
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Abbreviation expansion is a strategy used to speed up communication by limiting the amount of typing and using a language model to suggest expansions. Here we look at personalizing a Large Language Model's (LLM) suggestions based on prior conversations to enhance the relevance of predictions, particularly when the user data is small (~1000 samples). Specifically, we compare fine-tuning, prompt-tuning, and retrieval augmented generation of expanded text suggestions for abbreviated inputs. Our case study with a deployed 8B parameter LLM on a real user living with ALS, and experiments on movie character personalization indicates that (1) customization may be necessary in some scenarios and prompt-tuning generalizes well to those, (2) fine-tuning on in-domain data (with as few as 600 samples) still shows some gains, however (3) retrieval augmented few-shot selection also outperforms fine-tuning. (4) Parameter efficient tuning allows for efficient and scalable personalization. For prompt-tuning, we also find that initializing the learned "soft-prompts" to user relevant concept tokens leads to higher accuracy than random initialization.
Abstract（参考訳）: 省略拡張は、入力量を制限し、言語モデルを使用して拡張を提案することによって通信を高速化する戦略である。ここでは,先行会話に基づく大規模言語モデル(llm)の提案をパーソナライズして,特にユーザデータが小さければ(約1000サンプル),予測の妥当性を高めることを検討する。具体的には、短縮入力のための拡張テキスト提案の微調整、即時調整、検索の強化生成を比較した。 8bパラメータllmをalsに配置したケーススタディと,映画キャラクタのパーソナライゼーション実験から,(1)いくつかのシナリオにおいてカスタマイズが必要であること,(2)ドメイン内データの微調整(600サンプル未満)は依然としてメリットがあるが,(3)拡張された少数ショット選択の検索は,微調整よりも優れることが示唆された。 (4) パラメータ効率のよいチューニングは、効率的でスケーラブルなパーソナライズを可能にする。また,学習した"ソフトプロンプト"をユーザに関連する概念トークンに初期化すると,ランダムな初期化よりも高い精度が得られることがわかった。

関連論文リスト

Embedding-to-Prefix: Parameter-Efficient Personalization for Pre-Trained Large Language Models [6.445337954429245]
大規模言語モデル(LLM)は、文脈に関連のあるコンテンツを生成するのに優れている。本研究では,LLMの隠れ表現空間にコンテキスト埋め込みを注入するパラメータ効率の高いEmbeding-to-Prefix(E2P)を提案する。我々は2つの公開データセットとプロダクション環境でのE2Pの評価を行い、ペルソナチャットでの対話パーソナライゼーション、PENSにおける文脈的見出し生成、音楽とポッドキャストの大規模パーソナライゼーションについて検討した。
論文参考訳（メタデータ） (2025-05-16T13:34:25Z)
Tuning-Free Personalized Alignment via Trial-Error-Explain In-Context Learning [74.56097953187994]
本稿では,テキスト生成タスクのための言語モデルをパーソナライズするチューニング不要な手法であるTrial-Error-Explain In-Context Learning(TICL)を提案する。 TICLは、試行錯誤説明プロセスを通じて、文脈内学習プロンプトを反復的に拡張し、モデル生成陰性サンプルと説明を追加する。 TICLは従来の最先端技術に対して最大91.5%を達成し、パーソナライズされたアライメントタスクのための競争的なチューニング不要のベースラインを上回っている。
論文参考訳（メタデータ） (2025-02-13T05:20:21Z)
Adapting Large Language Models for Character-based Augmentative and Alternative Communication [8.072353085704629]
AAC(Augmentative and Alternative Communication)のユーザは、文字言語モデルを使用するインターフェースを通じて、レター・バイ・レターを書くことができる。本研究では,そのようなモデルを用いて文字予測を高精度かつ効率的に行う方法について検討する。
論文参考訳（メタデータ） (2025-01-17T22:20:55Z)
Parameter-Efficient Fine-Tuning of Large Language Models using Semantic Knowledge Tuning [0.08795040582681389]
大規模言語モデル (LLMs) は近年,プロンプトを用いた特殊タスクにおいて大きな人気を集めている。本稿では,ランダムトークンの代わりに有意な単語を用いたプロンプトおよびプレフィックスチューニングのためのセマンティック知識チューニング(SK-Tuning)を提案する。実験結果から,SK-Tuningは,テキスト分類や理解などのタスクにおいて,より高速なトレーニング時間,少ないパラメータ,優れたパフォーマンスを示すことがわかった。
論文参考訳（メタデータ） (2024-10-11T07:55:09Z)
Large Language Models Prompting With Episodic Memory [53.8690170372303]
本稿では,POEM(PrOmpting with Episodic Memory)を提案する。テストフェーズでは、各テストクエリのサンプルのシーケンスを最適化し、エピソードメモリにおけるトップkで最も類似したトレーニング例から最も高い合計報酬を得るシーケンスを選択する。その結果,POEMはテキスト分類タスクにおいてTEMPERAやRLPromptといった最近の技術よりも5.3%向上していることがわかった。
論文参考訳（メタデータ） (2024-08-14T11:19:28Z)
LoPT: Low-Rank Prompt Tuning for Parameter Efficient Language Models [2.380819994407948]
プロンプトチューニングはモデルファインチューニングよりもはるかにパラメータ効率が高い。高速なプロンプト最適化を実現するプロンプトの低ランクモデルであるローランクプロンプトチューニング(LoPT)を提案する。
論文参考訳（メタデータ） (2024-06-27T19:02:41Z)
PMG : Personalized Multimodal Generation with Large Language Models [20.778869086174137]
本稿では,大規模言語モデル(LLM)を用いたパーソナライズされたマルチモーダル生成手法を提案する。 2つのデータセットに関する広範な実験を通じて、その応用を実証し、その性能を検証する。 PMGのパーソナライゼーションはLPIPSで最大8%向上し, 生成精度は向上した。
論文参考訳（メタデータ） (2024-04-07T03:05:57Z)
Personalized LLM Response Generation with Parameterized Memory Injection [17.48756504658829]
大規模言語モデル(LLM)は、自然言語の理解と生成に優れた能力を発揮している。パーソナライズされたLSM応答生成は、医療などの重要な分野の個人に多大な利益をもたらす可能性がある。
論文参考訳（メタデータ） (2024-04-04T16:20:34Z)
RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models [4.085425430499285]
本稿では,パラメータ効率のよい微調整手法と合わせて,元のタスクの入力テキストを変更することの影響について検討する。入力テキストの書き直しを効果的に行うため,最大辺縁類似度を目標とした数発のパラフレーズモデルを訓練する。本研究では, パラメータ効率のよい微調整だけで達成できることを超えて, 列車におけるパラフレーズとテスト時間によるデータ豊か化により, 性能が向上することを示す。
論文参考訳（メタデータ） (2024-03-04T17:58:09Z)
Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting [68.19544657508509]
言語モデル(LLM)は、言語技術の基本コンポーネントとして採用されている。いくつかの広く使われているオープンソースLLMは、数ショット設定でプロンプトフォーマットの微妙な変更に対して非常に敏感であることがわかった。本稿では,与えられたタスクに対して有効なプロンプトフォーマットのサンプルセットを迅速に評価するアルゴリズムを提案し,モデル重み付けにアクセスせずに期待性能の間隔を報告する。
論文参考訳（メタデータ） (2023-10-17T15:03:30Z)
Gradient-Regulated Meta-Prompt Learning for Generalizable Vision-Language Models [137.74524357614285]
グラディエント・レグルアテッドメタプロンプト学習フレームワークについて紹介する。パラメーターとデータ -- 効率的な方法で下流タスクにモデルを適応させるのに役立つ。 GRAMはモデルに依存しない方法で様々なプロンプトチューニング手法に容易に組み込むことができる。
論文参考訳（メタデータ） (2023-03-12T05:03:37Z)
TEMPERA: Test-Time Prompting via Reinforcement Learning [57.48657629588436]
強化学習(TEMPERA)を用いたテスト時間プロンプト編集を提案する。従来のプロンプト生成手法とは対照的に、TEMPERAは事前知識を効率的に活用することができる。本手法は従来の微調整法と比較して試料効率の平均改善率を5.33倍に向上させる。
論文参考訳（メタデータ） (2022-11-21T22:38:20Z)
Interactive and Visual Prompt Engineering for Ad-hoc Task Adaptation with Large Language Models [116.25562358482962]
最先端のニューラルネットワークモデルは、教師付きトレーニングを必要とせずに、アドホックな言語タスクを解決するために使用することができる。 PromptIDEを使えば、ユーザはプロンプトのバリエーションを試すことができ、プロンプトのパフォーマンスを視覚化し、反復的にプロンプトを最適化できる。
論文参考訳（メタデータ） (2022-08-16T17:17:53Z)
Prefix-Tuning: Optimizing Continuous Prompts for Generation [85.6357778621526]
微調整は、大規模な事前訓練された言語モデルを使用して下流のタスクを実行する事実上の方法です。自然言語生成タスクの微調整に代わる軽量なプレフィックスチューニングを提案する。パラメータの0.1%しか学習しないことで、プレフィックスチューニングは完全なデータ設定で同等のパフォーマンスを得る。
論文参考訳（メタデータ） (2021-01-01T08:00:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。