Fugu-MT 論文翻訳(概要): Rethinking Personalization in Large Language Models at the Token Level

論文の概要: Rethinking Personalization in Large Language Models at the Token Level

arxiv url: http://arxiv.org/abs/2603.06595v1
Date: Wed, 04 Feb 2026 16:05:02 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-15 16:38:22.404924
Title: Rethinking Personalization in Large Language Models at the Token Level
Title（参考訳）: トークンレベルでの大規模言語モデルにおけるパーソナライズ再考
Authors: Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen Lin,
Abstract要約: パーソナライズは通常、ベースNLPタスクの上に追加レイヤとしてフレーム化される。トークンレベルの観点からは、応答中の異なるトークンは、様々な程度にパーソナライズに寄与する。本稿では,ユーザ固有の情報に対する各出力トークンの依存性を推定する自己コントラスト手法PerContrastを提案する。
参考スコア（独自算出の注目度）: 89.64259958702165
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With large language models (LLMs) now performing strongly across diverse tasks, there is growing demand for them to personalize outputs for individual users. Personalization is typically framed as an additional layer on top of a base NLP task, requiring model responses to meet user-specific needs while still accomplishing the underlying task. From a token-level perspective, different tokens in a response contribute to personalization to varying degrees. Tokens with higher personalization relevance should therefore receive greater emphasis when developing personalized LLMs. However, accurately estimating such personalization degrees remains challenging. To address this challenge, we propose PerContrast, a self-contrast method that estimates each output token's dependence on user-specific information through causal intervention. Building on this mechanism, we develop the PerCE loss, which adaptively upweights tokens with higher estimated personalization degrees during training via a bootstrap procedure, enabling the model to alternate between estimating and optimizing these tokens. Experiments on multiple LLMs demonstrate that PerCE substantially improves personalization performance with minimal additional cost, achieving average gains of over 10% and up to 68.04% on the LongLaMP dataset, along with strong cross-task and cross-scenario transferability. These results highlight the importance of token-level personalization modeling and establish token-aware training as a simple yet effective paradigm for advancing personalized LLMs.
Abstract（参考訳）: 大規模言語モデル(LLM)が多様なタスクにわたって強く機能しているため、個々のユーザのアウトプットをパーソナライズする需要が高まっている。パーソナライゼーションは通常、ベースNLPタスクの上にある追加レイヤとしてフレーム化され、基礎となるタスクを達成しながら、ユーザ固有のニーズを満たすためにモデル応答を必要とする。トークンレベルの観点からは、応答中の異なるトークンは、様々な程度にパーソナライズに寄与する。したがって、パーソナライズ関連度の高いトークンは、パーソナライズされたLCMを開発する際に、より強調される。しかし、そのようなパーソナライゼーションの度合いを正確に推定することは依然として困難である。この課題に対処するために,各出力トークンのユーザ固有の情報への依存度を因果介入によって推定する自己コントラスト手法PerContrastを提案する。このメカニズムに基づいて,ブートストラップ法を用いて,トレーニング中の個人化度の高いトークンを適応的にアップウェイトし,これらのトークンを推定と最適化の切り替えを可能にするPerCE損失法を開発した。複数のLCMの実験では、PerCEはパーソナライズ性能を最小限のコストで大幅に改善し、LongLaMPデータセットで平均10%以上、最大68.04%まで向上し、強力なクロスタスクとクロスシナリオの転送性を備えている。これらの結果は、トークンレベルのパーソナライズモデリングの重要性を強調し、パーソナライズ LLM を推進するための単純かつ効果的なパラダイムとしてトークンレベルのトレーニングを確立する。

論文の概要: Rethinking Personalization in Large Language Models at the Token Level

関連論文リスト