論文の概要: Rethinking Personalization in Large Language Models at the Token Level
- arxiv url: http://arxiv.org/abs/2603.06595v1
- Date: Wed, 04 Feb 2026 16:05:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-15 16:38:22.404924
- Title: Rethinking Personalization in Large Language Models at the Token Level
- Title(参考訳): トークンレベルでの大規模言語モデルにおけるパーソナライズ再考
- Authors: Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen Lin,
- Abstract要約: パーソナライズは通常、ベースNLPタスクの上に追加レイヤとしてフレーム化される。
トークンレベルの観点からは、応答中の異なるトークンは、様々な程度にパーソナライズに寄与する。
本稿では,ユーザ固有の情報に対する各出力トークンの依存性を推定する自己コントラスト手法PerContrastを提案する。
- 参考スコア(独自算出の注目度): 89.64259958702165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With large language models (LLMs) now performing strongly across diverse tasks, there is growing demand for them to personalize outputs for individual users. Personalization is typically framed as an additional layer on top of a base NLP task, requiring model responses to meet user-specific needs while still accomplishing the underlying task. From a token-level perspective, different tokens in a response contribute to personalization to varying degrees. Tokens with higher personalization relevance should therefore receive greater emphasis when developing personalized LLMs. However, accurately estimating such personalization degrees remains challenging. To address this challenge, we propose PerContrast, a self-contrast method that estimates each output token's dependence on user-specific information through causal intervention. Building on this mechanism, we develop the PerCE loss, which adaptively upweights tokens with higher estimated personalization degrees during training via a bootstrap procedure, enabling the model to alternate between estimating and optimizing these tokens. Experiments on multiple LLMs demonstrate that PerCE substantially improves personalization performance with minimal additional cost, achieving average gains of over 10% and up to 68.04% on the LongLaMP dataset, along with strong cross-task and cross-scenario transferability. These results highlight the importance of token-level personalization modeling and establish token-aware training as a simple yet effective paradigm for advancing personalized LLMs.
- Abstract(参考訳): 大規模言語モデル(LLM)が多様なタスクにわたって強く機能しているため、個々のユーザのアウトプットをパーソナライズする需要が高まっている。
パーソナライゼーションは通常、ベースNLPタスクの上にある追加レイヤとしてフレーム化され、基礎となるタスクを達成しながら、ユーザ固有のニーズを満たすためにモデル応答を必要とする。
トークンレベルの観点からは、応答中の異なるトークンは、様々な程度にパーソナライズに寄与する。
したがって、パーソナライズ関連度の高いトークンは、パーソナライズされたLCMを開発する際に、より強調される。
しかし、そのようなパーソナライゼーションの度合いを正確に推定することは依然として困難である。
この課題に対処するために,各出力トークンのユーザ固有の情報への依存度を因果介入によって推定する自己コントラスト手法PerContrastを提案する。
このメカニズムに基づいて,ブートストラップ法を用いて,トレーニング中の個人化度の高いトークンを適応的にアップウェイトし,これらのトークンを推定と最適化の切り替えを可能にするPerCE損失法を開発した。
複数のLCMの実験では、PerCEはパーソナライズ性能を最小限のコストで大幅に改善し、LongLaMPデータセットで平均10%以上、最大68.04%まで向上し、強力なクロスタスクとクロスシナリオの転送性を備えている。
これらの結果は、トークンレベルのパーソナライズモデリングの重要性を強調し、パーソナライズ LLM を推進するための単純かつ効果的なパラダイムとしてトークンレベルのトレーニングを確立する。
関連論文リスト
- Synthetic Interaction Data for Scalable Personalization in Large Language Models [67.31884245564086]
本稿ではPersonaGymという高忠実な合成データ生成フレームワークを紹介する。
パーソナライゼーションを静的なペルソナ-参照ペアとして扱う以前の作業とは異なり、PersonaGymは動的な選好プロセスをモデル化する。
我々は,高忠実度マルチターンパーソナライズされたインタラクショントラジェクトリの大規模かつ高品質で多様な合成データセットであるPersonaAtlasをリリースする。
論文 参考訳(メタデータ) (2026-02-12T20:41:22Z) - One Adapts to Any: Meta Reward Modeling for Personalized LLM Alignment [55.86333374784959]
これらの制約に対処するには、データの適合からユーザの好みを学習し、嗜好適応のプロセスを学ぶためのパラダイムシフトが必要である、と我々は主張する。
メタ学習問題としてパーソナライズされた報酬モデルを変更するメタリワードモデリング(MRM)を提案する。
MRMはパーソナライズを強化し、ユーザの堅牢性を向上し、ベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-01-26T17:55:52Z) - Measuring What Makes You Unique: Difference-Aware User Modeling for Enhancing LLM Personalization [68.79814761867314]
本稿では,Large Language Models (LLM) のパーソナライゼーションを強化するために,差分認識パーソナライズ学習(DPL)を提案する。
DPLは、戦略的に代表ユーザを比較のために選択し、タスク関連の違いを抽出するための構造化標準を確立する。
実世界のデータセットの実験により、DPLはLLMのパーソナライゼーションを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2025-03-04T09:53:26Z) - PAD: Personalized Alignment of LLMs at Decoding-Time [10.347782385286582]
本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文 参考訳(メタデータ) (2024-10-05T08:00:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。