論文の概要: Response-Aware User Memory Selection for LLM Personalization
- arxiv url: http://arxiv.org/abs/2604.14473v1
- Date: Wed, 15 Apr 2026 23:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.642788
- Title: Response-Aware User Memory Selection for LLM Personalization
- Title(参考訳): LLMパーソナライズのための応答型ユーザメモリ選択
- Authors: Jillian Fisher, Jennifer Neville, Chan Young Park,
- Abstract要約: メモリ選択(RUMS)に対する応答-ユーティリティ最適化
RUMSは、メモリサブセットとモデル出力の相互情報を測定することによって、ユーザメモリアイテムを選択する新しい方法である。
RUMSを用いて選択したメモリアイテムは,計算コストを最大95%削減した上で,既存の手法に比べて応答品質が向上することを示す。
- 参考スコア(独自算出の注目度): 21.52216937428913
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A common approach to personalization in large language models (LLMs) is to incorporate a subset of the user memory into the prompt at inference time to guide the model's generation. Existing methods select these subsets primarily using similarity between user memory items and input queries, ignoring how features actually affect the model's response distribution. We propose Response-Utility optimization for Memory Selection (RUMS), a novel method that selects user memory items by measuring the mutual information between a subset of memory and the model's outputs, identifying items that reduce response uncertainty and sharpen predictions beyond semantic similarity. We demonstrate that this information-theoretic foundation enables more principled user memory selection that aligns more closely with human selection compared to state-of-the-art methods, and models $400\times$ larger. Additionally, we show that memory items selected using RUMS result in better response quality compared to existing approaches, while having up to $95\%$ reduction in computational cost.
- Abstract(参考訳): 大規模言語モデル(LLM)におけるパーソナライズへの一般的なアプローチは、ユーザメモリのサブセットを推論時にプロンプトに組み込んでモデル生成を導くことである。
既存のメソッドは、主にユーザメモリアイテムと入力クエリの類似性を使用して、これらのサブセットを選択する。
本稿では,メモリサブセットとモデル出力の相互情報を計測し,応答の不確実性を低減し,セマンティックな類似性を超えた予測を鋭くする手法である,メモリ選択のための応答ユーティリティ最適化(RUMS)を提案する。
この情報理論の基礎は、最先端の手法に比べて人間の選択とより密に整合した、より原理化されたユーザメモリ選択を可能にし、400ドル以上のモデルを実現することを実証している。
さらに, RUMS を用いて選択したメモリ項目は, 計算コストを最大 95 % 削減した上で, 既存の手法よりも応答品質がよいことを示す。
関連論文リスト
- TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA [8.036549927091286]
大規模言語モデル(LLM)は、様々なドメインにわたるテキストベースのコンテキストにおいて強力な推論能力を示した。
コンテキストウィンドウの制限は、長距離推論タスクにおけるモデルの課題を引き起こす。
ツール拡張型自律メモリ検索フレームワーク(TA-Mem)を導入する。
TA-MemはLoCoMoデータセットで評価され、既存のベースラインアプローチよりも大幅にパフォーマンスが向上した。
論文 参考訳(メタデータ) (2026-03-10T07:27:01Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - Multiple Memory Systems for Enhancing the Long-term Memory of Agent [9.43633399280987]
MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。
我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文 参考訳(メタデータ) (2025-08-21T06:29:42Z) - From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents [79.87304940020256]
大言語モデル(LLM)は会話エージェントで広く採用されている。
MemGASは、多粒度アソシエーション、適応選択、検索を構築することにより、メモリ統合を強化するフレームワークである。
4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-05-26T06:13:07Z) - Scalable Dynamic Embedding Size Search for Streaming Recommendation [47.69328280479569]
実世界のレコメンデーションシステムは、しばしばストリーミングレコメンデーションシナリオで機能する。
ユーザやアイテムの数は増加を続けており、かなりのストレージリソース消費につながっている。
SCALLと呼ばれるストリーミングレコメンデーション用のLightweight Embeddingsを学び、ユーザ/イテムの埋め込みサイズを適応的に調整できる。
論文 参考訳(メタデータ) (2024-07-22T06:37:24Z) - A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental
Learning [56.450090618578]
CIL(Class-Incremental Learning)は、この要件を満たすために、限られたメモリサイズでモデルをトレーニングすることを目的としている。
モデルサイズを総予算にカウントし,メモリサイズに整合する手法を比較すると,保存モデルは常に機能しないことを示す。
本稿では,メモリ効率のよい拡張可能なMOdelのための MEMO という,シンプルで効果的なベースラインを提案する。
論文 参考訳(メタデータ) (2022-05-26T08:24:01Z) - PeTra: A Sparsely Supervised Memory Model for People Tracking [50.98911178059019]
メモリスロット内のエンティティを追跡するように設計されたメモリ拡張ニューラルネットワークであるPeTraを提案する。
我々は、重要なモデリング選択を経験的に比較し、強い性能を維持しながら、メモリモジュールの設計のいくつかの側面を単純化できることを見出した。
PeTraは両方の評価に非常に効果的で、限られたアノテーションで訓練されているにもかかわらず、メモリ内の人々を追跡できる能力を示している。
論文 参考訳(メタデータ) (2020-05-06T17:45:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。