論文の概要: From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG
- arxiv url: http://arxiv.org/abs/2605.18271v1
- Date: Mon, 18 May 2026 12:06:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.592149
- Title: From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG
- Title(参考訳): ボリュームからバリューへ: オンデバイスRAGの優先型メモリ構成
- Authors: Changmin Lee, Jaemin Kim, Taesik Gong,
- Abstract要約: EPICは、個人的コンテキストのコンパクトで安定した形式として、ユーザの好みに焦点を当てている。
原データから嗜好関連情報を選択的に保持し、選好関連コンテキストに向けて検索を整列する。
インデックスメモリを2,404倍に減らし、20.17パーセントの精度を向上し、最高のパフォーマンスのベースラインよりも33.33倍低い検索レイテンシを実現する。
- 参考スコア(独自算出の注目度): 15.049461315464443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rapid emergence of personal AI agents based on Large Language Models (LLMs), implementing them on-device has become essential for privacy and responsiveness. To handle the inherently personal and context-dependent nature of real-world requests, such agents must ground their generation in device-resident personal context. However, under tight memory budgets, the core bottleneck is what to store so that retrieval remains aligned with the user. We propose EPIC (Efficient Preference-aligned Index Construction), which focuses on user preferences as a compact and stable form of personal context and integrates them throughout the RAG pipeline. EPIC selectively retains preference-relevant information from raw data and aligns retrieval toward preference-aligned contexts. Across four benchmarks covering conversations, debates, explanations, and recommendations, EPIC reduces indexing memory by 2,404 times, improves preference-following accuracy by 20.17 percentage points, and achieves 33.33 times lower retrieval latency over the best-performing baseline. In our on-device experiment, EPIC maintains a memory footprint under 1 MB with 29.35 ms/query latency in streaming updates.
- Abstract(参考訳): LLM(Large Language Models)に基づいたパーソナルAIエージェントの急速な台頭により、デバイス上で実装することが、プライバシと応答性にとって不可欠になっている。
現実の要求の本質的に個人的およびコンテキストに依存した性質を扱うためには、そのようなエージェントはデバイス常駐の個人的コンテキストにその生成を根ざさなければならない。
しかし、厳格なメモリ予算の下では、検索がユーザと一致し続けるように、何が格納されるかがボトルネックとなる。
本稿では,EPIC(Efficient Preference-aligned Index Construction)を提案する。
EPICは、原データから嗜好関連情報を選択的に保持し、選好関連コンテキストに対して検索を整列する。
会話、討論、説明、レコメンデーションを含む4つのベンチマークで、EPICはインデックスメモリを2,404倍に減らし、20.17パーセントの精度を向上し、最高のパフォーマンスのベースラインよりも33.33倍のレイテンシを実現する。
デバイス上での実験では、EPICは1MB未満のメモリフットプリントを維持し、ストリーミング更新では29.35ms/クエリレイテンシを実現しています。
関連論文リスト
- Opal: Private Memory for Personal AI [14.234083579027399]
パーソナルAIシステムは、ユーザー活動の長期記憶をますます保持している。
信頼できるハードウェアは、このデータをプライベートに保てるが、成長するデータストアのスケールに苦慮している。
パーソナルAIのためのプライベートメモリシステムであるOpalを紹介する。
論文 参考訳(メタデータ) (2026-04-02T21:23:00Z) - PERMA: Benchmarking Personalized Memory Agents via Event-Driven Preference and Realistic Task Environments [72.02445514666428]
静的な嗜好リコールを超えてペルマの一貫性を評価するためのベンチマークであるPERMAを紹介する。
PerMAは、複数のセッションとドメインにまたがる時間的に順序付けられたインタラクションイベントと、時間とともに好みに関連するクエリで構成されている。
実験により、関連するインタラクションをリンクすることで、高度なメモリシステムはより正確な好みを抽出し、トークン消費を減らすことができることが示された。
論文 参考訳(メタデータ) (2026-03-24T14:04:11Z) - AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment [54.72137309071243]
AlpsBenchはWildChatからキュレートされた2500の長期的相互作用配列から構成され、人間によって検証された構造化記憶と組み合わせられる。
我々は、パーソナライズされた情報抽出、更新、検索、利用の4つの重要なタスクを定義し、メモリ管理のライフサイクル全体を評価するためのプロトコルを確立する。
i)モデルが潜在ユーザ特性を確実に抽出するのに苦労していること、(ii)メモリ更新が最強モデルでもパフォーマンス天井に直面すること、(iii)大きなイントラクタプールの存在下での検索精度が急激に低下すること、(iv)明示的なメモリ機構がリコールを改善する一方で、リコールは行わないこと、などである。
論文 参考訳(メタデータ) (2026-03-09T11:06:19Z) - Learning Personalized Agents from Human Feedback [36.47803872623135]
連続的なパーソナライズのための枠組みであるPAHF(Personalized Agents from Human Feedback)を紹介する。
PAHFは、ユーザ毎の明示的なメモリを使用して、ライブインタラクションからオンラインで学習する。
ベンチマークは、エージェントが最初の好みをスクラッチから学習し、その後ペルソナシフトに適応する能力を定量化する。
論文 参考訳(メタデータ) (2026-02-18T04:18:47Z) - PersonaMem-v2: Towards Personalized Intelligence via Learning Implicit User Personas and Agentic Memory [56.81126490418336]
パーソナライゼーションは、AI能力とアライメントの進歩における次のマイルストーンの1つだ。
PersonaMem-v2は300以上のシナリオ、20,000以上のユーザの好み、128kのコンテキストウィンドウで、1,000の現実的なユーザ-チャットボットインタラクションをシミュレートする。
我々はQwen3-4BをトレーニングしてGPT-5を上回り、暗黙のパーソナライゼーションにおいて53%の精度を達成した。
論文 参考訳(メタデータ) (2025-12-07T06:48:23Z) - O-Mem: Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.1848551962911]
O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文 参考訳(メタデータ) (2025-11-17T16:55:19Z) - MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning [73.27233666920618]
本稿では,メモリを反復的に保持し,現在のターンと組み合わせたエージェントワークフローであるMemSearcherを提案する。
それぞれのターンで、MemSearcherはユーザーの質問をメモリに融合させ、推論トレースを生成し、検索アクションを実行し、メモリを更新してタスクの解決に必要な情報のみを保持する。
我々は,MemSearcher Agents の推論,検索戦略,メモリ管理を協調的に最適化する,エンドツーエンドの RL フレームワークである Multi-context GRPO を紹介する。
論文 参考訳(メタデータ) (2025-11-04T18:27:39Z) - Enabling On-Device Large Language Model Personalization with Self-Supervised Data Selection and Synthesis [27.792167318819068]
本稿では,オンライン上で最も代表的なデータを自己管理的に選択・保存するための新しいフレームワークを提案する。
実験の結果,提案フレームワークは,バニラベースラインと比較して,ユーザ固有のコンテンツ生成能力(精度)と微調整速度(性能)に優れていた。
論文 参考訳(メタデータ) (2023-11-21T01:34:02Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。