Fugu-MT 論文翻訳(概要): CarMem: Enhancing Long-Term Memory in LLM Voice Assistants through Category-Bounding

論文の概要: CarMem: Enhancing Long-Term Memory in LLM Voice Assistants through Category-Bounding

arxiv url: http://arxiv.org/abs/2501.09645v1
Date: Thu, 16 Jan 2025 16:37:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-17 16:36:32.523424
Title: CarMem: Enhancing Long-Term Memory in LLM Voice Assistants through Category-Bounding
Title（参考訳）: CarMem: LLM音声アシスタントにおけるカテゴリ境界による長期記憶の強化
Authors: Johannes Kirmayr, Lukas Stappen, Phillip Schneider, Florian Matthes, Elisabeth André,
Abstract要約: 本稿では,予め定義されたカテゴリを中心に構成された音声アシスタントのための長期記憶システムを提案する。このアプローチでは、Large Language Modelsを活用して、好みを効率的に抽出、保存、検索する。また、実業界データに基づく合成マルチターン・マルチセッション会話データセット(CarMem)も導入する。
参考スコア（独自算出の注目度）: 10.153019108368795
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In today's assistant landscape, personalisation enhances interactions, fosters long-term relationships, and deepens engagement. However, many systems struggle with retaining user preferences, leading to repetitive user requests and disengagement. Furthermore, the unregulated and opaque extraction of user preferences in industry applications raises significant concerns about privacy and trust, especially in regions with stringent regulations like Europe. In response to these challenges, we propose a long-term memory system for voice assistants, structured around predefined categories. This approach leverages Large Language Models to efficiently extract, store, and retrieve preferences within these categories, ensuring both personalisation and transparency. We also introduce a synthetic multi-turn, multi-session conversation dataset (CarMem), grounded in real industry data, tailored to an in-car voice assistant setting. Benchmarked on the dataset, our system achieves an F1-score of .78 to .95 in preference extraction, depending on category granularity. Our maintenance strategy reduces redundant preferences by 95% and contradictory ones by 92%, while the accuracy of optimal retrieval is at .87. Collectively, the results demonstrate the system's suitability for industrial applications.
Abstract（参考訳）: 今日のアシスタントランドスケープでは、パーソナライゼーションは相互作用を強化し、長期的な関係を育み、エンゲージメントを深める。しかし、多くのシステムはユーザーの好みを維持するのに苦労し、繰り返しユーザーからの要求や不満を招きます。さらに、業界アプリケーションにおけるユーザー好みの非規制かつ不透明な抽出は、特にヨーロッパのような厳格な規制のある地域では、プライバシと信頼に関する重大な懸念を提起する。これらの課題に対応するために,事前に定義されたカテゴリを中心に構成された音声アシスタントのための長期記憶システムを提案する。このアプローチでは、Large Language Modelsを活用して、これらのカテゴリ内の好みを効率的に抽出、保存、検索し、パーソナライズと透明性の両方を保証する。また、車載音声アシスタントの設定に合わせて、実業界データに基づく合成マルチターンマルチセッション会話データセット(CarMem)も導入した。データセットをベンチマークし, カテゴリーの粒度に応じて, F1スコア.78から.95の選好抽出を実現した。我々のメンテナンス戦略は、冗長な選好を95%削減し、矛盾する選好を92%削減し、最適検索の精度は.87である。この結果は,産業応用におけるシステムの適合性を総合的に示すものである。

関連論文リスト

FaST: Feature-aware Sampling and Tuning for Personalized Preference Alignment with Limited Data [14.12452005994486]
私たちは、ユーザ1人当たりの好みアノテーションの小さなセットだけを収集できるような、実用的で難しい設定に重点を置いています。この分野での研究を支援するために、DnDとELIPという2つのデータセットを紹介します。本稿では,データから自動的に検出される高次特徴を活用する,パラメータ効率の高いアプローチであるFaSTを提案する。
論文参考訳（メタデータ） (2025-08-06T17:58:26Z)
LoopServe: An Adaptive Dual-phase LLM Inference Acceleration System for Multi-Turn Dialogues [55.332261548836485]
LoopServeは、多ターン対話における大規模言語モデルのための適応的な二相推論フレームワークである。既存のベースラインに比べて一貫して優れた効果を発揮する。これは、幅広い長文対話タスクにおける推論を著しく加速する。
論文参考訳（メタデータ） (2025-07-18T06:12:08Z)
Towards Multi-Granularity Memory Association and Selection for Long-Term Conversational Agents [73.77930932005354]
我々は,多粒度アソシエーション,適応選択,検索を構築することで,メモリ統合を向上するフレームワークであるMemGASを提案する。 MemGASは多粒度メモリユニットに基づいており、ガウス混合モデルを用いて新しい記憶と過去の記憶をクラスタリングし関連付けている。 4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2025-05-26T06:13:07Z)
Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文参考訳（メタデータ） (2025-05-02T04:01:31Z)
FSPO: Few-Shot Preference Optimization of Synthetic Preference Data in LLMs Elicits Effective Personalization to Real Users [111.56469697145519]
メタ学習問題として報酬モデルを再設計するFew-Shot Preference Optimizationを提案する。このフレームワークでは、LDMはそのユーザからいくつかのラベル付けされた好みを通じてユーザへの迅速な適応を学び、パーソナライズされた報酬関数を構築する。公開されているLLMを用いて100万以上の合成パーソナライズされた好みを生成する。本研究は,映画レビュー,教育背景に基づく教育適応,一般質問応答の3分野を対象に,最大1,500人の総合ユーザを対象に,パーソナライズされたオープンエンド世代に対するFSPOの評価を行った。
論文参考訳（メタデータ） (2025-02-26T17:08:46Z)
Beyond the Binary: Capturing Diverse Preferences With Reward Regularization [15.518838657050173]
この二項選択への依存は、現実のタスクにおいて対象ユーザのより広範囲で集約的な嗜好を捉えるものではない、と我々は主張する。本稿では、既存の二分選好データセットを合成選好判断で拡張し、潜在的なユーザ不一致を推定する、シンプルで効果的な方法を提案する。
論文参考訳（メタデータ） (2024-12-05T02:35:46Z)
Active Preference-based Learning for Multi-dimensional Personalization [7.349038301460469]
大規模言語モデル(LLM)はタスク間で顕著な汎用性を示しているが、個々の人間の好みに合わせることは依然として困難である。複数の目的にまたがるユーザの嗜好を推定するためにバイナリフィードバックを用いた能動的嗜好学習フレームワークを提案する。モデル応答をパーソナライズする上で,言語生成タスクに関する理論的解析と実験を行い,そのフィードバック効率と有効性を示す。
論文参考訳（メタデータ） (2024-11-01T11:49:33Z)
Aligning LLMs with Individual Preferences via Interaction [51.72200436159636]
調整可能な大きな言語モデル(LLM)をトレーニングします。木構造における3K以上の多ターン会話を含む多ターン嗜好データセットを開発した。評価のために、慎重に選択された100のサンプルと、会話中にカスタマイズされたアライメント性能を測定するために適切に設計されたメトリクスからなるALOEベンチマークを確立する。
論文参考訳（メタデータ） (2024-10-04T17:48:29Z)
Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文参考訳（メタデータ） (2024-08-07T16:35:10Z)
MemoCRS: Memory-enhanced Sequential Conversational Recommender Systems with Large Language Models [51.65439315425421]
大規模言語モデルを用いたメモリ拡張型会話レコメンダシステムフレームワーク(MemoCRS)を提案する。ユーザ固有のメモリは、パーソナライズされた関心事のために各ユーザに合わせて調整される。共同知識と推論ガイドラインをカプセル化した一般的な記憶は、ユーザに共有知識を提供することができる。
論文参考訳（メタデータ） (2024-07-06T04:57:25Z)
Doing Personal LAPS: LLM-Augmented Dialogue Construction for Personalized Multi-Session Conversational Search [9.243535345193711]
提案手法は,大規模言語モデルを用いて,個人化された対話を生成するために,一人の人間労働者を誘導する。 LAPSは大規模、人書き、マルチセッション、マルチドメインの会話を収集できる。その結果,抽出された嗜好を用いて明示的に生成した応答は,ユーザの実際の嗜好と一致していることがわかった。
論文参考訳（メタデータ） (2024-05-06T13:53:03Z)
Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data Refinement [79.2400720115588]
本稿では,タスクコンテキスト間の一般化を改善するための階層的な構築プロセスからなる,シンプルで効果的なフレームワークであるPersona-DBを紹介する。応答予測の評価において,Persona-DB は精度を著しく低減した検索サイズで維持する上で,より優れたコンテキスト効率を示す。我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで10%以上の顕著な改善が示されていることも示している。
論文参考訳（メタデータ） (2024-02-16T20:20:43Z)
Sample Efficient Preference Alignment in LLMs via Active Exploration [63.84454768573154]
良い政策を最も効率的に特定するために、人間のフィードバックを得るコンテキストをしばしば選択できるという事実を活用します。本稿では,データを効率的に選択する能動的探索アルゴリズムを提案する。提案手法は,複数の言語モデルと4つの実世界のデータセットに対する人間の嗜好の限られたサンプルを用いて,ベースラインよりも優れる。
論文参考訳（メタデータ） (2023-12-01T00:54:02Z)
Integrating Summarization and Retrieval for Enhanced Personalization via Large Language Models [11.950478880423733]
パーソナライゼーションは自然言語処理(NLP)システムにおけるユーザエクスペリエンスにおいて重要な要素である。 LLM(Large Language Models)の出現によって、重要な疑問は、これらのモデルを使ってユーザエクスペリエンスをよりパーソナライズする方法である。 LLMが生成するタスク対応ユーザ要約を用いた,新しい要約型パーソナライゼーションを提案する。
論文参考訳（メタデータ） (2023-10-30T23:40:41Z)
Everyone's Preference Changes Differently: Weighted Multi-Interest Retrieval Model [18.109035867113217]
MIPモデル(Multi-Interest Preference)は、ユーザのシーケンシャルエンゲージメントをより効果的に利用することで、ユーザにとってマルチエンゲージメントを生み出すアプローチである。本手法の有効性を実証するため,様々な産業規模のデータセットを用いて大規模な実験を行った。
論文参考訳（メタデータ） (2022-07-14T04:29:54Z)
Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文参考訳（メタデータ） (2020-05-18T11:29:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。