論文の概要: GRAG: Generic Response-Augmented Generation Framework for Personalized Conversational Systems
- arxiv url: http://arxiv.org/abs/2606.21097v1
- Date: Fri, 19 Jun 2026 04:56:08 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:23:40.009633
- Title: GRAG: Generic Response-Augmented Generation Framework for Personalized Conversational Systems
- Title(参考訳): GRAG:パーソナライズされた会話システムのためのジェネリック応答強化生成フレームワーク
- Authors: Junfeng Liu, Christopher T. Symons, Ranga Raju Vatsavai,
- Abstract要約: 現在のトレーニングパラダイムは、パーソナライズと接地を単一のモノリシックな学習問題として扱う。
本稿では,これらの競合する目的を分離するGAAG(Generic Response-Augmented Generation)フレームワークを提案する。
GRAGは補助的な足場を使用しない最先端の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 1.973963382480151
- License:
- Abstract: Deploying highly capable personalized conversational agents in resource-constrained or privacy-sensitive environments remains a significant challenge. We identify a fundamental bottleneck in the existing approaches: current training paradigms treat personalization and grounding as a single monolithic learning problem. Under these paradigms, language models are forced to simultaneously address what to say (content grounding) and how to say it in a user-specific way (personalization), which introduces significant computational and optimization challenges. Consequently, contextual grounding is often sacrificed for persona adherence, or vice versa, resulting in responses that are either weakly grounded in the conversational history or insufficiently personalized. In this work, we propose the Generic Response-Augmented Generation (GRAG) framework that decouples these competing objectives by leveraging offline, generic responses from high-capacity, general-purpose LLMs as a semantic and structural scaffold to guide the fine-tuning of smaller, task-specialized models seamlessly in resource-limited environments. By decoupling the content grounding from personalization, GRAG allows the model to focus exclusively on persona injection while remaining firmly anchored to the conversational context. We instantiate the GRAG in two post- and pre-fusion-based architectural variants and evaluate them on multiple benchmark conversational datasets that cover diverse personalization structures. Our results demonstrate that GRAG significantly outperforms state-of-the-art methods that do not use auxiliary scaffolding, yielding up to 47% improvements in ROUGE-2 and 36% in BLEU scores. Ultimately, GRAG offers a generalizable blueprint for building grounding-aware personalized conversational systems in resource-limited environments.
- Abstract(参考訳): リソース制約やプライバシに敏感な環境で、高度な能力を持つ対話エージェントをデプロイすることは、依然として大きな課題である。
現在のトレーニングパラダイムは、パーソナライズとグラウンドを単一のモノリシックな学習問題として扱います。
これらのパラダイムの下では、言語モデルは、何を言うべきか(コンテンツ基盤)と、それをどのように言うか(個人化)を同時に解決せざるを得ない。
その結果、文脈的接地は、しばしばペルソナの固執のために犠牲にされ、結果として会話の歴史に弱く根ざされたり、パーソナライズが不十分であったりする。
本研究では,高容量,汎用LLMを意味的,構造的な足場として活用することで,リソース制限環境下でのより小さなタスク特化モデルの微調整をシームレスに導くことによって,これらの競合する目的を分離するGAAG(Generic Response-Augmented Generation)フレームワークを提案する。
パーソナライゼーションから根底にあるコンテンツを分離することで、GRAGはモデルが会話のコンテキストにしっかりと固定されている間、ペルソナ注入のみに集中できるようにする。
我々は、GRAGを2つのポストフュージョンおよびプレフュージョンベースのアーキテクチャ変種でインスタンス化し、様々なパーソナライズ構造をカバーする複数のベンチマーク会話データセットで評価する。
以上の結果から,GRAGは補助足場を使用せず,ROUGE-2が47%,BLEUスコアが36%向上した。
最終的にGRAGは、リソース制限された環境で、接地を意識したパーソナライズされた対話システムを構築するための、一般化可能な青写真を提供する。
関連論文リスト
- OmniGF: A Dual-Branch Vision-Language Framework for Unified Gaze Following [59.53720386342017]
拡張性のある多対人視線推論に基礎的な視覚言語モデルを適用する統合視覚言語フレームワークを提案する。
すべての個人をモデル化することにより、OmniGFは正確な空間的視線目標推定、意味的視線予測、複雑な社会的視線推定をシームレスに統合する。
論文 参考訳(メタデータ) (2026-05-26T00:08:06Z) - Sparse Personalized Text Generation with Multi-Trajectory Reasoning [95.19317487799292]
PAT(Personalization with Aligned Trajectories)は、コールドスタートLDMパーソナライズのための推論フレームワークである。
まず、スタイリスティックに類似したユーザからの書き込みスタイルの手がかりと、嗜好に沿ったユーザからのトピック固有のコンテキストの2つの相補的なトラジェクトリに沿って情報を取得する。
次に、強化学習に基づく反復的な二重共振機構を用い、LLMはこれらの信号を共同で洗練し統合することができる。
論文 参考訳(メタデータ) (2026-04-27T20:58:49Z) - Generation-Augmented Generation: A Plug-and-Play Framework for Private Knowledge Injection in Large Language Models [48.65910216527897]
GAG(Generation-Augmented Generation)は、プライベートな専門知識を専門的なモダリティとして扱い、コンパクトな表現レベルインターフェースを通じてそれを注入する。
GAGは2つのベンチマークで強力なRAGベースラインよりも15.34%、14.86%の専門性能を向上した。
論文 参考訳(メタデータ) (2026-01-13T04:23:36Z) - Personalized Vision via Visual In-Context Learning [62.85784251383279]
パーソナライズされた視覚のためのビジュアル・イン・コンテキスト・ラーニング・フレームワークを提案する。
PICOは基盤となる変換を推測し、再トレーニングせずに新しい入力に適用する。
また,効率的な推論スケーリングによる信頼性向上を目的とした注意誘導型シードスコアラを提案する。
論文 参考訳(メタデータ) (2025-09-29T17:58:45Z) - Ground-Compose-Reinforce: Grounding Language in Agentic Behaviours using Limited Data [17.614395125762304]
認識と行動における接地言語は、人間や他のエージェントと対話できる位置にあるエージェントを構築する上で、言語を介して重要な課題である。
高レベルタスク仕様から直接RLエージェントを訓練するためのエンドツーエンドのニューロシンボリックフレームワークであるGround-Compose-Reinforceを提案する。
論文 参考訳(メタデータ) (2025-07-14T19:05:15Z) - ReGraP-LLaVA: Reasoning enabled Graph-based Personalized Large Language and Vision Assistant [16.253265097323432]
我々は120種類のパーソナライズされた知識からなるReGraPという新しいデータセットを提案する。
本稿では、対応するKGとCoT QAペアでトレーニングされたMLLMであるReGraP-LLaVAを提案する。
結果から,提案モデルはパーソナライズされた知識を学習するだけでなく,応答における関係推論も行うことがわかった。
論文 参考訳(メタデータ) (2025-05-06T16:00:13Z) - A Stack-Propagation Framework for Low-Resource Personalized Dialogue Generation [29.348053519918928]
対話生成および理解パイプラインを学習するための新しいスタックプロパゲーションフレームワークを提案する。
提案するフレームワークは、より小さなパーソナライズされた対話データから学ぶための、スタック化されたエンコーダとデコーダの恩恵を受けることができる。
論文 参考訳(メタデータ) (2024-10-26T13:09:21Z) - Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T21:44:11Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。