論文の概要: AgenticAI-DialogGen: Topic-Guided Conversation Generation for Fine-Tuning and Evaluating Short- and Long-Term Memories of LLMs
- arxiv url: http://arxiv.org/abs/2604.12179v1
- Date: Tue, 14 Apr 2026 01:17:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.184194
- Title: AgenticAI-DialogGen: Topic-Guided Conversation Generation for Fine-Tuning and Evaluating Short- and Long-Term Memories of LLMs
- Title(参考訳): AgenticAI-DialogGen:Topic-Guided Conversation Generation for Fine-Tuning and Evaluating Short-Term Memories of LLMs
- Authors: Manoj Madushanka Perera, Adnan Mahmood, Kasun Eranda Wijethilake, Quan Z. Sheng,
- Abstract要約: AgenticAI-DialogGenは、人間の監督なしにペルソナとトピックの誘導された会話を生成する。
TopicGuidedChat(TGC)と名付けられた新しいデータセットは、長期記憶を話者固有の知識グラフとして、短期記憶を新たに生成されたトピック誘導会話としてエンコードする。
- 参考スコア(独自算出の注目度): 10.842219538943356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in Large Language Models (LLMs) have improved their ability to process extended conversational contexts, yet fine-tuning and evaluating short- and long-term memories remain difficult due to the absence of datasets that encode both short- and long-term conversational history. Existing conversational datasets lack memory grounding, overlook topic continuity, or rely on costly human annotation. To address these gaps, we introduce AgenticAI-DialogGen, a modular agent-based framework that generates persona-grounded and topic-guided conversations without human supervision. The framework uses LLM agents to extract knowledge graphs, identify topics, build speaker personas, and simulate topic-guided conversations from unstructured conversations. A QA module generates memory-grounded Question Answer (QA) pairs drawn from short- and long-term conversational histories. We also generated a new dataset entitled, TopicGuidedChat (TGC), where long-term memory is encoded as speaker-specific knowledge graphs and short-term memory as newly generated topic-guided conversations. Evaluations depict that AgenticAI-DialogGen yields higher conversational quality and LLMs fine-tuned on TGC dataset achieve improved performance on memory-grounded QA tasks.
- Abstract(参考訳): 近年のLLM(Large Language Models)の進歩により,会話コンテキストの拡張処理能力は向上しているが,短期・長期の会話履歴を符号化するデータセットが存在しないため,微調整や短期記憶の評価は困難である。
既存の会話データセットには、メモリグラウンディング、トピックの連続性を見落とし、コストのかかる人的アノテーションに依存していない。
このようなギャップに対処するために,AgenicAI-DialogGenというモジュール型エージェントベースのフレームワークを紹介した。
このフレームワークはLLMエージェントを使用して知識グラフを抽出し、トピックを特定し、話者ペルソナを構築し、非構造化会話からトピック誘導会話をシミュレートする。
QAモジュールは、短期および長期の会話履歴から引き出されたメモリグラウンドの質問回答(QA)ペアを生成する。
また、TGC(TopicGuidedChat)という新しいデータセットも生成し、長期記憶は話者固有の知識グラフとしてエンコードされ、短期記憶は新たに生成されたトピック誘導会話として符号化される。
AgenticAI-DialogGenは会話品質が高く、TLCデータセットに微調整されたLLMは、メモリグラウンドのQAタスクのパフォーマンスを向上させる。
関連論文リスト
- MMAG: Mixed Memory-Augmented Generation for Large Language Models Applications [0.0]
大きな言語モデル(LLM)は、単一のプロンプト内でコヒーレントなテキストを生成するのに優れるが、関連性、パーソナライゼーション、拡張された相互作用間の連続性を維持するには不十分である。
本稿では, LLM エージェントのメモリを 5 つの相互作用層に整理する MMAG パターンを提案する。
我々は,Heeroの会話エージェントの実装を通じて,そのアプローチを実証する。
論文 参考訳(メタデータ) (2025-12-01T14:16:57Z) - SGMem: Sentence Graph Memory for Long-Term Conversational Agents [14.89396085814917]
チャンク単位内の文レベルグラフとして対話を表現するSGMem(Sentence Graph Memory)を紹介する。
SGMem は, 長期会話型質問応答において, 精度を向上し, 高いベースラインを向上することを示す。
論文 参考訳(メタデータ) (2025-09-25T14:21:44Z) - Interpersonal Memory Matters: A New Task for Proactive Dialogue Utilizing Conversational History [13.389395397698035]
メモリ・アウェア・プロアクティブ・ダイアログ(MapDia)という新しいタスクを導入する。
そのタスクにより、自動データ構築法を提案し、中国初のメモリ対応プロアクティブデータセット(ChMapData)を作成する。
さらに、トピック要約、トピック検索、アクティブなトピックシフト検出と生成の3つのモジュールを特徴とする、検索用拡張生成(RAG)に基づくジョイントフレームワークを導入する。
論文 参考訳(メタデータ) (2025-03-07T05:19:17Z) - Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。
イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。
LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文 参考訳(メタデータ) (2024-06-09T21:58:32Z) - Evaluating Very Long-Term Conversational Memory of LLM Agents [95.84027826745609]
我々は,高品質で長期的な対話を生成するための,マシン・ヒューマン・パイプラインを導入する。
我々は、各エージェントに画像の共有と反応の能力を持たせる。
生成した会話は、長距離一貫性のために人間のアノテーションによって検証され、編集される。
論文 参考訳(メタデータ) (2024-02-27T18:42:31Z) - Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models [30.48902594738911]
長い会話をすると、大きな言語モデル(LLM)は過去の情報を思い出さず、一貫性のない応答を生成する傾向がある。
本稿では,長期記憶能力を高めるために,大規模言語モデル(LLM)を用いて要約/メモリを生成することを提案する。
論文 参考訳(メタデータ) (2023-08-29T04:59:53Z) - History-Aware Hierarchical Transformer for Multi-session Open-domain
Dialogue System [59.78425104243993]
マルチセッションオープンドメイン対話のための履歴認識階層変換器(HAHT)を提案する。
HAHTは歴史会話の長期記憶を維持し、歴史情報を利用して現在の会話状況を理解する。
大規模マルチセッション会話データセットの実験結果は,提案したHAHTモデルがベースラインモデルより一貫して優れていることを示唆している。
論文 参考訳(メタデータ) (2023-02-02T06:54:33Z) - A Neural Conversation Generation Model via Equivalent Shared Memory
Investigation [39.922967513749654]
DRMN(Deep Reading Memory Network)と呼ばれる新しい読み書き・記憶フレームワークを提案する。
DRMNは、発話生成を改善するために、類似した会話の有用な情報を記憶することができる。
弊社のモデルは、正義とeコマースの2つの大規模な会話データセットに適用する。
論文 参考訳(メタデータ) (2021-08-20T13:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。