論文の概要: Using Natural Language Inference to Improve Persona Extraction from
Dialogue in a New Domain
- arxiv url: http://arxiv.org/abs/2401.06742v1
- Date: Fri, 12 Jan 2024 18:25:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 18:31:55.857387
- Title: Using Natural Language Inference to Improve Persona Extraction from
Dialogue in a New Domain
- Title(参考訳): 新しいドメインにおける対話から人格抽出を改善する自然言語推論
- Authors: Alexandra DeLucia, Mengjie Zhao, Yoshinori Maeda, Makoto Yoda, Keiichi
Yamada, Hiromi Wakaki
- Abstract要約: 訓練されたペルソナ抽出モデルを新しい環境に適応させる自然言語推論手法を提案する。
提案手法は高品質な抽出ペルソナを返却し,人間のアノテーションを少なくする。
- 参考スコア(独自算出の注目度): 44.05974724495336
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While valuable datasets such as PersonaChat provide a foundation for training
persona-grounded dialogue agents, they lack diversity in conversational and
narrative settings, primarily existing in the "real" world. To develop dialogue
agents with unique personas, models are trained to converse given a specific
persona, but hand-crafting these persona can be time-consuming, thus methods
exist to automatically extract persona information from existing
character-specific dialogue. However, these persona-extraction models are also
trained on datasets derived from PersonaChat and struggle to provide
high-quality persona information from conversational settings that do not take
place in the real world, such as the fantasy-focused dataset, LIGHT. Creating
new data to train models on a specific setting is human-intensive, thus
prohibitively expensive. To address both these issues, we introduce a natural
language inference method for post-hoc adapting a trained persona extraction
model to a new setting. We draw inspiration from the literature of dialog
natural language inference (NLI), and devise NLI-reranking methods to extract
structured persona information from dialogue. Compared to existing persona
extraction models, our method returns higher-quality extracted persona and
requires less human annotation.
- Abstract(参考訳): PersonaChatのような貴重なデータセットは、ペルソナ・グラウンドの対話エージェントを訓練するための基盤を提供するが、会話や物語の設定の多様性は欠いている。
固有なパーソナラを持つ対話エージェントを開発するために、モデルは特定のパーソナラと会話するように訓練されるが、これらのパーソナラを手作りすることは時間を要するため、既存のキャラクター特有の対話からパーソナ情報を自動抽出する方法が存在する。
しかし、これらのペルソナ抽出モデルは、PersonaChatから派生したデータセットに基づいて訓練され、ファンタジー中心のデータセットであるLIGHTのような現実世界では起こらない会話設定から高品質なペルソナ情報を提供するのに苦労している。
特定の環境でモデルをトレーニングするための新しいデータを作ることは、人間に重きを置いている。
これら2つの課題に対処するために,訓練されたペルソナ抽出モデルを新たな環境に適応するための自然言語推論手法を提案する。
我々は、対話自然言語推論(NLI)の文献からインスピレーションを得て、対話から構造化されたペルソナ情報を抽出するNLI格付け手法を考案した。
既存のペルソナ抽出モデルと比較して,本手法は高品質なペルソナを出力し,人間のアノテーションを少なくする。
関連論文リスト
- PersonalityChat: Conversation Distillation for Personalized Dialog
Modeling with Facts and Traits [5.447308344436046]
PersonalityChatは、人気のPersonaChatデータセットに基づいた合成会話データセットである。
生成対話モデルの特質に基づくパーソナライズには,性格特性ラベルが有効であることを示す。
論文 参考訳(メタデータ) (2024-01-14T20:35:33Z) - Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.28340832822234]
実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:02:50Z) - Enhancing Personalized Dialogue Generation with Contrastive Latent
Variables: Combining Sparse and Dense Persona [16.90863217077699]
既存のパーソナライズされた対話エージェントは、スパースまたは密集したペルソナ記述と対話履歴という3つのリソースからペルソナプロファイルをモデル化する。
3つのリソースの利点を組み合わせて、より豊かで正確なペルソナを得る。
中国語と英語のデータセットに対する実験結果は、パーソナライゼーションにおけるモデルの優位性を示している。
論文 参考訳(メタデータ) (2023-05-19T07:24:27Z) - A Model-Agnostic Data Manipulation Method for Persona-based Dialogue
Generation [107.82729587882397]
現在のペルソナベースの対話データセットのスケールアップには費用がかかる。
このタスクの各データサンプルは、従来の対話データよりも複雑である。
本稿では,ペルソナをベースとした対話生成モデルにおいて,モデルに依存しないデータ操作手法を提案する。
論文 参考訳(メタデータ) (2022-04-21T03:49:54Z) - Less is More: Learning to Refine Dialogue History for Personalized
Dialogue Generation [57.73547958927826]
我々は,対話履歴をより多く処理し,より正確なペルソナ情報を得ることのできる,ユーザ対話履歴を大規模に洗練することを提案する。
具体的には、3つの個人情報精算器とパーソナライズされた応答生成器で構成されるMSPモデルを設計する。
論文 参考訳(メタデータ) (2022-04-18T02:02:56Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Learning to Predict Persona Information forDialogue Personalization
without Explicit Persona Description [10.17868476063421]
対話エージェントをパーソナライズするために,対話履歴に基づいてペルソナ情報を予測する方法を提案する。
PersonaChatデータセットの実験結果から,提案手法は生成した応答の一貫性を向上させることができることがわかった。
トレーニングされたペルソナ予測モデルは、他のデータセットにうまく転送することができ、より関連するレスポンスを生成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-30T03:19:24Z) - Unsupervised Enrichment of Persona-grounded Dialog with Background
Stories [27.52543925693796]
既存の物語データセットの架空の物語を活用することにより、対話モデルにペルソナに関連する「背景物語」を付与する。
我々は、勾配に基づく書き直し手法を用いて対話応答を生成するために、検索されたストーリーの教師なし適応を行う。
提案手法は, より多様な応答を生成でき, 人間の評価者により, より活発で人間らしく評価されている。
論文 参考訳(メタデータ) (2021-06-15T18:20:27Z) - Like hiking? You probably enjoy nature: Persona-grounded Dialog with
Commonsense Expansions [37.15893335147598]
既存のペルソナ基底ダイアログモデルは、与えられたペルソナ記述の単純な意味を捉えることができないことが多い。
本稿では,既存のコモンセンス知識ベースと言い換え資源を用いて,利用可能なペルソナ文を拡張することを提案する。
また,モデルにペルソナ文を個別に選択するように促すことにより,ペルソナのきめ細かいグラウンドも導入する。
論文 参考訳(メタデータ) (2020-10-07T06:25:39Z) - XPersona: Evaluating Multilingual Personalized Chatbot [76.00426517401894]
我々はペルソナ・チャットの多言語拡張(XPersona)を提案する。
我々のデータセットには、多言語パーソナライズされたエージェントの構築と評価のための英語以外の6言語でのペルソナ会話が含まれています。
論文 参考訳(メタデータ) (2020-03-17T07:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。