論文の概要: Learning from My Friends: Few-Shot Personalized Conversation Systems via
Social Networks
- arxiv url: http://arxiv.org/abs/2105.10323v1
- Date: Fri, 21 May 2021 12:54:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 07:18:30.724073
- Title: Learning from My Friends: Few-Shot Personalized Conversation Systems via
Social Networks
- Title(参考訳): 私の友人から学ぶ:ソーシャルネットワークによる対人会話システム
- Authors: Zhiliang Tian, Wei Bi, Zihan Zhang, Dongkyu Lee, Yiping Song, Nevin L.
Zhang
- Abstract要約: 本稿では,ソーシャル・ネットワークを補助するパーソナライズされた会話タスクを提案する。
このタスクは、話者とソーシャルネットワークからの会話が数回ある場合、話者に対してパーソナライズされた応答を生成するモデルを必要とする。
資源が少ない新参者のために,新しい話者に適応することを学ぶパーソナライズされた会話モデル(PCM)を提案する。
- 参考スコア(独自算出の注目度): 31.119345249907504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personalized conversation models (PCMs) generate responses according to
speaker preferences. Existing personalized conversation tasks typically require
models to extract speaker preferences from user descriptions or their
conversation histories, which are scarce for newcomers and inactive users. In
this paper, we propose a few-shot personalized conversation task with an
auxiliary social network. The task requires models to generate personalized
responses for a speaker given a few conversations from the speaker and a social
network. Existing methods are mainly designed to incorporate descriptions or
conversation histories. Those methods can hardly model speakers with so few
conversations or connections between speakers. To better cater for newcomers
with few resources, we propose a personalized conversation model (PCM) that
learns to adapt to new speakers as well as enabling new speakers to learn from
resource-rich speakers. Particularly, based on a meta-learning based PCM, we
propose a task aggregator (TA) to collect other speakers' information from the
social network. The TA provides prior knowledge of the new speaker in its
meta-learning. Experimental results show our methods outperform all baselines
in appropriateness, diversity, and consistency with speakers.
- Abstract(参考訳): パーソナライズされた会話モデル(PCM)は、話者の好みに応じて応答を生成する。
既存のパーソナライズされた会話タスクは、通常、ユーザ記述や会話履歴から話者の好みを抽出するモデルを必要とする。
本稿では,補助的なソーシャルネットワークを用いた対話タスクを提案する。
このタスクは、話者とソーシャルネットワークからの会話が数回ある場合、話者に対してパーソナライズされた応答を生成するモデルを必要とする。
既存の手法は主に説明や会話の履歴を組み込むように設計されている。
これらの手法は、話者間の会話や接続がほとんどないスピーカーをモデル化することができない。
資源が少ない新参者のために,新たな話者に適応し,資源豊富な話者から新たな話者を学べるパーソナライズされた会話モデル(PCM)を提案する。
特にメタラーニングに基づくPCMに基づいて,他の話者の情報をソーシャルネットワークから収集するタスクアグリゲータ(TA)を提案する。
TAはメタラーニングにおける新しい話者の事前知識を提供する。
実験の結果,提案手法は話者との適合性,多様性,整合性において,すべての基準線より優れていた。
関連論文リスト
- Speaker Verification in Agent-Generated Conversations [47.6291644653831]
近年の大型言語モデル (LLM) の成功は、様々な話者の特徴やスタイルに合わせたロールプレイング・会話エージェントを開発し、汎用的・特殊な対話タスクを遂行する能力を高めるために広く関心を集めている。
本研究では,2つの発話が同一話者から発せられるかどうかを検証することを目的とした,エージェント生成会話における話者検証という,新たな評価課題を紹介する。
論文 参考訳(メタデータ) (2024-05-16T14:46:18Z) - PromptTTS++: Controlling Speaker Identity in Prompt-Based Text-to-Speech
Using Natural Language Descriptions [21.15647416266187]
本稿では,自然言語記述を用いた話者識別制御が可能な音声合成システムPromptTTS++を提案する。
本稿では,話し方とほぼ独立に設計された音声特性を記述した話者プロンプトの概念を紹介する。
主観評価の結果,提案手法は話者プロンプトを使わずに話者特性を制御できることがわかった。
論文 参考訳(メタデータ) (2023-09-15T04:11:37Z) - Exploring Speaker-Related Information in Spoken Language Understanding
for Better Speaker Diarization [7.673971221635779]
多人数会議におけるセマンティックコンテンツから話者関連情報を抽出する手法を提案する。
AISHELL-4とAliMeetingの2つのデータセットを用いた実験により,本手法は音響のみの話者ダイアリゼーションシステムよりも一貫した改善を実現することが示された。
論文 参考訳(メタデータ) (2023-05-22T11:14:19Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Responsive Listening Head Generation: A Benchmark Dataset and Baseline [58.168958284290156]
本研究では、応答型リスニングヘッド生成タスクを、複数の入力に応答する動きと表現を持つ非言語ヘッドの合成として定義する。
音声によるジェスチャーや音声のヘッド生成とは違って,いくつかの研究分野の恩恵を期待して,このタスクにより多くのモーダルを導入する。
論文 参考訳(メタデータ) (2021-12-27T07:18:50Z) - Few-Shot Bot: Prompt-Based Learning for Dialogue Systems [58.27337673451943]
ごく少数の例を使って会話を学ぶことは、会話型AIにおける大きな課題である。
現在の最良の会話モデルは、良いチャットシャッター(例:BlenderBot)またはゴール指向システム(例:MinTL)である。
グラデーションベースの微調整を必要とせず、学習の唯一の源としていくつかの例を用いるプロンプトベースの数ショット学習を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:36:45Z) - Know Deeper: Knowledge-Conversation Cyclic Utilization Mechanism for
Open-domain Dialogue Generation [11.72386584395626]
エンドツーエンドのインテリジェントなニューラルダイアログシステムは、一貫性のない繰り返し応答を生成する問題に悩まされる。
既存の対話モデルは、対人関係の会話情報を対人情報の流れとして捉えた個人知識に組み込むことが、その後の会話の質を高めるという事実を無視しながら、対人関係の個人知識を一方的にダイアログに組み込むことに注意を払っている。
会話の一貫性を向上し、2つの折り畳みから繰り返しを緩和することを目的とした,会話適応型多視点対応対応型応答生成モデルを提案する。
論文 参考訳(メタデータ) (2021-07-16T08:59:06Z) - A Review of Speaker Diarization: Recent Advances with Deep Learning [78.20151731627958]
スピーカーダイアリゼーションは、スピーカーのアイデンティティに対応するクラスでオーディオまたはビデオ録画をラベル付けするタスクです。
ディープラーニング技術の台頭に伴い、話者ダイアリゼーションのためのさらなる急速な進歩がなされている。
話者ダイアリゼーションシステムが音声認識アプリケーションとどのように統合されているかについて議論する。
論文 参考訳(メタデータ) (2021-01-24T01:28:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。