論文の概要: Quantifying the Effects of Prosody Modulation on User Engagement and
Satisfaction in Conversational Systems
- arxiv url: http://arxiv.org/abs/2006.01916v1
- Date: Tue, 2 Jun 2020 19:53:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 23:55:30.829532
- Title: Quantifying the Effects of Prosody Modulation on User Engagement and
Satisfaction in Conversational Systems
- Title(参考訳): 会話システムのユーザエンゲージメントと満足度に及ぼす韻律変調の影響の定量化
- Authors: Jason Ingyu Choi, Eugene Agichtein
- Abstract要約: ユーザの行動とエンゲージメントに対する韻律変調の効果を計測する大規模実証研究の結果を報告する。
以上の結果から,韻律変調はユーザの即時満足度と全体的な満足度の両方を著しく向上させることが示唆された。
本研究は,会話システムにおける応答の自然性を改善するための有用なツールと洞察を提供する。
- 参考スコア(独自算出の注目度): 10.102799140277932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As voice-based assistants such as Alexa, Siri, and Google Assistant become
ubiquitous, users increasingly expect to maintain natural and informative
conversations with such systems. However, for an open-domain conversational
system to be coherent and engaging, it must be able to maintain the user's
interest for extended periods, without sounding boring or annoying. In this
paper, we investigate one natural approach to this problem, of modulating
response prosody, i.e., changing the pitch and cadence of the response to
indicate delight, sadness or other common emotions, as well as using
pre-recorded interjections. Intuitively, this approach should improve the
naturalness of the conversation, but attempts to quantify the effects of
prosodic modulation on user satisfaction and engagement remain challenging. To
accomplish this, we report results obtained from a large-scale empirical study
that measures the effects of prosodic modulation on user behavior and
engagement across multiple conversation domains, both immediately after each
turn, and at the overall conversation level. Our results indicate that the
prosody modulation significantly increases both immediate and overall user
satisfaction. However, since the effects vary across different domains, we
verify that prosody modulations do not substitute for coherent, informative
content of the responses. Together, our results provide useful tools and
insights for improving the naturalness of responses in conversational systems.
- Abstract(参考訳): Alexa、Siri、Google Assistantといった音声アシスタントがユビキタスになると、ユーザーはそうしたシステムとの自然な、情報的な会話を維持することをますます期待している。
しかし、オープンドメインの会話システムが一貫性とエンゲージメントを持つためには、退屈感や迷惑感を伴わずに、長期にわたってユーザの関心を維持できなければならない。
本稿では,この課題に対する自然なアプローチとして,反応の韻律を変調すること,すなわち,喜び,悲しみ,その他の一般的な感情を示す応答のピッチとリズムを変化させること,および事前記録された間投詞を用いることについて検討する。
直感的には、このアプローチは会話の自然性を改善するべきであるが、韻律変調がユーザの満足度やエンゲージメントに与える影響を定量化しようとする試みは依然として困難である。
そこで本研究では,複数の会話領域における韻律変調がユーザの行動およびエンゲージメントに与える影響を,各ターンの直後および会話全体のレベルで測定した大規模実験結果について報告する。
以上の結果から,韻律変調はユーザ満足度とユーザ満足度の両方を著しく向上させることが示唆された。
しかし,効果はドメインによって異なるため,韻律変調が応答のコヒーレントな情報的内容に代わらないことが確認された。
対話型システムにおける応答の自然性を改善するための有用なツールと洞察を提供する。
関連論文リスト
- Unveiling the Impact of Multi-Modal Interactions on User Engagement: A Comprehensive Evaluation in AI-driven Conversations [17.409790984399052]
本稿では,画像と音声をテキストと併用したマルチモーダルインタラクションがユーザエンゲージメントに与える影響について検討する。
本研究は,テキストのみの対話に比べて,マルチモーダルインタラクションによるユーザエンゲージメントが著しく向上していることを明らかにする。
その結果,マルチモーダルインタラクションは認知処理を最適化し,より豊かな情報理解を促進することが示唆された。
論文 参考訳(メタデータ) (2024-06-21T09:26:55Z) - Emotional Listener Portrait: Realistic Listener Motion Simulation in
Conversation [50.35367785674921]
リスナーヘッドジェネレーションは、話者から提供される情報を参照して、リスナーの非言語行動を生成することに集中する。
このような反応を生成する上で重要な課題は、会話中のきめ細かい表情の非決定論的性質である。
本稿では,複数の個別な動きコーパスの合成として,各顔の動きを微粒化処理する情緒的リスナー・ポートレート(ELP)を提案する。
ELPモデルは,学習分布からのサンプリングにより,与えられた話者に対する自然な,多様な応答を自動的に生成するだけでなく,所定の姿勢で制御可能な応答を生成することができる。
論文 参考訳(メタデータ) (2023-09-29T18:18:32Z) - Improving Empathetic Dialogue Generation by Dynamically Infusing
Commonsense Knowledge [39.536604198392375]
共感的な会話では、個人は他人に対する共感を表現する。
これまでの研究は主に、話者の感情を利用して共感的な反応を生み出すことに焦点を当ててきた。
本稿では,コモンセンス知識選択のための適応モジュールを組み込んだ共感応答生成手法を提案する。
論文 参考訳(メタデータ) (2023-05-24T10:25:12Z) - Feedback Effect in User Interaction with Intelligent Assistants: Delayed
Engagement, Adaption and Drop-out [9.205174767678365]
本稿では,IA-ユーザインタラクションにおける新たなコンポーネントであるフィードバック効果の同定と定量化を行う。
IAからの不快な反応は、ユーザがその後の対話を遅らせたり遅らせる原因となることを示す。
ユーザがIAの理解と機能能力の限界を発見すると、ユーザは要求のスコープとワードの調整を学ぶ。
論文 参考訳(メタデータ) (2023-03-17T21:39:33Z) - Turn-Taking Prediction for Natural Conversational Speech [40.189938418201656]
一般的な会話的発話は、ターンテイクを伴う複数のクエリを含むことが多い。
障害としては、思考の一時停止、ためらうこと、単語の延長、ポーズの充満、繰り返し句などがある。
本稿では,エンド・ツー・エンド(E2E)音声認識器上に構築されたターンテイク予測器を提案する。
論文 参考訳(メタデータ) (2022-08-29T01:09:23Z) - Understanding How People Rate Their Conversations [73.17730062864314]
我々は、人々が会話エージェントとのインタラクションをどのように評価するかをよりよく理解するために研究を行う。
我々は、評価の変動を説明する変数として、同意性と外向性に焦点を当てる。
論文 参考訳(メタデータ) (2022-06-01T00:45:32Z) - Interacting with Non-Cooperative User: A New Paradigm for Proactive
Dialogue Policy [83.61404191470126]
インタラクティブな環境下でプロアクティブなポリシーを学習できるI-Proという新しいソリューションを提案する。
具体的には,4つの要因からなる学習目標重みを通じてトレードオフを学習する。
実験の結果,I-Proは,有効性と解釈性において,ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-04-07T14:11:31Z) - Towards Robust Online Dialogue Response Generation [62.99904593650087]
これは、トレーニングと実世界のテストの相違によって引き起こされる可能性がある、と私たちは主張する。
本稿では, 発話レベルサンプリングと半発話レベルサンプリングの両方からなる階層的サンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T06:51:41Z) - Dehumanizing Voice Technology: Phonetic & Experiential Consequences of
Restricted Human-Machine Interaction [0.0]
我々は、要求が音声の収束と低音声の遅延を増大させ、最終的には消費者にとってより自然なタスク体験をもたらすことを示す。
スマートオブジェクトとの対話を開始するために必要な入力を変更することは、消費者の主観的経験と人間の声の客観的な音声的変化の両方において、体系的な変化を引き起こす証拠を提供する。
論文 参考訳(メタデータ) (2021-11-02T22:49:25Z) - Improving Factual Consistency Between a Response and Persona Facts [64.30785349238619]
応答生成のためのニューラルネットワークは、意味論的に妥当であるが、必ずしも話者のペルソナを記述する事実と矛盾しない応答を生成する。
我々は,これらのモデルを強化学習により微調整し,応答とペルソナ事実の一貫性と意味的妥当性を明確に把握する効率的な報酬関数を提案する。
論文 参考訳(メタデータ) (2020-04-30T18:08:22Z) - You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。
そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文 参考訳(メタデータ) (2020-04-11T12:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。