論文の概要: Intelligent Conversational Android ERICA Applied to Attentive Listening
and Job Interview
- arxiv url: http://arxiv.org/abs/2105.00403v1
- Date: Sun, 2 May 2021 06:37:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 14:20:58.623399
- Title: Intelligent Conversational Android ERICA Applied to Attentive Listening
and Job Interview
- Title(参考訳): インテリジェントな会話型Android ERICAによる聞き取りと求人面接
- Authors: Tatsuya Kawahara, Koji Inoue, Divesh Lala
- Abstract要約: 我々はインテリジェントな会話型android ericaを開発した。
ERICAには,注意深い聞き取り,就職面接,スピードデートなど,いくつかのソーシャルインタラクションタスクを設定した。
40人の高齢者が会話を分解することなく5~7分間の会話を行ったことが評価されている。
- 参考スコア(独自算出の注目度): 41.789773897391605
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Following the success of spoken dialogue systems (SDS) in smartphone
assistants and smart speakers, a number of communicative robots are developed
and commercialized. Compared with the conventional SDSs designed as a
human-machine interface, interaction with robots is expected to be in a closer
manner to talking to a human because of the anthropomorphism and physical
presence. The goal or task of dialogue may not be information retrieval, but
the conversation itself. In order to realize human-level "long and deep"
conversation, we have developed an intelligent conversational android ERICA. We
set up several social interaction tasks for ERICA, including attentive
listening, job interview, and speed dating. To allow for spontaneous,
incremental multiple utterances, a robust turn-taking model is implemented
based on TRP (transition-relevance place) prediction, and a variety of
backchannels are generated based on time frame-wise prediction instead of
IPU-based prediction. We have realized an open-domain attentive listening
system with partial repeats and elaborating questions on focus words as well as
assessment responses. It has been evaluated with 40 senior people, engaged in
conversation of 5-7 minutes without a conversation breakdown. It was also
compared against the WOZ setting. We have also realized a job interview system
with a set of base questions followed by dynamic generation of elaborating
questions. It has also been evaluated with student subjects, showing promising
results.
- Abstract(参考訳): スマートフォンアシスタントとスマートスピーカーにおける音声対話システム(SDS)の成功に続いて、多数のコミュニケーションロボットが開発・商業化されている。
ヒューマンマシンインタフェースとして設計された従来のSDSと比較して,ロボットとのインタラクションは,人間同型性や身体的存在のため,人間と会話するよりは近いと考えられる。
対話の目的や課題は情報検索ではなく、会話そのものである。
人間レベルの「長く深い」会話を実現するために、我々はインテリジェントな会話型android ericaを開発した。
ERICAには,注意深い聞き取り,面接,スピードデートなど,いくつかのソーシャルインタラクションタスクを設定した。
自発的かつ漸進的な複数発話を可能にするため,RTP(transition-relevance place)予測に基づいて頑健なターンテイクモデルを実装し,IPUに基づく予測ではなく,時間フレームの予測に基づいて様々なバックチャネルを生成する。
我々は、部分的な繰り返しと焦点単語に対する質問と評価応答を併用したオープンドメイン注意聴取システムを実現した。
40人の高齢者が会話を分解することなく5~7分間の会話を行った。
また、WOZ設定と比較された。
また,基本的な質問のセットと,質問の動的生成を伴う面接システムも実現している。
学生でも評価され、有望な結果を示している。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Interactive Conversational Head Generation [68.76774230274076]
対面会話における1つのインターロケータの振る舞いを合成するための新しい対話ヘッド生成ベンチマークを提案する。
長時間・複数回会話に参加可能なインターロカクタを自動的に合成する機能は不可欠であり、様々なアプリケーションにメリットを提供する。
論文 参考訳(メタデータ) (2023-07-05T08:06:26Z) - Let's Get Personal: Personal Questions Improve SocialBot Performance in
the Alexa Prize [0.0]
音声対話コミュニティにおいて,対話型オープンドメイン対話システムの構築に焦点が当てられている。
従来の対話システムとは異なり、これらの対話システムは特定の情報やドメインの制限を前提とすることはできない。
我々は、Amazon Echoユーザーが大規模にアクセスし、評価する、堅牢なオープンドメイン会話システムであるAthenaを開発した。
論文 参考訳(メタデータ) (2023-03-09T00:10:29Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Responsive Listening Head Generation: A Benchmark Dataset and Baseline [58.168958284290156]
本研究では、応答型リスニングヘッド生成タスクを、複数の入力に応答する動きと表現を持つ非言語ヘッドの合成として定義する。
音声によるジェスチャーや音声のヘッド生成とは違って,いくつかの研究分野の恩恵を期待して,このタスクにより多くのモーダルを導入する。
論文 参考訳(メタデータ) (2021-12-27T07:18:50Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。