論文の概要: Tourist Guidance Robot Based on HyperCLOVA
- arxiv url: http://arxiv.org/abs/2210.10400v1
- Date: Wed, 19 Oct 2022 09:11:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 14:10:25.413877
- Title: Tourist Guidance Robot Based on HyperCLOVA
- Title(参考訳): HyperCLOVAを用いた観光案内ロボット
- Authors: Takato Yamazaki, Katsumasa Yoshikawa, Toshiki Kawamoto, Masaya Ohagi,
Tomoya Mizumoto, Shuta Ichimura, Yusuke Kida, Toshinori Sato
- Abstract要約: 本稿では,対話ロボットコンペティション2022に提出したシステムについて述べる。
提案システムはルールベースとジェネレータベースのダイアログシステムを組み合わせたシステムである。
- 参考スコア(独自算出の注目度): 3.9385029352159906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes our system submitted to Dialogue Robot Competition 2022.
Our proposed system is a combined model of rule-based and generation-based
dialog systems. The system utilizes HyperCLOVA, a Japanese foundation model,
not only to generate responses but also summarization, search information, etc.
We also used our original speech recognition system, which was fine-tuned for
this dialog task. As a result, our system ranked second in the preliminary
round and moved on to the finals.
- Abstract(参考訳): 本稿では,対話ロボットコンペティション2022に提案するシステムについて述べる。
提案システムはルールベースとジェネレータベースのダイアログシステムを組み合わせたシステムである。
本システムは,日本語基盤モデルであるHyperCLOVAを利用して応答を生成するだけでなく,要約や検索情報も生成する。
また,この対話処理に精通した音声認識システムについても検討した。
その結果,本システムは予選2位にランクインし,決勝に進出した。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Let's Go Real Talk: Spoken Dialogue Model for Face-to-Face Conversation [55.043492250775294]
本稿では,新しい対面音声対話モデルを提案する。
ユーザ入力から音声視覚音声を処理し、応答として音声視覚音声を生成する。
また,最初の大規模マルチモーダル音声対話コーパスであるMultiDialogを紹介する。
論文 参考訳(メタデータ) (2024-06-12T04:48:36Z) - Dialogue with Robots: Proposals for Broadening Participation and Research in the SLIVAR Community [57.56212633174706]
自然言語を使って機械と対話する能力は一般的なものになりつつあるが、期待されている。
本稿では,ロボットとの音声対話のこの成長分野の最近の歴史を詳述する。
私たちはコミュニティに3つの提案を提供しています。ひとつは教育、もうひとつはベンチマーク、もうひとつはロボットとの会話に関する言語モデリングです。
論文 参考訳(メタデータ) (2024-04-01T15:03:27Z) - Team Flow at DRC2023: Building Common Ground and Text-based Turn-taking
in a Travel Agent Spoken Dialogue System [7.9032835871264115]
我々のチームは、共通基盤を構築し、ユーザの発話テキストに基づいてより自然な旋回を行うことのできるシステムを開発した。
本システムでは,利用者の理解を待ちながら,共通点を用いた観光スポット検索のクエリを生成し,対話を行った。
論文 参考訳(メタデータ) (2023-12-21T13:08:09Z) - Team Irisapu Project Description for DRC2023 [0.0]
本稿では,ダイアログロボットコンペティション2023の予備ラウンドのために,Team Irisapuが設計したダイアログロボットシステムについて述べる。
所定のシナリオに順応しながら,対話応答を柔軟に生成しようと試みた。
提供された情報の信頼性”の評価カテゴリでは、すべてのチームの中で3位に位置づけました。
論文 参考訳(メタデータ) (2023-12-21T11:44:13Z) - Semi-Supervised Knowledge-Grounded Pre-training for Task-Oriented Dialog
Systems [25.164042288343683]
半教師付き/強化TODシステム構築における最初の課題である,SereTOD 2022 チャレンジのトラック2のモデルを提案する。
我々は,対話履歴とローカルKBを入力として定式化し,システム応答を予測するための知識基底ダイアログモデルを構築した。
また,ラベル付きデータとラベルなしデータの両方で,半教師付き事前学習を行う。
論文 参考訳(メタデータ) (2022-10-17T09:10:03Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Adapting Document-Grounded Dialog Systems to Spoken Conversations using
Data Augmentation and a Noisy Channel Model [46.93744191416991]
第10回ダイアログ・システム・テクノロジー・チャレンジ(DSTC10)第2章の報告を要約する。
このタスクは3つのサブタスクから構成される: ターンが知識を求めるかどうかを検知し、関連する知識文書を選択し、最後に接地された応答を生成する。
ベストシステムは,課題の人的評価において,第1位,第3位を達成できた。
論文 参考訳(メタデータ) (2021-12-16T12:51:52Z) - A Review of Dialogue Systems: From Trained Monkeys to Stochastic Parrots [0.0]
人工知能をデプロイして、人間と会話できる自動対話エージェントを構築することを目指している。
本稿では,長年にわたって対話システムを構築するために開発された手法について概説する。
論文 参考訳(メタデータ) (2021-11-02T08:07:55Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - EVA: An Open-Domain Chinese Dialogue System with Large-Scale Generative
Pre-Training [40.85554509137999]
本研究では,2.8Bパラメータを持つ中国最大の事前学習対話モデルを含む中国語対話システムであるEVAを提案する。
このモデルを構築するために、様々なソーシャルメディアからWDC-Dialogueという名前の中国語対話データセットを収集する。
自動評価と人的評価の実験は、EVAが他の中国の事前学習対話モデルより優れていることを示している。
論文 参考訳(メタデータ) (2021-08-03T14:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。