論文の概要: Human-Machine Interaction Speech Corpus from the ROBIN project
- arxiv url: http://arxiv.org/abs/2111.11170v1
- Date: Mon, 22 Nov 2021 13:10:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 15:24:05.029330
- Title: Human-Machine Interaction Speech Corpus from the ROBIN project
- Title(参考訳): ROBINプロジェクトによる人間と機械の対話音声コーパス
- Authors: Vasile P\u{a}i\c{s}, Radu Ion, Andrei-Marius Avram, Elena Irimia,
Verginica Barbu Mititelu, Maria Mitrofan
- Abstract要約: 本稿では,ROBINTASC(RoOBIN Technical Acquisition Speech Corpus)と呼ばれる,RoOBINプロジェクトからのルーマニア語音声コーパスを紹介する。
その主な目的は、対話エージェントの振る舞いを改善し、技術機器の購入という文脈で人間と機械の相互作用を可能にすることである。
- 参考スコア(独自算出の注目度): 0.1631115063641726
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a new Romanian speech corpus from the ROBIN project,
called ROBIN Technical Acquisition Speech Corpus (ROBINTASC). Its main purpose
was to improve the behaviour of a conversational agent, allowing human-machine
interaction in the context of purchasing technical equipment. The paper
contains a detailed description of the acquisition process, corpus statistics
as well as an evaluation of the corpus influence on a low-latency ASR system as
well as a dialogue component.
- Abstract(参考訳): 本稿では,ROBINTASC(RoOBIN Technical Acquisition Speech Corpus)と呼ばれる,RoOBINプロジェクトからのルーマニア語音声コーパスを紹介する。
その主な目的は会話エージェントの振る舞いを改善し、技術機器の購入という文脈で人間と機械の相互作用を可能にすることである。
本論文は,低遅延ASRシステムにおけるコーパスの影響と対話コンポーネントについて,取得過程,コーパス統計,およびコーパスの影響の詳細な説明を含む。
関連論文リスト
- A Graph-to-Text Approach to Knowledge-Grounded Response Generation in
Human-Robot Interaction [2.3590037806133024]
本稿では,対話状態のグラフベース表現に基づく人間-ロボット間相互作用の新しい対話モデルを提案する。
ユーザの発話に応答するために使用されるニューラルネットワークモデルは、シンプルだが効果的なグラフ・トゥ・テキスト機構に依存している。
提案手法はヒューマノイドロボットを用いたユーザスタディにより実験的に評価される。
論文 参考訳(メタデータ) (2023-11-03T15:44:28Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - Mediators: Conversational Agents Explaining NLP Model Behavior [2.7878644615660457]
人間中心の説明可能な人工知能(HCXAI)コミュニティは、人間と機械の会話として説明プロセスをフレーミングする必要性を高めた。
我々は、自然言語を用いて対話的に神経モデルの振る舞いを説明することができるテキストベースの会話エージェントである、メディエーターのためのデシラタを確立する。
論文 参考訳(メタデータ) (2022-06-13T10:31:18Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - STUDIES: Corpus of Japanese Empathetic Dialogue Speech Towards Friendly
Voice Agent [41.46571444928867]
本稿では,親しみやすい音声エージェントを開発するための音声コーパスSTUDIESを提案する。
我々はSTUDIESコーパスを設計し、対話者の感情に共感を持って話す話者を含むようにした。
その結果,対話型感情ラベルと会話型文脈埋め込みを用いることで,エージェントの感情ラベルを用いて合成した自然度と同程度の音声を生成できることが示唆された。
論文 参考訳(メタデータ) (2022-03-28T13:49:59Z) - How Should Agents Ask Questions For Situated Learning? An Annotated
Dialogue Corpus [13.12257465328948]
本稿では,HuRDLコーパス(HuRDL: Human-Robot Dialogue Learning)について紹介する。
コーパスデータとそれに対応するアノテーションスキームを記述し、人間が現在位置する環境での学習を促進するために求める質問の形式と内容について考察する。
論文 参考訳(メタデータ) (2021-06-11T16:58:22Z) - SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。
ニューラル音声処理技術の研究開発を促進するために設計された。
幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-06-08T18:22:56Z) - Filling the Gap of Utterance-aware and Speaker-aware Representation for
Multi-turn Dialogue [76.88174667929665]
マルチターン対話は、2つ以上の異なる話者の役割から複数の発話からなる。
既存の検索に基づくマルチターン対話モデルでは、事前訓練された言語モデル(PrLM)をエンコーダとして、対話を粗く表現する。
本稿では,対話履歴に係わる効果的な発話認識表現と話者認識表現をモデル化することにより,そのようなギャップを埋める新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-09-14T15:07:19Z) - Exploring Recurrent, Memory and Attention Based Architectures for
Scoring Interactional Aspects of Human-Machine Text Dialog [9.209192502526285]
本稿は、複数のニューラルアーキテクチャを調べるために、この方向の以前の研究に基づいている。
我々は,クラウドベースの対話システムと対話する人間の学習者からテキストダイアログの対話データベース上で実験を行う。
複数のアーキテクチャの融合は、専門家間の合意に比較して、我々の自動スコアリングタスクにおいて有能に機能することがわかった。
論文 参考訳(メタデータ) (2020-05-20T03:23:00Z) - Dialogue-Based Relation Extraction [53.2896545819799]
本稿では,人間による対話型関係抽出(RE)データセットDialogREを提案する。
我々は,対話型タスクと従来のREタスクの類似点と相違点の分析に基づいて,提案課題において話者関連情報が重要な役割を担っていると論じる。
実験結果から,ベストパフォーマンスモデルにおける話者認識の拡張が,標準設定と会話評価設定の両方において向上することが示された。
論文 参考訳(メタデータ) (2020-04-17T03:51:57Z) - Speaker Diarization with Lexical Information [59.983797884955]
本研究では,音声認識による語彙情報を活用した話者ダイアリゼーション手法を提案する。
本稿では,話者クラスタリングプロセスに単語レベルの話者回転確率を組み込んだ話者ダイアリゼーションシステムを提案し,全体的なダイアリゼーション精度を向上させる。
論文 参考訳(メタデータ) (2020-04-13T17:16:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。