Fugu-MT 論文翻訳(概要): Human-Machine Interaction Speech Corpus from the ROBIN project

論文の概要: Human-Machine Interaction Speech Corpus from the ROBIN project

arxiv url: http://arxiv.org/abs/2111.11170v1
Date: Mon, 22 Nov 2021 13:10:41 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-23 15:24:05.029330
Title: Human-Machine Interaction Speech Corpus from the ROBIN project
Title（参考訳）: ROBINプロジェクトによる人間と機械の対話音声コーパス
Authors: Vasile P\u{a}i\c{s}, Radu Ion, Andrei-Marius Avram, Elena Irimia, Verginica Barbu Mititelu, Maria Mitrofan
Abstract要約: 本稿では,ROBINTASC(RoOBIN Technical Acquisition Speech Corpus)と呼ばれる,RoOBINプロジェクトからのルーマニア語音声コーパスを紹介する。その主な目的は、対話エージェントの振る舞いを改善し、技術機器の購入という文脈で人間と機械の相互作用を可能にすることである。
参考スコア（独自算出の注目度）: 0.1631115063641726
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper introduces a new Romanian speech corpus from the ROBIN project, called ROBIN Technical Acquisition Speech Corpus (ROBINTASC). Its main purpose was to improve the behaviour of a conversational agent, allowing human-machine interaction in the context of purchasing technical equipment. The paper contains a detailed description of the acquisition process, corpus statistics as well as an evaluation of the corpus influence on a low-latency ASR system as well as a dialogue component.
Abstract（参考訳）: 本稿では,ROBINTASC(RoOBIN Technical Acquisition Speech Corpus)と呼ばれる,RoOBINプロジェクトからのルーマニア語音声コーパスを紹介する。その主な目的は会話エージェントの振る舞いを改善し、技術機器の購入という文脈で人間と機械の相互作用を可能にすることである。本論文は,低遅延ASRシステムにおけるコーパスの影響と対話コンポーネントについて,取得過程,コーパス統計,およびコーパスの影響の詳細な説明を含む。

関連論文リスト

SpeechRole: A Large-Scale Dataset and Benchmark for Evaluating Speech Role-Playing Agents [52.29009595100625]
ロールプレイングエージェントは、パーソナライズされた相互作用と感情共鳴を達成するための有望なパラダイムとして登場した。既存の研究は主にテキストのモダリティに焦点を当て、現実的な対話的なシナリオにおける音声の重要な次元を無視している。我々は,98の多様な役割と112kの音声ベースの1ターン・マルチターン会話からなる大規模かつ高品質なデータセットであるSpeechRole-Dataを構築した。
論文参考訳（メタデータ） (2025-08-04T03:18:36Z)
SCOUT: A Situated and Multi-Modal Human-Robot Dialogue Corpus [5.063252743855561]
SCOUT(Situated Corpus of Understanding Transactions)を紹介する。これは、協調探索のタスク領域における人間とロボットの対話の集合である。 SCOUTは、89,056発の発声と、278発の対話から310,095発の発声を含む。
論文参考訳（メタデータ） (2024-11-19T20:18:55Z)
Enhancing Dialogue Speech Recognition with Robust Contextual Awareness via Noise Representation Learning [6.363223418619587]
本研究では,CNRL(Context Noise Representation Learning)を導入し,雑音に対する堅牢性を向上し,対話音声認識の精度を向上する。本手法は,音声対話の評価に基づいて,ベースラインよりも優れた結果を示す。
論文参考訳（メタデータ） (2024-08-12T10:21:09Z)
KamerRaad: Enhancing Information Retrieval in Belgian National Politics through Hierarchical Summarization and Conversational Interfaces [55.00702535694059]
KamerRaadは、大きな言語モデルを活用するAIツールで、市民がベルギーの政治情報と対話的に関わるのを助ける。このツールは、議会の手続きから重要な抜粋を抽出し、簡潔に要約し、次いで生成AIに基づくインタラクションの可能性を示す。
論文参考訳（メタデータ） (2024-04-22T15:01:39Z)
A Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human-Robot Interaction [2.3590037806133024]
本稿では,対話状態のグラフベース表現に基づく人間-ロボット間相互作用の新しい対話モデルを提案する。ユーザの発話に応答するために使用されるニューラルネットワークモデルは、シンプルだが効果的なグラフ・トゥ・テキスト機構に依存している。提案手法はヒューマノイドロボットを用いたユーザスタディにより実験的に評価される。
論文参考訳（メタデータ） (2023-11-03T15:44:28Z)
Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文参考訳（メタデータ） (2023-01-10T13:18:25Z)
Mediators: Conversational Agents Explaining NLP Model Behavior [2.7878644615660457]
人間中心の説明可能な人工知能(HCXAI)コミュニティは、人間と機械の会話として説明プロセスをフレーミングする必要性を高めた。我々は、自然言語を用いて対話的に神経モデルの振る舞いを説明することができるテキストベースの会話エージェントである、メディエーターのためのデシラタを確立する。
論文参考訳（メタデータ） (2022-06-13T10:31:18Z)
End-to-end Spoken Conversational Question Answering: Task, Dataset and Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文参考訳（メタデータ） (2022-04-29T17:56:59Z)
STUDIES: Corpus of Japanese Empathetic Dialogue Speech Towards Friendly Voice Agent [41.46571444928867]
本稿では,親しみやすい音声エージェントを開発するための音声コーパスSTUDIESを提案する。我々はSTUDIESコーパスを設計し、対話者の感情に共感を持って話す話者を含むようにした。その結果,対話型感情ラベルと会話型文脈埋め込みを用いることで,エージェントの感情ラベルを用いて合成した自然度と同程度の音声を生成できることが示唆された。
論文参考訳（メタデータ） (2022-03-28T13:49:59Z)
SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。ニューラル音声処理技術の研究開発を促進するために設計された。幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-06-08T18:22:56Z)
Dialogue-Based Relation Extraction [53.2896545819799]
本稿では,人間による対話型関係抽出(RE)データセットDialogREを提案する。我々は,対話型タスクと従来のREタスクの類似点と相違点の分析に基づいて,提案課題において話者関連情報が重要な役割を担っていると論じる。実験結果から,ベストパフォーマンスモデルにおける話者認識の拡張が,標準設定と会話評価設定の両方において向上することが示された。
論文参考訳（メタデータ） (2020-04-17T03:51:57Z)
Speaker Diarization with Lexical Information [59.983797884955]
本研究では,音声認識による語彙情報を活用した話者ダイアリゼーション手法を提案する。本稿では,話者クラスタリングプロセスに単語レベルの話者回転確率を組み込んだ話者ダイアリゼーションシステムを提案し,全体的なダイアリゼーション精度を向上させる。
論文参考訳（メタデータ） (2020-04-13T17:16:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。