論文の概要: Towards Relation Extraction From Speech
- arxiv url: http://arxiv.org/abs/2210.08759v1
- Date: Mon, 17 Oct 2022 05:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 20:04:50.872263
- Title: Towards Relation Extraction From Speech
- Title(参考訳): 音声からの関係抽出に向けて
- Authors: Tongtong Wu, Guitao Wang, Jinming Zhao, Zhaoran Liu, Guilin Qi,
Yuan-Fang Li, Gholamreza Haffari
- Abstract要約: 本稿では,新たな聴取情報抽出タスク,すなわち音声関係抽出を提案する。
本研究では,音声合成システムによる音声関係抽出のための訓練データセットを構築し,英語母語話者によるクラウドソーシングによるテストデータセットを構築した。
我々は,音声関係抽出における課題を識別するための包括的実験を行い,今後の探索に光を当てる可能性がある。
- 参考スコア(独自算出の注目度): 56.36416922396724
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Relation extraction typically aims to extract semantic relationships between
entities from the unstructured text. One of the most essential data sources for
relation extraction is the spoken language, such as interviews and dialogues.
However, the error propagation introduced in automatic speech recognition (ASR)
has been ignored in relation extraction, and the end-to-end speech-based
relation extraction method has been rarely explored. In this paper, we propose
a new listening information extraction task, i.e., speech relation extraction.
We construct the training dataset for speech relation extraction via
text-to-speech systems, and we construct the testing dataset via crowd-sourcing
with native English speakers. We explore speech relation extraction via two
approaches: the pipeline approach conducting text-based extraction with a
pretrained ASR module, and the end2end approach via a new proposed
encoder-decoder model, or what we called SpeechRE. We conduct comprehensive
experiments to distinguish the challenges in speech relation extraction, which
may shed light on future explorations. We share the code and data on
https://github.com/wutong8023/SpeechRE.
- Abstract(参考訳): 関係抽出は通常、構造化されていないテキストからエンティティ間の意味的関係を抽出することを目的としている。
関係抽出のための最も重要なデータソースの1つは、インタビューや対話といった音声言語である。
しかし, 自動音声認識(ASR)で導入された誤り伝搬は, 関係抽出において無視されており, エンドツーエンドの関係抽出法はほとんど検討されていない。
本稿では,新たな聴取情報抽出タスク,すなわち音声関係抽出を提案する。
テキスト対音声システムによる音声関係抽出のための学習データセットを構築し,ネイティブ英語話者とのクラウドソーシングによるテストデータセットを構築する。
そこで本研究では,asrモジュールを用いたテキストベース抽出を行うパイプラインアプローチと,提案するエンコーダ・デコーダモデルによるエンド2エンドアプローチ,すなわち speechre という2つのアプローチによる音声関係抽出について検討した。
我々は,音声関係抽出における課題を識別するための包括的実験を行い,今後の探索に光を当てる可能性がある。
コードとデータをhttps://github.com/wutong8023/speechreで共有しています。
関連論文リスト
- Learning Speech Representation From Contrastive Token-Acoustic
Pretraining [57.08426714676043]
本研究では、2つのエンコーダを用いて音素と音声を複数モーダル空間に導入するCTAP(Contrastive Token-Acoustic Pretraining)を提案する。
提案したCTAPモデルは、210k音声と音素ペアで訓練され、最小教師付きTS、VC、ASRを実現する。
論文 参考訳(メタデータ) (2023-09-01T12:35:43Z) - ESSumm: Extractive Speech Summarization from Untranscribed Meeting [7.309214379395552]
本稿では,音声から音声への直接要約のための新しいアーキテクチャであるESSummを提案する。
市販の自己教師型畳み込みニューラルネットワークを利用して、生音声から深層音声の特徴を抽出する。
提案手法は,目的の要約長でキー情報をキャプチャする音声セグメントの最適シーケンスを自動的に予測する。
論文 参考訳(メタデータ) (2022-09-14T20:13:15Z) - Leveraging Acoustic Contextual Representation by Audio-textual
Cross-modal Learning for Conversational ASR [25.75615870266786]
先行する音声から直接文脈表現を学習するための音声・テキスト・モーダル表現抽出器を提案する。
提案手法の有効性を複数のマンダリン会話コーパスで検証した。
論文 参考訳(メタデータ) (2022-07-03T13:32:24Z) - End-to-End Active Speaker Detection [58.7097258722291]
本稿では,特徴学習と文脈予測を共同で学習するエンド・ツー・エンドのトレーニングネットワークを提案する。
また、時間間グラフニューラルネットワーク(iGNN)ブロックを導入し、ASD問題における主要なコンテキストのソースに応じてメッセージパッシングを分割する。
実験により、iGNNブロックからの集約された特徴はASDにより適しており、その結果、最先端のアートパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2022-03-27T08:55:28Z) - RelationPrompt: Leveraging Prompts to Generate Synthetic Data for
Zero-Shot Relation Triplet Extraction [65.4337085607711]
ゼロショット関係トリプルト抽出(ZeroRTE)のタスク設定について紹介する。
入力文が与えられた後、抽出された各三重項は、トレーニング段階で関係ラベルが見えないヘッドエンティティ、リレーションラベル、テールエンティティから構成される。
本稿では、言語モデルに構造化テキストを生成するよう促すことで、関係例を合成する。
論文 参考訳(メタデータ) (2022-03-17T05:55:14Z) - Extracting and filtering paraphrases by bridging natural language
inference and paraphrasing [0.0]
本研究では,NLIデータセットからパラフレージングデータセットを抽出し,既存のパラフレージングデータセットをクリーニングするための新しい手法を提案する。
その結果,既存の2つのパラフレージングデータセットにおいて,抽出したパラフレージングデータセットの品質と驚くほど高いノイズレベルが示された。
論文 参考訳(メタデータ) (2021-11-13T14:06:37Z) - Keyword Extraction for Improved Document Retrieval in Conversational
Search [10.798537120200006]
混合開始型会話検索は大きな利点をもたらす。
会話からユーザーが提供する追加情報を取り入れることには、いくつかの課題がある。
我々は2つの対話型キーワード抽出データセットを収集し、それらを組み込んだエンドツーエンドの文書検索パイプラインを提案する。
論文 参考訳(メタデータ) (2021-09-13T13:55:37Z) - D-REX: Dialogue Relation Extraction with Explanations [65.3862263565638]
この研究は、部分的にラベル付けされたデータのみを使用しながら関係が存在することを示す説明を抽出することに焦点を当てている。
本稿では,政策誘導型半教師付きアルゴリズムD-REXを提案する。
約90%の人は、強いBERTに基づく関節関係抽出と説明モデルよりもD-REXの説明を好んでいる。
論文 参考訳(メタデータ) (2021-09-10T22:30:48Z) - Improving Sentence-Level Relation Extraction through Curriculum Learning [7.117139527865022]
本稿では,学習の難易度でデータを分割し,学習に活用するカリキュラムベースの関係抽出モデルを提案する。
代表文レベルの関係抽出データセットであるTACREDとRe-TACREDを用いた実験では,提案手法は良好な性能を示した。
論文 参考訳(メタデータ) (2021-07-20T08:44:40Z) - Continuous speech separation: dataset and analysis [52.10378896407332]
自然な会話では、音声信号は連続的であり、重複成分と重複成分の両方を含む。
本稿では,連続音声分離アルゴリズムを評価するためのデータセットとプロトコルについて述べる。
論文 参考訳(メタデータ) (2020-01-30T18:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。