論文の概要: Punctuation Prediction in Spontaneous Conversations: Can We Mitigate ASR
Errors with Retrofitted Word Embeddings?
- arxiv url: http://arxiv.org/abs/2004.05985v1
- Date: Mon, 13 Apr 2020 15:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 23:35:12.048427
- Title: Punctuation Prediction in Spontaneous Conversations: Can We Mitigate ASR
Errors with Retrofitted Word Embeddings?
- Title(参考訳): 自発会話における句読影予測 : 単語埋め込みによるASR誤りを軽減できるか?
- Authors: {\L}ukasz Augustyniak, Piotr Szymanski, Miko{\l}aj Morzy, Piotr
Zelasko, Adrian Szymczak, Jan Mizgajski, Yishay Carmiel, Najim Dehak
- Abstract要約: ドメイン固有のデータへの埋め込みがASRエラーを緩和することを示す。
我々は,最先端モデルと比較して,句読点の精度が6.2%(疑問点)から9%(期間)に絶対的に向上したことを記録した。
- 参考スコア(独自算出の注目度): 33.5428664411426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic Speech Recognition (ASR) systems introduce word errors, which often
confuse punctuation prediction models, turning punctuation restoration into a
challenging task. These errors usually take the form of homonyms. We show how
retrofitting of the word embeddings on the domain-specific data can mitigate
ASR errors. Our main contribution is a method for better alignment of homonym
embeddings and the validation of the presented method on the punctuation
prediction task. We record the absolute improvement in punctuation prediction
accuracy between 6.2% (for question marks) to 9% (for periods) when compared
with the state-of-the-art model.
- Abstract(参考訳): 自動音声認識(ASR)システムは単語エラーを導入し、句読点予測モデルを混乱させ、句読点復元を困難なタスクに変換する。
これらの誤りは通常ホモニムの形式をとる。
ドメイン固有のデータへの埋め込みがASRエラーを緩和することを示す。
提案手法の主な貢献は,ホムニム埋め込みのアライメントの改善と句読点予測タスクにおける提案手法の検証である。
我々は,最先端モデルと比較して,句読点の精度が6.2%(疑問点)から9%(期間)に絶対的に向上したことを記録した。
関連論文リスト
- Spelling Correction through Rewriting of Non-Autoregressive ASR Lattices [8.77712061194924]
本稿では,トランスフォーマーを用いたCTCモデルにより生成されたワードピース格子を書き換える有限状態トランスデューサ(FST)手法を提案する。
本アルゴリズムは,単語から音素への変換を直接行うため,明示的な単語表現を避けることができる。
文脈関連エンティティを用いたテストにおいて, 文誤り率(SER)の15.2%の相対的低減を実現した。
論文 参考訳(メタデータ) (2024-09-24T21:42:25Z) - Error Correction by Paying Attention to Both Acoustic and Confidence References for Automatic Speech Recognition [52.624909026294105]
本稿では,非自己回帰型音声誤り訂正法を提案する。
信頼モジュールは、N-best ASR仮説の各単語の不確実性を測定する。
提案方式は,ASRモデルと比較して誤差率を21%削減する。
論文 参考訳(メタデータ) (2024-06-29T17:56:28Z) - LibriSpeech-PC: Benchmark for Evaluation of Punctuation and
Capitalization Capabilities of end-to-end ASR Models [58.790604613878216]
我々は,エンドツーエンドのASRモデルの句読点と大文字化予測能力を評価するために,LibriSpeech-PCベンチマークを導入する。
このベンチマークには、リストアされた句読点とキャピタライゼーションを備えたLibriSpeech-PCデータセット、句読点に焦点を当てたPunctuation Error Rate (PER)と呼ばれる新しい評価指標、および初期ベースラインモデルが含まれている。
論文 参考訳(メタデータ) (2023-10-04T16:23:37Z) - Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:04:28Z) - Token-Level Supervised Contrastive Learning for Punctuation Restoration [7.9713449581347104]
句読解は自然言語の文章を理解するのに重要である。
ほとんどの自動音声認識システムは句読点を生成しない。
句読点修復における最近の研究は、事前訓練された言語モデルを大いに活用している。
論文 参考訳(メタデータ) (2021-07-19T18:24:33Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z) - Adversarial Transfer Learning for Punctuation Restoration [58.2201356693101]
句読点予測のためのタスク不変知識を学習するために,逆多タスク学習を導入する。
IWSLT2011データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-01T06:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。