Fugu-MT 論文翻訳(概要): ed-cec: improving rare word recognition using asr postprocessing based on error detection and context-aware error correction

論文の概要: ed-cec: improving rare word recognition using asr postprocessing based on error detection and context-aware error correction

arxiv url: http://arxiv.org/abs/2310.05129v1
Date: Sun, 8 Oct 2023 11:40:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-12 12:27:05.069559
Title: ed-cec: improving rare word recognition using asr postprocessing based on error detection and context-aware error correction
Title（参考訳）: ed-cec:誤り検出と文脈認識誤り訂正に基づくasr後処理によるレアワード認識の改善
Authors: Jiajun He, Zekun Yang, Tomoki Toda
Abstract要約: 本稿では,誤り検出と文脈認識誤り訂正により,稀な単語の認識を改善することに焦点を当てた新しいASRポストプロセッシング手法を提案する。 5つのデータセットにまたがる実験結果から,提案手法は従来の手法に比べて単語誤り率(WER)が有意に低いことを示す。
参考スコア（独自算出の注目度）: 30.486396813844195
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automatic speech recognition (ASR) systems often encounter difficulties in accurately recognizing rare words, leading to errors that can have a negative impact on downstream tasks such as keyword spotting, intent detection, and text summarization. To address this challenge, we present a novel ASR postprocessing method that focuses on improving the recognition of rare words through error detection and context-aware error correction. Our method optimizes the decoding process by targeting only the predicted error positions, minimizing unnecessary computations. Moreover, we leverage a rare word list to provide additional contextual knowledge, enabling the model to better correct rare words. Experimental results across five datasets demonstrate that our proposed method achieves significantly lower word error rates (WERs) than previous approaches while maintaining a reasonable inference speed. Furthermore, our approach exhibits promising robustness across different ASR systems.
Abstract（参考訳）: 自動音声認識(ASR)システムは、稀な単語を正確に認識する上で、しばしば困難に遭遇し、キーワードスポッティング、意図検出、テキスト要約などの下流タスクに悪影響を及ぼすエラーを引き起こす。そこで本研究では,誤り検出と文脈認識による誤り訂正により,レアワードの認識を改善することに焦点を当てた新しいasrポストプロセッシング手法を提案する。提案手法は,予測誤り位置のみをターゲットとしてデコード処理を最適化し,不要な計算を最小化する。さらに,レアワードリストを利用して追加の文脈知識を提供し,レアワードの訂正をより容易に行えるようにした。 5つのデータセットにまたがる実験結果から,提案手法は従来の手法に比べて単語誤り率(WER)を著しく低くし,適切な推論速度を維持した。さらに,本手法は,異なるASRシステムにまたがる有望な堅牢性を示す。

関連論文リスト

Towards Automated Error Discovery: A Study in Conversational AI [48.735443116662026]
本稿では,会話型AIにおけるエラーの検出と定義のためのフレームワークであるAutomated Error Discoveryを紹介する。また,その実装に対するエンコーダに基づくアプローチとして,SEEED(Soft Clustering Extended-Based Error Detection)を提案する。
論文参考訳（メタデータ） (2025-09-13T14:53:22Z)
Context Biasing for Pronunciations-Orthography Mismatch in Automatic Speech Recognition [56.972851337263755]
本稿では,置換誤りの訂正を可能とし,難解な単語の認識精度を向上させる手法を提案する。この手法により, 単語誤り率の相対的な改善を最大11%に抑えつつ, 単語誤り率の競争力を維持することができることを示す。
論文参考訳（メタデータ） (2025-06-23T14:42:03Z)
PMF-CEC: Phoneme-augmented Multimodal Fusion for Context-aware ASR Error Correction with Error-specific Selective Decoding [27.245689792428557]
文脈認識誤り訂正のための音素拡張多重モーダル融合法を提案する。提案するPMF-CECは、適切な推論速度を維持しつつ、バイアス付き単語誤り率をさらに低減する。我々の手法は他の文脈バイアス法よりも優れている。
論文参考訳（メタデータ） (2025-05-31T08:18:34Z)
Not All Errors Are Equal: Investigation of Speech Recognition Errors in Alzheimer's Disease Detection [62.942077348224046]
アルツハイマー病(AD)の自動診断における音声認識の役割近年の研究では,単語誤り率(WER)とAD検出性能の非線形関係が明らかにされている。本研究は,BERTを用いたAD検出システムにおけるASR転写誤りの影響について,一連の解析を行った。
論文参考訳（メタデータ） (2024-12-09T09:32:20Z)
Keyword-Aware ASR Error Augmentation for Robust Dialogue State Tracking [17.96115263146684]
本稿では,対話状態追跡モデルのロバスト性を改善するために,シンプルながら効果的なデータ拡張手法を提案する。提案手法は,キーワードの誤りパターンを十分に生成し,雑音および低精度のASR環境における精度を向上させる。
論文参考訳（メタデータ） (2024-09-10T07:06:40Z)
A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文参考訳（メタデータ） (2024-09-06T09:26:45Z)
Error Correction by Paying Attention to Both Acoustic and Confidence References for Automatic Speech Recognition [52.624909026294105]
本稿では,非自己回帰型音声誤り訂正法を提案する。信頼モジュールは、N-best ASR仮説の各単語の不確実性を測定する。提案方式は,ASRモデルと比較して誤差率を21%削減する。
論文参考訳（メタデータ） (2024-06-29T17:56:28Z)
Tag and correct: high precision post-editing approach to correction of speech recognition errors [0.0]
ASR(Automatic Speech Recognition)仮説の単語を単語単位で修正する方法を学ぶニューラルネットワークタグと、タグによって返される修正を適用する修正モジュールとから構成される。提案手法はアーキテクチャによらず,任意のASRシステムに適用可能である。
論文参考訳（メタデータ） (2024-06-11T09:52:33Z)
Understanding and Mitigating Classification Errors Through Interpretable Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。提案手法であるPremiseが実際によく動作することを示す。
論文参考訳（メタデータ） (2023-11-18T00:24:26Z)
Boosting Chinese ASR Error Correction with Dynamic Error Scaling Mechanism [27.09416337926635]
現在の主流モデルは、しばしば単語レベルの特徴と音声情報を効果的に活用するのに苦労する。本稿では,音素の誤りを検知し,訂正する動的エラースケーリング機構を取り入れた新しい手法を提案する。
論文参考訳（メタデータ） (2023-08-07T09:19:59Z)
SoftCorrect: Error Correction with Soft Detection for Automatic Speech Recognition [116.31926128970585]
我々は,明示的かつ暗黙的な誤り検出の限界を回避するため,ソフトエラー検出機構を備えたSoftCorrectを提案する。暗黙的な誤り検出とCTC損失と比較すると、SoftCorrectはどの単語が誤りであるかを明示的な信号を提供する。 AISHELL-1とAidatatangデータセットの実験では、SoftCorrectはそれぞれ26.1%と9.4%のCER削減を達成した。
論文参考訳（メタデータ） (2022-12-02T09:11:32Z)
Factual Error Correction for Abstractive Summaries Using Entity Retrieval [57.01193722520597]
本稿では,エンティティ検索後処理に基づく効率的な事実誤り訂正システムRFECを提案する。 RFECは、原文と対象要約とを比較して、原文から証拠文を検索する。次に、RFECは、エビデンス文を考慮し、要約中のエンティティレベルのエラーを検出し、エビデンス文から正確なエンティティに置換する。
論文参考訳（メタデータ） (2022-04-18T11:35:02Z)
Improving Distinction between ASR Errors and Speech Disfluencies with Feature Space Interpolation [0.0]
微調整事前訓練言語モデル(LM)は,後処理における自動音声認識(ASR)エラー検出において一般的な手法である。本稿では,既存のLMベースのASR誤り検出システムの改良手法を提案する。
論文参考訳（メタデータ） (2021-08-04T02:11:37Z)
On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文参考訳（メタデータ） (2020-05-12T11:01:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。