論文の概要: Punctuation Restoration in Spanish Customer Support Transcripts using
Transfer Learning
- arxiv url: http://arxiv.org/abs/2205.13961v1
- Date: Fri, 27 May 2022 13:14:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 21:01:06.125210
- Title: Punctuation Restoration in Spanish Customer Support Transcripts using
Transfer Learning
- Title(参考訳): トランスファーラーニングを用いたスペイン語顧客支援文字の句読解
- Authors: Xiliang Zhu, Shayna Gardiner, David Rossouw, Tere Rold\'an, Simon
Corston-Oliver
- Abstract要約: 本稿では,リアルタイムの顧客支援転写サービスのために設計されたスペイン語句読点復元システムを提案する。
顧客サポート領域におけるスペイン文字のデータの分散性に対処するために、トランスファーラーニングに基づく2つの戦略を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Speech Recognition (ASR) systems typically produce unpunctuated
transcripts that have poor readability. In addition, building a punctuation
restoration system is challenging for low-resource languages, especially for
domain-specific applications. In this paper, we propose a Spanish punctuation
restoration system designed for a real-time customer support transcription
service. To address the data sparsity of Spanish transcripts in the customer
support domain, we introduce two transfer-learning-based strategies: 1) domain
adaptation using out-of-domain Spanish text data; 2) cross-lingual transfer
learning leveraging in-domain English transcript data. Our experiment results
show that these strategies improve the accuracy of the Spanish punctuation
restoration system.
- Abstract(参考訳): 自動音声認識(ASR)システムは通常、可読性に乏しい不動文字を生成する。
さらに,低リソース言語,特にドメイン固有のアプリケーションにおいて,句読点復元システムの構築は困難である。
本稿では,リアルタイム顧客支援転写サービス用に設計されたスペイン語句読点復元システムを提案する。
カスタマサポートドメインにおけるスペイン語写本のデータスパーシティに対処するために,トランスファーラーニングに基づく2つの戦略を紹介する。
1) ドメイン外スペイン語テキストデータを用いたドメイン適応
2) ドメイン内英語転写データを活用した言語間変換学習
実験の結果,これらの手法により,スペインの句読点復元システムの精度が向上した。
関連論文リスト
- Resolving Transcription Ambiguity in Spanish: A Hybrid Acoustic-Lexical
System for Punctuation Restoration [0.4821250031784094]
本稿では,スペイン語転写のためのハイブリッド音響-語彙句読解システムを提案する。
実験の結果,提案システムは質問点のF1スコアと全体的な句読点回復を効果的に改善できることがわかった。
論文 参考訳(メタデータ) (2024-02-05T21:05:35Z) - Measuring Catastrophic Forgetting in Cross-Lingual Transfer Paradigms:
Exploring Tuning Strategies [4.498659756007485]
言語間移動は、少ないリソースの言語でタスクを解くための有望なテクニックである。
大規模言語モデルに対する2つの微調整アプローチとゼロショットおよびフルショット学習アプローチを比較した。
論文 参考訳(メタデータ) (2023-09-12T09:37:08Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - Transfer-Free Data-Efficient Multilingual Slot Labeling [82.02076369811402]
スロットラベリングはタスク指向対話(ToD)システムの中核的なコンポーネントである。
固有データ不足の問題を緩和するために、多言語ToDに関する現在の研究は、十分な英語の注釈付きデータが常に利用可能であると仮定している。
標準的な多言語文エンコーダを効果的なスロットラベリングに変換する2段階のスロットラベリング手法(TWOSL)を提案する。
論文 参考訳(メタデータ) (2023-05-22T22:47:32Z) - Addressing Issues of Cross-Linguality in Open-Retrieval Question
Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。
本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。
深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-01-26T19:27:32Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z) - Coarse-To-Fine And Cross-Lingual ASR Transfer [0.0]
翻訳学習は言語間でさえ困難を克服するために提案されている。
チェコ語ASRの英語モデルを再利用して、より少ない関連言語で実験する。
我々は、単語誤り率(WER)と同様に、トレーニング時間におけるかなりのエデュケーションを達成する。
論文 参考訳(メタデータ) (2021-09-02T13:16:12Z) - Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。
言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文 参考訳(メタデータ) (2020-06-22T10:28:38Z) - Sign Language Transformers: Joint End-to-end Sign Language Recognition
and Translation [59.38247587308604]
本稿では,連続手話認識と翻訳を共同で学習するトランスフォーマーアーキテクチャを提案する。
RWTH-PHOENIX-Weather-2014Tデータセットの認識と翻訳性能の評価を行った。
我々の翻訳ネットワークは、動画を音声言語に、光沢を音声言語翻訳モデルに、どちらよりも優れています。
論文 参考訳(メタデータ) (2020-03-30T21:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。