Fugu-MT 論文翻訳(概要): Punctuation Restoration in Spanish Customer Support Transcripts using Transfer Learning

論文の概要: Punctuation Restoration in Spanish Customer Support Transcripts using Transfer Learning

arxiv url: http://arxiv.org/abs/2205.13961v1
Date: Fri, 27 May 2022 13:14:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-30 21:01:06.125210
Title: Punctuation Restoration in Spanish Customer Support Transcripts using Transfer Learning
Title（参考訳）: トランスファーラーニングを用いたスペイン語顧客支援文字の句読解
Authors: Xiliang Zhu, Shayna Gardiner, David Rossouw, Tere Rold\'an, Simon Corston-Oliver
Abstract要約: 本稿では,リアルタイムの顧客支援転写サービスのために設計されたスペイン語句読点復元システムを提案する。顧客サポート領域におけるスペイン文字のデータの分散性に対処するために、トランスファーラーニングに基づく2つの戦略を導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automatic Speech Recognition (ASR) systems typically produce unpunctuated transcripts that have poor readability. In addition, building a punctuation restoration system is challenging for low-resource languages, especially for domain-specific applications. In this paper, we propose a Spanish punctuation restoration system designed for a real-time customer support transcription service. To address the data sparsity of Spanish transcripts in the customer support domain, we introduce two transfer-learning-based strategies: 1) domain adaptation using out-of-domain Spanish text data; 2) cross-lingual transfer learning leveraging in-domain English transcript data. Our experiment results show that these strategies improve the accuracy of the Spanish punctuation restoration system.
Abstract（参考訳）: 自動音声認識(ASR)システムは通常、可読性に乏しい不動文字を生成する。さらに,低リソース言語,特にドメイン固有のアプリケーションにおいて,句読点復元システムの構築は困難である。本稿では,リアルタイム顧客支援転写サービス用に設計されたスペイン語句読点復元システムを提案する。カスタマサポートドメインにおけるスペイン語写本のデータスパーシティに対処するために,トランスファーラーニングに基づく2つの戦略を紹介する。 1) ドメイン外スペイン語テキストデータを用いたドメイン適応 2) ドメイン内英語転写データを活用した言語間変換学習実験の結果,これらの手法により,スペインの句読点復元システムの精度が向上した。

関連論文リスト

LengClaro2023: A Dataset of Administrative Texts in Spanish with Plain Language adaptations [2.0318703477202003]
本稿では,スペイン語における法的行政文書のデータセットであるLengClaro2023を紹介する。スパニッシュ・ソーシャル・セキュリティのウェブサイトから最も頻繁に使用される手順に基づいて、それぞれのテキストに2つの簡易化された等価テキストを作成しました。
論文参考訳（メタデータ） (2025-06-06T09:52:52Z)
Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain [9.28989997114014]
スペイン語からアラゴネーズ(es-arg)、スペイン語からアラン語(es-arn)、スペイン語からアストゥリアン語(es-ast)の3つの翻訳作業に参加した。これら3つの翻訳タスクでは、多言語翻訳、正規化ドロップアウト、前方翻訳、前方翻訳、音声認識、アンサンブル学習など、深層トランスフォーマー・ビッグアーキテクチャのトレーニングに基づくニューラルマシン翻訳(NMT)モデルに対するトレーニング戦略を用いる。
論文参考訳（メタデータ） (2024-09-24T09:46:27Z)
A Tale of Two Languages: Large-Vocabulary Continuous Sign Language Recognition from Spoken Language Supervision [74.972172804514]
我々は,署名された言語と音声のテキスト間の共同埋め込み空間において,署名シーケンスと出力を抽出できるマルチタスクトランスフォーマーモデルCSLR2を導入する。新しいデータセットアノテーションは、6時間のテストビデオに対して、連続的なサインレベルアノテーションを提供する。私たちのモデルは、両方のタスクにおいて、過去の技術状況よりも大幅に優れています。
論文参考訳（メタデータ） (2024-05-16T17:19:06Z)
Resolving Transcription Ambiguity in Spanish: A Hybrid Acoustic-Lexical System for Punctuation Restoration [0.4821250031784094]
本稿では,スペイン語転写のためのハイブリッド音響-語彙句読解システムを提案する。実験の結果,提案システムは質問点のF1スコアと全体的な句読点回復を効果的に改善できることがわかった。
論文参考訳（メタデータ） (2024-02-05T21:05:35Z)
Transfer-Free Data-Efficient Multilingual Slot Labeling [82.02076369811402]
スロットラベリングはタスク指向対話(ToD)システムの中核的なコンポーネントである。固有データ不足の問題を緩和するために、多言語ToDに関する現在の研究は、十分な英語の注釈付きデータが常に利用可能であると仮定している。標準的な多言語文エンコーダを効果的なスロットラベリングに変換する2段階のスロットラベリング手法(TWOSL)を提案する。
論文参考訳（メタデータ） (2023-05-22T22:47:32Z)
Addressing Issues of Cross-Linguality in Open-Retrieval Question Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2022-01-26T19:27:32Z)
Cross-lingual Transfer for Speech Processing using Acoustic Language Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文参考訳（メタデータ） (2021-11-02T01:55:17Z)
Coarse-To-Fine And Cross-Lingual ASR Transfer [0.0]
翻訳学習は言語間でさえ困難を克服するために提案されている。チェコ語ASRの英語モデルを再利用して、より少ない関連言語で実験する。我々は、単語誤り率(WER)と同様に、トレーニング時間におけるかなりのエデュケーションを達成する。
論文参考訳（メタデータ） (2021-09-02T13:16:12Z)
Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文参考訳（メタデータ） (2020-06-22T10:28:38Z)
Sign Language Transformers: Joint End-to-end Sign Language Recognition and Translation [59.38247587308604]
本稿では,連続手話認識と翻訳を共同で学習するトランスフォーマーアーキテクチャを提案する。 RWTH-PHOENIX-Weather-2014Tデータセットの認識と翻訳性能の評価を行った。我々の翻訳ネットワークは、動画を音声言語に、光沢を音声言語翻訳モデルに、どちらよりも優れています。
論文参考訳（メタデータ） (2020-03-30T21:35:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。