論文の概要: Domain-aware Neural Language Models for Speech Recognition
- arxiv url: http://arxiv.org/abs/2101.03229v2
- Date: Tue, 16 Feb 2021 19:42:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 11:31:24.384633
- Title: Domain-aware Neural Language Models for Speech Recognition
- Title(参考訳): 音声認識のためのドメイン認識ニューラルネットワークモデル
- Authors: Linda Liu, Yile Gu, Aditya Gourav, Ankur Gandhe, Shashank Kalmane,
Denis Filimonov, Ariya Rastrow, Ivan Bulyko
- Abstract要約: 本論文では,セカンドパスにおけるドメインアダプテーションに適したドメインアウェアレスコリングフレームワークを提案する。
このフレームワークは、単語誤り率を最大2.4%向上させ、単語エラー率を3つのドメインで最大4.1%向上させる。
- 参考スコア(独自算出の注目度): 6.9562992384413915
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As voice assistants become more ubiquitous, they are increasingly expected to
support and perform well on a wide variety of use-cases across different
domains. We present a domain-aware rescoring framework suitable for achieving
domain-adaptation during second-pass rescoring in production settings. In our
framework, we fine-tune a domain-general neural language model on several
domains, and use an LSTM-based domain classification model to select the
appropriate domain-adapted model to use for second-pass rescoring. This
domain-aware rescoring improves the word error rate by up to 2.4% and slot word
error rate by up to 4.1% on three individual domains -- shopping, navigation,
and music -- compared to domain general rescoring. These improvements are
obtained while maintaining accuracy for the general use case.
- Abstract(参考訳): 音声アシスタントがよりユビキタスになるにつれて、さまざまなドメインにわたるさまざまなユースケースのサポートとパフォーマンスが期待されている。
本稿では,本番環境における第2パスリコーリング時のドメイン適応を実現するのに適したドメイン認識リコーリングフレームワークを提案する。
本フレームワークでは,複数のドメイン上のドメイン汎用ニューラルネットワークモデルを微調整し,LSTMに基づくドメイン分類モデルを用いて,第2パス再構成に使用する適切なドメイン適応モデルを選択する。
このドメイン認識のリスコリングは、ドメイン一般リスコリングと比較して、ワードエラー率を最大2.4%改善し、スロットワードエラー率を最大4.1%向上させる。
これらの改善は、一般的なユースケースの精度を維持しながら得られる。
関連論文リスト
- ReMask: A Robust Information-Masking Approach for Domain Counterfactual
Generation [16.275230631985824]
ドメインのカウンターファクト生成は、テキストをソースドメインから特定のターゲットドメインに変換することを目的としています。
我々は、周波数とアテンションノルムに基づくマスキングを含む3段階のドメイン難読化アプローチを用いて、ドメイン固有のキューをマスキングし、ドメインの一般的なコンテキストを復元する。
本モデルは, 対向領域適応設定における平均精度を1.4%向上させることにより, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2023-05-04T14:19:02Z) - Domain-General Crowd Counting in Unseen Scenarios [25.171343652312974]
群集データ間のドメインシフトは、群集数モデルが目に見えないシナリオに一般化するのを著しく妨げます。
ソースドメインを複数のサブドメインに分割する動的サブドメイン分割方式を提案する。
画像特徴におけるドメイン固有情報からドメイン不変情報を切り離すために、ドメイン不変および-特定のクラウドメモリモジュールを設計する。
論文 参考訳(メタデータ) (2022-12-05T19:52:28Z) - Domain Agnostic Few-shot Learning for Speaker Verification [13.216510568611335]
本稿では,新しいユーザと新しいドメインの分散シフトに取り組むための,数ショットのドメイン一般化フレームワークを提案する。
我々のフレームワークはドメイン固有のネットワークと、特定のドメインと組み合わせたドメインの専門家であるドメイン集約ネットワークで構成されています。
論文 参考訳(メタデータ) (2022-06-28T02:22:47Z) - Forget Less, Count Better: A Domain-Incremental Self-Distillation
Learning Benchmark for Lifelong Crowd Counting [51.44987756859706]
オフザシェルフ法は複数のドメインを扱うのにいくつかの欠点がある。
生涯クラウドカウンティングは、壊滅的な忘れを緩和し、一般化能力を改善することを目的としている。
論文 参考訳(メタデータ) (2022-05-06T15:37:56Z) - TAL: Two-stream Adaptive Learning for Generalizable Person
Re-identification [115.31432027711202]
我々は、ドメイン固有性とドメイン不変性の両方が、re-idモデルの一般化能力の向上に不可欠であると主張する。
これら2種類の情報を同時にモデル化するために,2ストリーム適応学習 (TAL) を命名した。
我々のフレームワークは、単一ソースとマルチソースの両方のドメイン一般化タスクに適用できる。
論文 参考訳(メタデータ) (2021-11-29T01:27:42Z) - Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。
一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-11-25T12:02:57Z) - Domain2Vec: Domain Embedding for Unsupervised Domain Adaptation [56.94873619509414]
従来の教師なしドメイン適応は、限られた数のドメイン間の知識伝達を研究する。
本稿では,特徴不整合とグラム行列の連成学習に基づいて,視覚領域のベクトル表現を提供する新しいDomain2Vecモデルを提案する。
我々の埋め込みは、異なるドメイン間の視覚的関係に関する直感と一致するドメイン類似性を予測できることを示した。
論文 参考訳(メタデータ) (2020-07-17T22:05:09Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z) - Multi-Domain Spoken Language Understanding Using Domain- and Task-Aware
Parameterization [78.93669377251396]
音声言語理解は、各ドメインでトレーニングデータのセットが利用できる教師付き学習問題として対処されてきた。
既存の1つのアプローチは、ドメイン間の共同トレーニングに共有パラメータを使用して、マルチドメイン学習を行うことによって、この問題を解決する。
本稿では,ドメイン固有モデルパラメータとタスク固有モデルパラメータを用いて,この手法のパラメータ化を改善することを提案する。
論文 参考訳(メタデータ) (2020-04-30T15:15:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。