論文の概要: Self-Normalized Importance Sampling for Neural Language Modeling
- arxiv url: http://arxiv.org/abs/2111.06310v1
- Date: Thu, 11 Nov 2021 16:57:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-12 15:04:28.368318
- Title: Self-Normalized Importance Sampling for Neural Language Modeling
- Title(参考訳): ニューラルネットワークモデリングのための自己Normalized Importance Smpling
- Authors: Zijian Yang, Yingbo Gao, Alexander Gerstenberger, Jintao Jiang, Ralf
Schl\"uter, Hermann Ney
- Abstract要約: 本研究では, 自己正規化重要度サンプリングを提案し, これまでの研究と比較すると, 本研究で考慮された基準は自己正規化されており, さらに修正を行う必要はない。
提案する自己正規化重要度サンプリングは,研究指向と生産指向の両方の自動音声認識タスクにおいて競合することを示す。
- 参考スコア(独自算出の注目度): 97.96857871187052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To mitigate the problem of having to traverse over the full vocabulary in the
softmax normalization of a neural language model, sampling-based training
criteria are proposed and investigated in the context of large vocabulary
word-based neural language models. These training criteria typically enjoy the
benefit of faster training and testing, at a cost of slightly degraded
performance in terms of perplexity and almost no visible drop in word error
rate. While noise contrastive estimation is one of the most popular choices,
recently we show that other sampling-based criteria can also perform well, as
long as an extra correction step is done, where the intended class posterior
probability is recovered from the raw model outputs. In this work, we propose
self-normalized importance sampling. Compared to our previous work, the
criteria considered in this work are self-normalized and there is no need to
further conduct a correction step. Compared to noise contrastive estimation,
our method is directly comparable in terms of complexity in application.
Through self-normalized language model training as well as lattice rescoring
experiments, we show that our proposed self-normalized importance sampling is
competitive in both research-oriented and production-oriented automatic speech
recognition tasks.
- Abstract(参考訳): ニューラルネットワークモデルのソフトマックス正規化において,全語彙を横切ることの問題を緩和するために,サンプルベーストレーニング基準を提案し,大語彙語ベースニューラルネットワークモデルを用いて検討した。
これらのトレーニング基準は一般的に、より高速なトレーニングとテストの利点を享受する。
ノイズコントラスト推定は最も一般的な選択肢の1つであるが,近年では,原モデルの出力から意図したクラス後続確率を復元する追加補正ステップを施す限り,他のサンプリングベース基準も良好に動作可能であることを示す。
本研究では,自己正規化重要度サンプリングを提案する。
これまでの研究と比較すると,本研究で考慮された基準は自己正規化されており,さらなる修正を行う必要はない。
ノイズコントラスト推定と比較すると,本手法はアプリケーションの複雑さの観点から直接比較できる。
自己正規化言語モデルトレーニングと格子再構成実験により,本提案の自己正規化重要度サンプリングは,研究指向と生産指向の両方の自動音声認識タスクにおいて競合することを示した。
関連論文リスト
- Semi-supervised Learning For Robust Speech Evaluation [30.593420641501968]
音声評価は、自動モデルを用いて学習者の口頭習熟度を測定する。
本稿では,半教師付き事前学習と客観的正規化を活用することで,このような課題に対処することを提案する。
アンカーモデルは、発音の正しさを予測するために擬似ラベルを用いて訓練される。
論文 参考訳(メタデータ) (2024-09-23T02:11:24Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - Improving Pre-trained Language Model Fine-tuning with Noise Stability
Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。
具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。
提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-12T04:42:49Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - On Sampling-Based Training Criteria for Neural Language Modeling [97.35284042981675]
我々はモンテカルロサンプリング、重要サンプリング、補償部分和と呼ばれる新しい方法、およびノイズコントラスト推定を検討する。
対象のクラス後部確率を補正しさえすれば,これらすべてのサンプリング手法が同等に動作可能であることを示す。
Switchboard と LibriSpeech における言語モデリングと音声認識の実験結果が,我々の主張を支持した。
論文 参考訳(メタデータ) (2021-04-21T12:55:52Z) - Exploring Fine-tuning Techniques for Pre-trained Cross-lingual Models
via Continual Learning [74.25168207651376]
訓練済みの言語モデルから下流の言語間タスクへの微調整は、有望な結果を示している。
ダウンストリームタスクに微調整する場合、継続学習を活用して、事前学習したモデルの言語間能力を維持する。
提案手法は、ゼロショット言語間タグ付けや名前付きエンティティ認識タスクにおいて、他の微調整ベースラインよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2020-04-29T14:07:18Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。