論文の概要: PyChain: A Fully Parallelized PyTorch Implementation of LF-MMI for
End-to-End ASR
- arxiv url: http://arxiv.org/abs/2005.09824v1
- Date: Wed, 20 May 2020 02:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 05:59:03.890486
- Title: PyChain: A Fully Parallelized PyTorch Implementation of LF-MMI for
End-to-End ASR
- Title(参考訳): PyChain: エンドツーエンドASRのためのLF-MMIの完全並列化PyTorch実装
- Authors: Yiwen Shao, Yiming Wang, Daniel Povey, Sanjeev Khudanpur
- Abstract要約: PyChainは、カルディ自動音声認識(ASR)ツールキットにおいて、いわゆるエンフィチェーンモデルのための、エンドツーエンドの格子フリー最大相互情報(LF-MMI)トレーニングの実装である。
他のPyTorchやKaldiベースのASRツールキットとは異なり、PyChainは可能な限り柔軟で軽量に設計されている。
- 参考スコア(独自算出の注目度): 65.20342293605472
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present PyChain, a fully parallelized PyTorch implementation of end-to-end
lattice-free maximum mutual information (LF-MMI) training for the so-called
\emph{chain models} in the Kaldi automatic speech recognition (ASR) toolkit.
Unlike other PyTorch and Kaldi based ASR toolkits, PyChain is designed to be as
flexible and light-weight as possible so that it can be easily plugged into new
ASR projects, or other existing PyTorch-based ASR tools, as exemplified
respectively by a new project PyChain-example, and Espresso, an existing
end-to-end ASR toolkit. PyChain's efficiency and flexibility is demonstrated
through such novel features as full GPU training on numerator/denominator
graphs, and support for unequal length sequences. Experiments on the WSJ
dataset show that with simple neural networks and commonly used machine
learning techniques, PyChain can achieve competitive results that are
comparable to Kaldi and better than other end-to-end ASR systems.
- Abstract(参考訳): 我々は、カルディ自動音声認識(ASR)ツールキットにおいて、いわゆる「emph{chain model}」のためのLF-MMIトレーニングを完全並列化したPyTorch実装であるPyChainを提案する。
他のPyTorchおよびKaldiベースのASRツールキットとは異なり、PyChainは可能な限り柔軟で軽量に設計されており、新しいプロジェクトであるPyChain-exampleと既存のエンドツーエンドのASRツールキットであるEspressoによって、新しいASRプロジェクトや他の既存のPyTorchベースのASRツールに簡単に接続できるように設計されている。
PyChainの効率性と柔軟性は、数値/デノミネータグラフのフルGPUトレーニング、不等長シーケンスのサポートなど、新しい機能によって実証されている。
wsjデータセットでの実験では、単純なニューラルネットワークと一般的な機械学習技術によって、pychainはkaldiと同等で、他のエンドツーエンドのasrシステムよりも優れた競合結果を得ることができる。
関連論文リスト
- shapiq: Shapley Interactions for Machine Learning [21.939393765684827]
Shapley Value(SV)とShapley Interactions(SI)を効率的に計算するために、最先端のアルゴリズムを統一したオープンソースのPythonパッケージであるshapiqを紹介する。
実践者にとって、Shapiqは、視覚変換器、言語モデル、XGBoost、TreeShap-IQによるLightGBMなど、モデルの予測において、任意の順序のフィーチャーインタラクションを説明および視覚化することができる。
論文 参考訳(メタデータ) (2024-10-02T15:16:53Z) - MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for
Accelerating Vision-Language Transformer [66.71930982549028]
VLT(Vision-Language Transformer)は近年大きな成功を収めている。
各種VLTの高速化を目的としたマルチモーダルアライメント誘導動的トーケンプルーニング(MADTP)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-05T14:13:50Z) - Sig-Networks Toolkit: Signature Networks for Longitudinal Language
Modelling [14.619019557308807]
我々は、縦長言語モデリングのためのオープンソースの、ピンプインストール可能なツールキット、Sig-Networksを提案する。
中心的な焦点は署名に基づくニューラルネットワークモデルの導入であり、これは最近、時間的タスクの成功を示している。
入門ビデオを備えたPyTorchパッケージとしてツールキットをリリースし、プレプロセスとモデリングのためのGitリポジトリに、モデル化されたNLPタスクのサンプルノートを含めます。
論文 参考訳(メタデータ) (2023-12-06T14:34:30Z) - PyPOTS: A Python Toolbox for Data Mining on Partially-Observed Time
Series [0.0]
PyPOTSは、部分的に保存された時系列のデータマイニングと分析に特化した、オープンソースのPythonライブラリである。
これは、計算、分類、クラスタリング、予測の4つのタスクに分類される多様なアルゴリズムに容易にアクセスできる。
論文 参考訳(メタデータ) (2023-05-30T07:57:05Z) - Interpretable Machine Learning for Science with PySR and
SymbolicRegression.jl [0.0]
PySRは、実用的なシンボルレグレッションのためのオープンソースライブラリである。
高性能な分散バックエンド、フレキシブルな検索アルゴリズム、深層学習パッケージとのインターフェース上に構築されている。
このソフトウェアを説明する際には,科学における記号回帰アルゴリズムの適用性を定量化するために,新しいベンチマーク"EmpiricalBench"を導入する。
論文 参考訳(メタデータ) (2023-05-02T16:31:35Z) - Continual Inference: A Library for Efficient Online Inference with Deep
Neural Networks in PyTorch [97.03321382630975]
Continual Inferenceは、PyTorchでContinuous Inference Networks(CIN)を実装するPythonライブラリである。
我々は、CINとその実装を包括的に紹介し、現代のディープラーニングのための複雑なモジュールを構成するためのベストプラクティスとコード例を提供します。
論文 参考訳(メタデータ) (2022-04-07T13:03:09Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - ExKaldi-RT: A Real-Time Automatic Speech Recognition Extension Toolkit
of Kaldi [7.9019242334556745]
本稿では,Kaldi と Python 言語をベースとしたオンライン ASR ツールキット "ExKaldi-RT" について述べる。
ExKaldi-RTは、リアルタイムオーディオストリームパイプラインの提供、音響的特徴の抽出、リモート接続によるパケット送信、ニューラルネットワークによる音響確率の推定、オンラインデコーディングのためのツールを提供する。
論文 参考訳(メタデータ) (2021-04-03T12:16:19Z) - PyHealth: A Python Library for Health Predictive Models [53.848478115284195]
PyHealthは、医療データ上で様々な予測モデルを開発するためのオープンソースのPythonツールボックスである。
データ前処理モジュールにより、複雑なヘルスケアデータセットを機械学習フレンドリーなフォーマットに変換できます。
予測モデリングモジュールは、確立されたアンサンブルツリーとディープニューラルネットワークベースのアプローチを含む30以上の機械学習モデルを提供します。
論文 参考訳(メタデータ) (2021-01-11T22:02:08Z) - Einsum Networks: Fast and Scalable Learning of Tractable Probabilistic
Circuits [99.59941892183454]
我々は,PC用の新しい実装設計であるEinsum Networks (EiNets)を提案する。
中心となるのは、E EiNets は単一のモノリシックな einsum-operation に多数の算術演算を組み合わせている。
本稿では,PCにおける予測最大化(EM)の実装を,自動微分を利用した簡易化が可能であることを示す。
論文 参考訳(メタデータ) (2020-04-13T23:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。