論文の概要: Neural Speech Synthesis on a Shoestring: Improving the Efficiency of
LPCNet
- arxiv url: http://arxiv.org/abs/2202.11169v1
- Date: Tue, 22 Feb 2022 20:42:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 16:24:51.300411
- Title: Neural Speech Synthesis on a Shoestring: Improving the Efficiency of
LPCNet
- Title(参考訳): 靴紐を用いたニューラル音声合成:lpcnetの効率向上
- Authors: Jean-Marc Valin, Umut Isik, Paris Smaragdis, Arvindh Krishnaswamy
- Abstract要約: 我々はLPCNetの効率を改善し、多種多様なデバイスで利用できるようにする。
2.5倍高速に動作しながら, 合成品質の向上を実証した。
結果として得られるオープンソースのLPCNetアルゴリズムは、既存のほとんどの携帯電話でリアルタイムなニューラルシンセシスを実行でき、組み込みデバイスでも使用することができる。
- 参考スコア(独自算出の注目度): 35.44634252321666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural speech synthesis models can synthesize high quality speech but
typically require a high computational complexity to do so. In previous work,
we introduced LPCNet, which uses linear prediction to significantly reduce the
complexity of neural synthesis. In this work, we further improve the efficiency
of LPCNet -- targeting both algorithmic and computational improvements -- to
make it usable on a wide variety of devices. We demonstrate an improvement in
synthesis quality while operating 2.5x faster. The resulting open-source LPCNet
algorithm can perform real-time neural synthesis on most existing phones and is
even usable in some embedded devices.
- Abstract(参考訳): ニューラル音声合成モデルは高品質な音声を合成できるが、通常は高い計算量を必要とする。
従来の研究では,線形予測を用いてニューラル合成の複雑さを著しく低減するLPCNetを導入していた。
本研究では,LPCNetのアルゴリズム的および計算的改善をターゲットとした効率をさらに向上し,多種多様なデバイスで使用できるようにする。
2.5倍高速動作における合成品質の向上を示す。
結果として得られるオープンソースのLPCNetアルゴリズムは、既存のほとんどの携帯電話でリアルタイムなニューラル合成を実行でき、組み込みデバイスでも使用することができる。
関連論文リスト
- COOL: Efficient and Reliable Chain-Oriented Objective Logic with Neural Networks Feedback Control for Program Synthesis [0.0]
論理の連鎖(CoL)は、合成段階を連鎖に整理し、合成過程を正確に制御する。
我々のアプローチは、合成をモジュール化し、ニューラルネットワークの誤予測の影響を軽減します。
論文 参考訳(メタデータ) (2024-10-02T13:02:17Z) - INVICTUS: Optimizing Boolean Logic Circuit Synthesis via Synergistic
Learning and Search [18.558280701880136]
最先端論理合成アルゴリズムは、多数の論理最小化を持つ。
INVICTUSは、以前に見られた設計のトレーニングデータセットに基づいて、論理最小化のシーケンスを生成する。
論文 参考訳(メタデータ) (2023-05-22T15:50:42Z) - AISYN: AI-driven Reinforcement Learning-Based Logic Synthesis Framework [0.8356765961526955]
我々は人工知能(AI)と強化学習(RL)アルゴリズムがこの問題の解決に役立つと考えている。
オープンソースのベンチマーク回路と産業用ベンチマーク回路を併用した実験により,論理合成最適化関数をAI駆動にすることで,面積,遅延,電力といった重要な指標を大幅に改善できることが判明した。
論文 参考訳(メタデータ) (2023-02-08T00:55:24Z) - Machine-Learning-Optimized Perovskite Nanoplatelet Synthesis [55.41644538483948]
総合成量200のCsPbBr3ナノプレート(NPL)の品質向上のためのアルゴリズムを開発した。
このアルゴリズムは、前駆率に基づいて、NPL分散のPL放出最大値を予測することができる。
論文 参考訳(メタデータ) (2022-10-18T11:54:11Z) - NeuralDPS: Neural Deterministic Plus Stochastic Model with Multiband
Excitation for Noise-Controllable Waveform Generation [67.96138567288197]
本稿では,高い音声品質を保ち,高い合成効率とノイズ制御性を得ることができるニューラルDPSというニューラルボコーダを提案する。
ウェーブネットのボコーダより少なくとも280倍高速な波形を生成する。
また、単一コア上でのWaveGANの合成効率よりも28%高速である。
論文 参考訳(メタデータ) (2022-03-05T08:15:29Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - PAC-learning gains of Turing machines over circuits and neural networks [1.4502611532302039]
私達は最低記述の長さの原則を持って来ることができるサンプル効率の潜在的な利益を研究します。
我々はチューリングマシンを用いて普遍的なモデルと回路を表現する。
回路の複雑さと密接性における古典的オープン問題との密接な関係を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-23T17:03:10Z) - Bunched LPCNet : Vocoder for Low-cost Neural Text-To-Speech Systems [18.480490920718367]
LPCNetは、線形予測とディープニューラルネットワークモジュールを組み合わせて計算複雑性を低くする効率的なボコーダである。
低コストなLPCNetボコーダベースニューラルテキスト音声合成システム(TTS)を目指して,その複雑さをさらに軽減する2つの手法を提案する。
論文 参考訳(メタデータ) (2020-08-11T08:15:45Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z) - Einsum Networks: Fast and Scalable Learning of Tractable Probabilistic
Circuits [99.59941892183454]
我々は,PC用の新しい実装設計であるEinsum Networks (EiNets)を提案する。
中心となるのは、E EiNets は単一のモノリシックな einsum-operation に多数の算術演算を組み合わせている。
本稿では,PCにおける予測最大化(EM)の実装を,自動微分を利用した簡易化が可能であることを示す。
論文 参考訳(メタデータ) (2020-04-13T23:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。