論文の概要: Refining a Deep Learning-based Formant Tracker using Linear Prediction
Methods
- arxiv url: http://arxiv.org/abs/2308.09051v1
- Date: Thu, 17 Aug 2023 15:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 16:16:06.918333
- Title: Refining a Deep Learning-based Formant Tracker using Linear Prediction
Methods
- Title(参考訳): 線形予測法を用いた深層学習型フォルマントトラッカーの精製
- Authors: Paavo Alku, Sudarsana Reddy Kadiri, Dhananjaya Gowda
- Abstract要約: 2つの洗練されたDeepFormantsトラッカーは、オリジナルのDeepFormantsと、5つの既知の伝統的なトラッカーと比較された。
その結果、データ駆動型DeepFormantsトラッカーは従来のトラッカーよりも優れており、QCP-FB分析を用いてDeepFormantsが予測したフォルマントを精製することで最高の性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 19.88212227822267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, formant tracking is investigated by refining the formants
tracked by an existing data-driven tracker, DeepFormants, using the formants
estimated in a model-driven manner by linear prediction (LP)-based methods. As
LP-based formant estimation methods, conventional covariance analysis (LP-COV)
and the recently proposed quasi-closed phase forward-backward (QCP-FB) analysis
are used. In the proposed refinement approach, the contours of the three lowest
formants are first predicted by the data-driven DeepFormants tracker, and the
predicted formants are replaced frame-wise with local spectral peaks shown by
the model-driven LP-based methods. The refinement procedure can be plugged into
the DeepFormants tracker with no need for any new data learning. Two refined
DeepFormants trackers were compared with the original DeepFormants and with
five known traditional trackers using the popular vocal tract resonance (VTR)
corpus. The results indicated that the data-driven DeepFormants trackers
outperformed the conventional trackers and that the best performance was
obtained by refining the formants predicted by DeepFormants using QCP-FB
analysis. In addition, by tracking formants using VTR speech that was corrupted
by additive noise, the study showed that the refined DeepFormants trackers were
more resilient to noise than the reference trackers. In general, these results
suggest that LP-based model-driven approaches, which have traditionally been
used in formant estimation, can be combined with a modern data-driven tracker
easily with no further training to improve the tracker's performance.
- Abstract(参考訳): 本研究では,既存のデータ駆動型トラッカーであるDeepFormantsによって追跡されたフォルマントを,線形予測(LP)法によるモデル駆動方式で推定したホルマントを用いて精製することにより,ホルマント追跡を検討した。
LPに基づくホルマント推定法として,従来の共分散解析 (LP-COV) と最近提案された準閉相フォワードバックワード解析 (QCP-FB) を用いる。
提案手法では,データ駆動型ディープフォーマントトラッカにより3つの最低フォーマントの輪郭を最初に予測し,予測したフォーマントをモデル駆動型lp法で示される局所スペクトルピークにフレーム単位で置き換える。
改善手順は、新しいデータ学習を必要とせずに、DeepFormantsトラッカーにプラグインできる。
2つの改良されたDeepFormantsトラッカーをオリジナルのDeepFormantsと比較し、一般的な声道共鳴(VTR)コーパスを使用した5つの伝統的なトラッカーと比較した。
その結果、データ駆動型DeepFormantsトラッカーは従来のトラッカーよりも優れており、QCP-FB分析を用いてDeepFormantsが予測したフォルマントを精製することで最高の性能が得られることがわかった。
さらに,付加雑音により劣化したVTR音声を用いたホルマント追跡により,改良したDeepFormantsトラッカーは基準トラッカーよりも耐雑音性が高いことを示した。
これらの結果から,従来はフォルマント推定に用いられてきたlpベースモデル駆動アプローチは,現代のデータ駆動トラッカと組み合わせることで,トラッカのパフォーマンス向上のためのさらなるトレーニングが不要になる可能性が示唆された。
関連論文リスト
- Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection [16.21235742118949]
本稿では,よく訓練された視覚言語モデル(VLM)を一般深度検出に活用する手法を提案する。
データ摂動によるモデル予測を操作するモデル再プログラミングパラダイムにより,本手法は事前学習したVLMモデルを再プログラムすることができる。
私たちの優れたパフォーマンスは、トレーニング可能なパラメータのコストを低減し、現実世界のアプリケーションにとって有望なアプローチになります。
論文 参考訳(メタデータ) (2024-09-04T12:46:30Z) - Time-Varying Quasi-Closed-Phase Analysis for Accurate Formant Tracking
in Speech Signals [17.69029813982043]
音声信号におけるフォルマントの正確な推定と追跡のための新しい手法を提案する。
TVQCP分析はホルマント推定と追跡を改善する3つのアプローチを組み合わせる。
提案手法は,従来のフォーマント追跡ツールよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-31T08:30:20Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Site-specific Deep Learning Path Loss Models based on the Method of
Moments [7.894490919875104]
本稿では,農村部におけるEM波伝搬予測問題に応用した深層学習モデルについて述べる。
表面積分方程式の定式化を用いて、ランダムに生成された1次元地形プロファイル上で計算された経路損失を含む合成トレーニングデータを生成する。
これらのモデルは、トレーニングデータを作成するのと同じ統計プロセスを用いて生成されたテストプロファイルに適用した場合に優れた一致を示し、実生活問題に適用する場合に非常に優れた精度を示す。
論文 参考訳(メタデータ) (2023-02-02T12:29:38Z) - A Provably Efficient Model-Free Posterior Sampling Method for Episodic
Reinforcement Learning [50.910152564914405]
強化学習のための既存の後方サンプリング手法は、モデルベースであるか、線形MDPを超える最悪の理論的保証がないかによって制限される。
本稿では,理論的保証を伴うより一般的な補足的強化学習問題に適用可能な,後部サンプリングのモデルフリーな新しい定式化を提案する。
論文 参考訳(メタデータ) (2022-08-23T12:21:01Z) - Transforming Model Prediction for Tracking [109.08417327309937]
トランスフォーマーは、誘導バイアスの少ないグローバルな関係を捉え、より強力なターゲットモデルの予測を学ぶことができる。
提案したトラッカーをエンドツーエンドにトレーニングし、複数のトラッカーデータセットに関する総合的な実験を行うことで、その性能を検証する。
我々のトラッカーは3つのベンチマークで新しい技術状態を設定し、挑戦的なLaSOTデータセットで68.5%のAUCを達成した。
論文 参考訳(メタデータ) (2022-03-21T17:59:40Z) - Formant Tracking Using Quasi-Closed Phase Forward-Backward Linear
Prediction Analysis and Deep Neural Networks [48.98397553726019]
動的プログラミング(DP)とディープニューラルネット(DNN)に基づくホルマントトラッキングの研究
6つの手法は線形予測(LP)アルゴリズム、重み付きLPアルゴリズム、最近開発された準閉相フォワード(QCP-FB)法である。
QCP-FBに基づく深層学習と信号処理の利点を組み合わせた新しいフォルマント追跡手法を提案する。
論文 参考訳(メタデータ) (2022-01-05T10:27:07Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Multi-object Tracking via End-to-end Tracklet Searching and Ranking [11.46601533985954]
本稿では,オンライン・エンドツーエンドのトラックレット探索学習プロセスを導入することで,トラックレットの一貫性を最適化する新しい手法を提案する。
トラックレットの出現エンコーダとしてのシーケンスモデルにより、トラッカーは従来のトラックレットアソシエーションベースラインから顕著な性能向上を達成する。
提案手法は,公開検出とオンライン設定を用いたMOT1517チャレンジベンチマークの最先端性も達成している。
論文 参考訳(メタデータ) (2020-03-04T18:46:01Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。