論文の概要: Chirp Complex Cepstrum-based Decomposition for Asynchronous Glottal
Analysis
- arxiv url: http://arxiv.org/abs/2005.04724v1
- Date: Sun, 10 May 2020 17:33:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 02:04:35.118800
- Title: Chirp Complex Cepstrum-based Decomposition for Asynchronous Glottal
Analysis
- Title(参考訳): チャープ錯体ケプストラムに基づく非同期声門解析のための分解
- Authors: Thomas Drugman, Thierry Dutoit
- Abstract要約: 本稿では, チャープ解析を取り入れた複雑なケプストラム分解法を提案する。
その結果,窓の位置がどこにあっても,声門流の信頼度を推定できることがわかった。
- 参考スコア(独自算出の注目度): 13.563526970105988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It was recently shown that complex cepstrum can be effectively used for
glottal flow estimation by separating the causal and anticausal components of
speech. In order to guarantee a correct estimation, some constraints on the
window have been derived. Among these, the window has to be synchronized on a
Glottal Closure Instant. This paper proposes an extension of the complex
cepstrum-based decomposition by incorporating a chirp analysis. The resulting
method is shown to give a reliable estimation of the glottal flow wherever the
window is located. This technique is then suited for its integration in usual
speech processing systems, which generally operate in an asynchronous way.
Besides its potential for automatic voice quality analysis is highlighted.
- Abstract(参考訳): 近年, 複雑なケプストラムを声門血流推定に有効に利用し, 音声の因果成分と反因果成分を分離できることが示されている。
正しい推定を保証するために、ウィンドウ上のいくつかの制約が導出された。
これらのうち、ウィンドウはGlottal Closure Instant上で同期する必要がある。
本稿では,チャープ解析を組み込んだ複素ケプストラムに基づく分解の拡張を提案する。
その結果, 窓のある場所において, 声門流れの信頼性の高い推定が可能となった。
この手法は通常の音声処理システムとの統合に適しており、一般的に非同期で動作する。
自動音声品質分析の可能性も強調されている。
関連論文リスト
- Self-Tuning Hamiltonian Monte Carlo for Accelerated Sampling [12.163119957680802]
ハミルトニアンモンテカルロシミュレーションは、積分の時間ステップと積分の回数に大きく依存する。
このようなパラメータを自動的に調整する適応型汎用フレームワークを提案する。
損失と自己相関時間との良好な対応が確立できることを示す。
論文 参考訳(メタデータ) (2023-09-24T09:35:25Z) - Bayesian estimation for collisional thermometry and time-optimal
holonomic quantum computation [0.0]
前半では、量子温度測定の問題にベイズ形式がどう導入できるかを考察する。
論文の最後の部分では、非断熱的ホロノミック計算の問題にアプローチする。
論文 参考訳(メタデータ) (2023-07-16T17:46:13Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Discretization and Re-synthesis: an alternative method to solve the
Cocktail Party Problem [65.25725367771075]
この研究は、初めて合成に基づくアプローチがこの問題にうまく対応できることを示した。
具体的には,離散シンボルの認識に基づく音声分離/強調モデルを提案する。
離散シンボルの入力による合成モデルを利用することで、離散シンボル列の予測後、各ターゲット音声を再合成することができる。
論文 参考訳(メタデータ) (2021-12-17T08:35:40Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Multi-Discriminator Sobolev Defense-GAN Against Adversarial Attacks for
End-to-End Speech Systems [78.5097679815944]
本稿では,最先端音声テキストシステムのためのエンドツーエンド攻撃に対する防御手法を提案する。
まず,短時間フーリエ変換を用いた2次元スペクトルを用いた音声信号の表現を行う。
第二に、スペクトログラム部分空間射影演算を用いて安全ベクトルを反復的に発見する。
第3に,ソボレフ積分確率計量で学習した新しいganアーキテクチャを用いて,このような安全なベクトルを持つスペクトログラムを合成する。
論文 参考訳(メタデータ) (2021-03-15T01:11:13Z) - Any-to-Many Voice Conversion with Location-Relative Sequence-to-Sequence
Modeling [61.351967629600594]
本稿では,非並列音声変換手法である非並列音声変換法(seq2seq)を提案する。
本手法では,ボトルネック特徴抽出器(BNE)とセック2セック合成モジュールを組み合わせる。
主観的および主観的評価は,提案手法が自然性と話者類似性の両方において優れた音声変換性能を有することを示す。
論文 参考訳(メタデータ) (2020-09-06T13:01:06Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z) - Causal-Anticausal Decomposition of Speech using Complex Cepstrum for
Glottal Source Estimation [11.481208551940998]
複雑なケプストラムの因果分解は, 声門流量推定に有効であることを示す。
提案手法は,音声品質分析に用いる可能性がある。
論文 参考訳(メタデータ) (2019-12-30T08:12:03Z) - Glottal Source Processing: from Analysis to Applications [35.80742217666323]
音声記録からの声門解析には、特定のより複雑な処理操作が必要である。
本総説では,Glottal Source Processing 用に設計された技術の概要を概説する。
論文 参考訳(メタデータ) (2019-12-29T08:13:58Z) - Complex Cepstrum-based Decomposition of Speech for Glottal Source
Estimation [11.481208551940998]
複雑なケプストラムは, スロットルフロー推定に有効であることを示す。
ZZT分解のために提示されたのと全く同じ原理に基づいて、ウィンドウ化を適用する必要がある。
論文 参考訳(メタデータ) (2019-12-29T07:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。