論文の概要: Causal-Anticausal Decomposition of Speech using Complex Cepstrum for
Glottal Source Estimation
- arxiv url: http://arxiv.org/abs/1912.12843v1
- Date: Mon, 30 Dec 2019 08:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 02:50:42.500598
- Title: Causal-Anticausal Decomposition of Speech using Complex Cepstrum for
Glottal Source Estimation
- Title(参考訳): 声門音源推定のための複素ケプストラムを用いた音声の因果分解
- Authors: Thomas Drugman, Baris Bozkurt, Thierry Dutoit
- Abstract要約: 複雑なケプストラムの因果分解は, 声門流量推定に有効であることを示す。
提案手法は,音声品質分析に用いる可能性がある。
- 参考スコア(独自算出の注目度): 11.481208551940998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex cepstrum is known in the literature for linearly separating causal
and anticausal components. Relying on advances achieved by the Zeros of the
Z-Transform (ZZT) technique, we here investigate the possibility of using
complex cepstrum for glottal flow estimation on a large-scale database. Via a
systematic study of the windowing effects on the deconvolution quality, we show
that the complex cepstrum causal-anticausal decomposition can be effectively
used for glottal flow estimation when specific windowing criteria are met. It
is also shown that this complex cepstral decomposition gives similar glottal
estimates as obtained with the ZZT method. However, as complex cepstrum uses
FFT operations instead of requiring the factoring of high-degree polynomials,
the method benefits from a much higher speed. Finally in our tests on a large
corpus of real expressive speech, we show that the proposed method has the
potential to be used for voice quality analysis.
- Abstract(参考訳): 複素ケプストラムは、因果成分と対因果成分を線形に分離する文献で知られている。
本稿では,Z-Transform (ZZT) 手法のゼロによって達成された進歩を踏まえ,大規模データベース上でのスロットルフロー推定に複雑なケプストラムを用いることの可能性を検討する。
開窓効果の系統的研究により,特定の開窓基準が満たされた場合,複雑なケプストラムの因果分解を声門流量推定に有効に利用できることが示唆された。
また、この複雑なケプストラム分解は、ZZT法で得られたものと類似したスロットタル推定を与えることを示した。
しかし、複素ケプストラムは高次多項式の分解を必要とせず、FFT演算を使用するため、この手法ははるかに高速である。
最後に,実表現型音声の大規模コーパスを用いた実験において,提案手法が音声品質分析に有用であることを示す。
関連論文リスト
- RhythmFormer: Extracting rPPG Signals Based on Hierarchical Temporal
Periodic Transformer [17.751885452773983]
本稿では,r周期性の準周期特性を明示的に活用することにより,r信号の完全エンドツーエンド変換手法を提案する。
融合ステムはr特徴に対する自己注意を効果的に導くために提案され、既存の手法に容易に移行し、その性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2024-02-20T07:56:02Z) - Exploiting Causal Graph Priors with Posterior Sampling for Reinforcement Learning [86.22660674919746]
後部サンプリングは、環境の遷移力学に関する事前知識の活用を可能にする。
本稿では,環境変数に対する因果グラフとして先行値が与えられる新しい後方サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T14:16:04Z) - Analysis and Detection of Pathological Voice using Glottal Source
Features [18.80191660913831]
準閉鎖相 (QCP) のスロットル逆フィルタリング法を用いて, 声門音源の特徴を推定し, 声門音源の特徴を抽出した。
我々はQCPとZFFによって計算された震源波形からメル周波数ケプストラル係数(MFCC)を導出する。
特徴分析の結果,声門源には正常な声と病理的な声を識別する情報が含まれていることが明らかとなった。
論文 参考訳(メタデータ) (2023-09-25T12:14:25Z) - Decomposed Diffusion Sampler for Accelerating Large-Scale Inverse
Problems [64.29491112653905]
本稿では, 拡散サンプリング法とクリロフ部分空間法を相乗的に組み合わせた, 新規で効率的な拡散サンプリング手法を提案する。
具体的には、ツイーディの公式による分母化標本における接空間がクリロフ部分空間を成すならば、その分母化データによるCGは、接空間におけるデータの整合性更新を確実に維持する。
提案手法は,従来の最先端手法よりも80倍以上高速な推論時間を実現する。
論文 参考訳(メタデータ) (2023-03-10T07:42:49Z) - Discretization and Re-synthesis: an alternative method to solve the
Cocktail Party Problem [65.25725367771075]
この研究は、初めて合成に基づくアプローチがこの問題にうまく対応できることを示した。
具体的には,離散シンボルの認識に基づく音声分離/強調モデルを提案する。
離散シンボルの入力による合成モデルを利用することで、離散シンボル列の予測後、各ターゲット音声を再合成することができる。
論文 参考訳(メタデータ) (2021-12-17T08:35:40Z) - Regularization by Denoising Sub-sampled Newton Method for Spectral CT
Multi-Material Decomposition [78.37855832568569]
スペクトルctを用いたマルチマテリアル画像再構成のためのモデルベース最大後課題の解決法を提案する。
特に,プラグイン画像復号化機能に基づく正規化最適化問題について提案する。
スペクトルct材料分解の数値的および実験的結果を示す。
論文 参考訳(メタデータ) (2021-03-25T15:20:10Z) - Chirp Complex Cepstrum-based Decomposition for Asynchronous Glottal
Analysis [13.563526970105988]
本稿では, チャープ解析を取り入れた複雑なケプストラム分解法を提案する。
その結果,窓の位置がどこにあっても,声門流の信頼度を推定できることがわかった。
論文 参考訳(メタデータ) (2020-05-10T17:33:48Z) - Augmentation of the Reconstruction Performance of Fuzzy C-Means with an
Optimized Fuzzification Factor Vector [99.19847674810079]
Fuzzy C-Means (FCM) は情報グラニュラーを構成する最も頻繁に使用される手法の1つである。
本稿では, ファジィ化因子のベクトルを導入することにより, FCMに基づく脱顆粒機構を増強する。
合成データセットと公開データセットの両方で実験が完了し、提案手法が汎用データ再構成手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-04-13T04:17:30Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z) - Glottal Source Processing: from Analysis to Applications [35.80742217666323]
音声記録からの声門解析には、特定のより複雑な処理操作が必要である。
本総説では,Glottal Source Processing 用に設計された技術の概要を概説する。
論文 参考訳(メタデータ) (2019-12-29T08:13:58Z) - Complex Cepstrum-based Decomposition of Speech for Glottal Source
Estimation [11.481208551940998]
複雑なケプストラムは, スロットルフロー推定に有効であることを示す。
ZZT分解のために提示されたのと全く同じ原理に基づいて、ウィンドウ化を適用する必要がある。
論文 参考訳(メタデータ) (2019-12-29T07:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。