論文の概要: Complex Cepstrum-based Decomposition of Speech for Glottal Source
Estimation
- arxiv url: http://arxiv.org/abs/1912.12602v1
- Date: Sun, 29 Dec 2019 07:58:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 08:04:35.062064
- Title: Complex Cepstrum-based Decomposition of Speech for Glottal Source
Estimation
- Title(参考訳): 声門音源推定のための複素ケプストラムに基づく音声の分解
- Authors: Thomas Drugman, Baris Bozkurt, Thierry Dutoit
- Abstract要約: 複雑なケプストラムは, スロットルフロー推定に有効であることを示す。
ZZT分解のために提示されたのと全く同じ原理に基づいて、ウィンドウ化を適用する必要がある。
- 参考スコア(独自算出の注目度): 11.481208551940998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homomorphic analysis is a well-known method for the separation of
non-linearly combined signals. More particularly, the use of complex cepstrum
for source-tract deconvolution has been discussed in various articles. However
there exists no study which proposes a glottal flow estimation methodology
based on cepstrum and reports effective results. In this paper, we show that
complex cepstrum can be effectively used for glottal flow estimation by
separating the causal and anticausal components of a windowed speech signal as
done by the Zeros of the Z-Transform (ZZT) decomposition. Based on exactly the
same principles presented for ZZT decomposition, windowing should be applied
such that the windowed speech signals exhibit mixed-phase characteristics which
conform the speech production model that the anticausal component is mainly due
to the glottal flow open phase. The advantage of the complex cepstrum-based
approach compared to the ZZT decomposition is its much higher speed.
- Abstract(参考訳): ホモモルフィック解析は非線形結合信号の分離法としてよく知られている。
より具体的には、ソーストラクションのデコンボリューションにおける複素ケプストラムの使用について様々な記事で議論されている。
しかし,ケプストラムに基づくスロットタルフロー推定手法を提案し,有効な結果を報告する研究は存在しない。
本稿では,Z-Transform (ZZT)分解の零点によるウィンドウ音声信号の因果成分と反因果成分を分離することにより,複雑なケプストラムをスロットルフロー推定に有効に利用できることを示す。
ZZT分解のために提示されたのと全く同じ原理に基づいて、窓面の音声信号が、声門流開相が主な原因である音声生成モデルに適合する混合位相特性を示すようにウィンドウ化を適用する必要がある。
ZZT分解と比較して複雑なケプストラムベースのアプローチの利点は、はるかに高速である。
関連論文リスト
- An approach to robust ICP initialization [77.45039118761837]
本稿では,厳密な変換に伴う乱れのない点群に対応するために,ICPアルゴリズムを初期化する手法を提案する。
我々はノイズに対する我々のアプローチの頑健さに限界を導出し、数値実験により我々の理論的な知見を裏付ける。
論文 参考訳(メタデータ) (2022-12-10T16:27:25Z) - Discretization and Re-synthesis: an alternative method to solve the
Cocktail Party Problem [65.25725367771075]
この研究は、初めて合成に基づくアプローチがこの問題にうまく対応できることを示した。
具体的には,離散シンボルの認識に基づく音声分離/強調モデルを提案する。
離散シンボルの入力による合成モデルを利用することで、離散シンボル列の予測後、各ターゲット音声を再合成することができる。
論文 参考訳(メタデータ) (2021-12-17T08:35:40Z) - Lattice partition recovery with dyadic CART [79.96359947166592]
我々は、$d$次元格子上の加法ガウス雑音によって破損したピースワイド定値信号について検討する。
この形式のデータは、多くのアプリケーションで自然に発生し、統計処理や信号処理の文献において、信号の検出やテスト、ノイズの除去、推定といったタスクが広く研究されている。
本稿では,未知の信号の一貫性領域によって誘導される格子の分割を推定する,分割回復の問題について考察する。
我々は、DCARTベースの手順が、下位分割を$sigma2 k*の順序で一貫して推定することを証明した。
論文 参考訳(メタデータ) (2021-05-27T23:41:01Z) - Glottal source estimation robustness: A comparison of sensitivity of
voice source estimation techniques [11.97036509133719]
本稿では,音声波形から直接音源を推定する問題に対処する。
ADR(Anticausality Dominated Regions)に基づく新しい原理は、スロットル開相を推定するために用いられる。
論文 参考訳(メタデータ) (2020-05-24T08:13:47Z) - Chirp Complex Cepstrum-based Decomposition for Asynchronous Glottal
Analysis [13.563526970105988]
本稿では, チャープ解析を取り入れた複雑なケプストラム分解法を提案する。
その結果,窓の位置がどこにあっても,声門流の信頼度を推定できることがわかった。
論文 参考訳(メタデータ) (2020-05-10T17:33:48Z) - Residual-driven Fuzzy C-Means Clustering for Image Segmentation [152.609322951917]
画像分割のための残留駆動型ファジィC平均(FCM)について詳述する。
この枠組みに基づいて,混合雑音分布の重み付けによる重み付き$ell_2$-norm忠実度項を示す。
その結果、既存のFCM関連アルゴリズムよりも提案アルゴリズムの有効性と効率が優れていることが示された。
論文 参考訳(メタデータ) (2020-04-15T15:46:09Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z) - Residual-Sparse Fuzzy $C$-Means Clustering Incorporating Morphological
Reconstruction and Wavelet frames [146.63177174491082]
Fuzzy $C$-Means (FCM)アルゴリズムは、形態的再構成操作とタイトウェーブレットフレーム変換を組み込んでいる。
特徴集合とその理想値の間の残差に対して$ell_0$正規化項を付与することにより、改良されたFCMアルゴリズムを提案する。
合成, 医用, カラー画像に対する実験結果から, 提案アルゴリズムは効率的かつ効率的であり, 他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T10:00:03Z) - Theory inspired deep network for instantaneous-frequency extraction and
signal components recovery from discrete blind-source data [1.6758573326215689]
本稿では、未知の信号成分を回収する逆問題と周波数の抽出について考察する。
既存の分解法やアルゴリズムでは、この逆問題を解くことはできない。
本稿では、ブラインドソース信号の非一様サンプリングが可能な離散サンプルセットを直接ベースとしたディープニューラルネットワークの合成を提案する。
論文 参考訳(メタデータ) (2020-01-31T18:54:00Z) - Causal-Anticausal Decomposition of Speech using Complex Cepstrum for
Glottal Source Estimation [11.481208551940998]
複雑なケプストラムの因果分解は, 声門流量推定に有効であることを示す。
提案手法は,音声品質分析に用いる可能性がある。
論文 参考訳(メタデータ) (2019-12-30T08:12:03Z) - A Deterministic plus Stochastic Model of the Residual Signal for
Improved Parametric Speech Synthesis [11.481208551940998]
残差に対する決定論的プラスモデル(DSM)の適応を提案する。
提案手法はHMMベース音声合成器に組み込まれている。
その結果,男女ともに有意な改善が認められた。
論文 参考訳(メタデータ) (2019-12-29T07:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。