論文の概要: A comparative study of two-dimensional vocal tract acoustic modeling
based on Finite-Difference Time-Domain methods
- arxiv url: http://arxiv.org/abs/2102.04588v1
- Date: Tue, 9 Feb 2021 00:40:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 00:35:47.812516
- Title: A comparative study of two-dimensional vocal tract acoustic modeling
based on Finite-Difference Time-Domain methods
- Title(参考訳): 有限差分時間領域法による2次元声道音響モデルの比較検討
- Authors: Debasish Ray Mohapatra, Victor Zappi, Sidney Fels
- Abstract要約: 声道(VT)に対する2次元数値計算法は,低計算コストと正確な音波伝搬のバランスが良くなる。
我々は最近、2.5D VTDと呼ばれる新しい手法を提案し、2.5D VTDは既存の2D VTDアプローチを拡張した。
本稿では,まず,VTモデルの模擬音響出力を低解像度で2次元VTDと現実的な3次元FEMモデルと比較した。
- 参考スコア(独自算出の注目度): 2.8575516056239576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The two-dimensional (2D) numerical approaches for vocal tract (VT) modelling
can afford a better balance between the low computational cost and accurate
rendering of acoustic wave propagation. However, they require a high
spatio-temporal resolution in the numerical scheme for a precise estimation of
acoustic formants at the simulation run-time expense. We have recently proposed
a new VT acoustic modelling technique, known as the 2.5D Finite-Difference
Time-Domain (2.5D FDTD), which extends the existing 2D FDTD approach by adding
tube depth to its acoustic wave solver. In this work, first, the simulated
acoustic outputs of our new model are shown to be comparable with the 2D FDTD
and a realistic 3D FEM VT model at a low spatio-temporal resolution. Next, a
radiation model is developed by including a circular baffle around the VT as
head geometry. The transfer functions of the radiation model are analyzed using
five different vocal tract shapes for vowel sounds /a/, /e/, /i/, /o/ and /u/.
- Abstract(参考訳): 声道(VT)モデリングのための二次元(2次元)数値手法は,低計算コストと音波伝搬の正確なレンダリングとのバランスを向上することができる。
しかし,シミュレーション実行時間における音響フォルマントの正確な推定には,数値計算において高い時空間分解能を必要とする。
我々は最近、その音響波ソルバにチューブ深度を追加することによって、既存の2D FDTDアプローチを拡張する2.5D有限差時間領域(2.5D FDTD)として知られている新しいVT音響モデリング技術を提案しました。
本研究では,まず,新しいモデルのシミュレーション音響出力を,空間分解能の低い2d fdtdと現実的な3d fem vtモデルに匹敵することを示した。
次に、VTの周りに円形バッフルをヘッドジオメトリとして含めて放射線モデルを開発する。
放射モデルの伝達関数は母音/a/,/e/,/i/,/o/,/u/の5つの異なる声道形状を用いて解析される。
関連論文リスト
- Physics-constrained coupled neural differential equations for one dimensional blood flow modeling [0.3749861135832073]
計算心血管モデリングは、血流動態を理解する上で重要な役割を担っている。
有限要素法(FEM)に基づく従来の1次元モデルは、3次元平均解に比べて精度が低いことが多い。
本研究では1次元血流モデルの精度を向上させる物理制約付き機械学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-08T15:22:20Z) - Radio Frequency Signal based Human Silhouette Segmentation: A Sequential Diffusion Approach [26.987963024941635]
高品質セグメンテーションを共同で合成するための2段階連続拡散モデル(SDM)を提案する。
クロスビューブロックは、拡散モデルをマルチスケールで導くために考案された。
時間ブロックはフレームレベルのモデルを微調整して、周波数時間コンテキストとモーションダイナミクスを組み込むように設計されている。
論文 参考訳(メタデータ) (2024-07-27T12:44:21Z) - 4Diffusion: Multi-view Video Diffusion Model for 4D Generation [55.82208863521353]
現在の4D生成法は, 高度な拡散生成モデルの助けを借りて, 有意義な有効性を実現している。
モノクロビデオから空間的・時間的に一貫した4Dコンテンツを生成することを目的とした,新しい4D生成パイプライン,すなわち4Diffusionを提案する。
論文 参考訳(メタデータ) (2024-05-31T08:18:39Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D
Object Pose Estimation [66.16525145765604]
実世界のシナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。
提案手法は,3次元登録タスクをデノナイズ拡散過程として定式化し,音源雲の姿勢を段階的に洗練する。
実世界のTUD-L, LINEMOD, およびOccluded-LINEMODデータセットにおいて, 拡散登録フレームワークが顕著なポーズ推定性能を示すことを示す。
論文 参考訳(メタデータ) (2023-10-26T12:47:26Z) - Stage-by-stage Wavelet Optimization Refinement Diffusion Model for
Sparse-View CT Reconstruction [14.037398189132468]
本稿では,Sparse-view CT再構成のためのSWORD(Stage-by-stage Optimization Refinement Diffusion)モデルを提案する。
具体的には、低周波および高周波生成モデルを統合する統一的な数学的モデルを構築し、最適化手順で解を実現する。
提案手法は,低周波発生,高周波高精細化,領域変換の3段階を含む,確立された最適化理論に根ざした。
論文 参考訳(メタデータ) (2023-08-30T10:48:53Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models [33.343489006271255]
拡散モデルは、高品質なサンプルを持つ新しい最先端の生成モデルとして登場した。
そこで本研究では, モデルに基づく2次元拡散を, 全次元にわたるコヒーレントな再構成を達成できるように, 実験時の残りの方向で先行する2次元拡散を拡大することを提案する。
提案手法は,1つのコモディティGPU上で動作可能であり,新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2022-11-19T10:32:21Z) - Implicit Neural Spatial Filtering for Multichannel Source Separation in
the Waveform Domain [131.74762114632404]
モデルはエンドツーエンドで訓練され、空間処理を暗黙的に実行する。
提案したモデルを実世界のデータセット上で評価し,そのモデルがオラクルビームフォーマの性能と一致することを示す。
論文 参考訳(メタデータ) (2022-06-30T17:13:01Z) - Multi-Slice Fusion for Sparse-View and Limited-Angle 4D CT
Reconstruction [3.045887205265198]
複数の低次元デノイザの融合に基づく新しい4次元再構成アルゴリズムであるマルチスライス融合を提案する。
分散異種クラスタ上でのマルチスライス融合を実装し,大規模な4次元ボリュームを適切な時間で再構築する。
論文 参考訳(メタデータ) (2020-08-01T02:32:43Z) - Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。
また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文 参考訳(メタデータ) (2020-07-09T13:23:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。