Fugu-MT 論文翻訳(概要): A comparative study of two-dimensional vocal tract acoustic modeling based on Finite-Difference Time-Domain methods

論文の概要: A comparative study of two-dimensional vocal tract acoustic modeling based on Finite-Difference Time-Domain methods

arxiv url: http://arxiv.org/abs/2102.04588v1
Date: Tue, 9 Feb 2021 00:40:52 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-11 00:35:47.812516
Title: A comparative study of two-dimensional vocal tract acoustic modeling based on Finite-Difference Time-Domain methods
Title（参考訳）: 有限差分時間領域法による2次元声道音響モデルの比較検討
Authors: Debasish Ray Mohapatra, Victor Zappi, Sidney Fels
Abstract要約: 声道(VT)に対する2次元数値計算法は,低計算コストと正確な音波伝搬のバランスが良くなる。我々は最近、2.5D VTDと呼ばれる新しい手法を提案し、2.5D VTDは既存の2D VTDアプローチを拡張した。本稿では,まず,VTモデルの模擬音響出力を低解像度で2次元VTDと現実的な3次元FEMモデルと比較した。
参考スコア（独自算出の注目度）: 2.8575516056239576
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The two-dimensional (2D) numerical approaches for vocal tract (VT) modelling can afford a better balance between the low computational cost and accurate rendering of acoustic wave propagation. However, they require a high spatio-temporal resolution in the numerical scheme for a precise estimation of acoustic formants at the simulation run-time expense. We have recently proposed a new VT acoustic modelling technique, known as the 2.5D Finite-Difference Time-Domain (2.5D FDTD), which extends the existing 2D FDTD approach by adding tube depth to its acoustic wave solver. In this work, first, the simulated acoustic outputs of our new model are shown to be comparable with the 2D FDTD and a realistic 3D FEM VT model at a low spatio-temporal resolution. Next, a radiation model is developed by including a circular baffle around the VT as head geometry. The transfer functions of the radiation model are analyzed using five different vocal tract shapes for vowel sounds /a/, /e/, /i/, /o/ and /u/.
Abstract（参考訳）: 声道(VT)モデリングのための二次元(2次元)数値手法は,低計算コストと音波伝搬の正確なレンダリングとのバランスを向上することができる。しかし,シミュレーション実行時間における音響フォルマントの正確な推定には,数値計算において高い時空間分解能を必要とする。我々は最近、その音響波ソルバにチューブ深度を追加することによって、既存の2D FDTDアプローチを拡張する2.5D有限差時間領域(2.5D FDTD)として知られている新しいVT音響モデリング技術を提案しました。本研究では,まず,新しいモデルのシミュレーション音響出力を,空間分解能の低い2d fdtdと現実的な3d fem vtモデルに匹敵することを示した。次に、VTの周りに円形バッフルをヘッドジオメトリとして含めて放射線モデルを開発する。放射モデルの伝達関数は母音/a/,/e/,/i/,/o/,/u/の5つの異なる声道形状を用いて解析される。

関連論文リスト

Short-term electricity load forecasting with multi-frequency reconstruction diffusion [26.01653368112603]
本稿では,STELFの多周波再構成を用いた新しい拡散モデルを提案する。 MFRDモデルは4つの重要なステップを通じて正確な負荷予測を実現する。
論文参考訳（メタデータ） (2026-01-10T11:22:25Z)
Diffusion Model-Based Posterior Sampling in Full Waveform Inversion [3.2800968305157205]
観測記録の後方サンプリングはフィールドスケールではめったに実用的ではない提案手法は,拡散型後方サンプリングと同時音源波形インバージョンデータを組み合わせた手法である。提案手法は, モデル誤差の低減と, 計算コストの大幅な削減を実現する。
論文参考訳（メタデータ） (2025-12-14T18:34:12Z)
Ivan-ISTD: Rethinking Cross-domain Heteroscedastic Noise Perturbations in Infrared Small Target Detection [53.689841037081834]
Ivan-ISTD は ISTD におけるクロスドメインシフトと異方性雑音摂動の2つの課題に対処するように設計されている。 Ivan-ISTDはクロスドメインシナリオにおいて優れた堅牢性を示している。
論文参考訳（メタデータ） (2025-10-14T07:48:31Z)
InJecteD: Analyzing Trajectories and Drift Dynamics in Denoising Diffusion Probabilistic Models for 2D Point Cloud Generation [48.55037712252843]
InJecteDは拡散確率モデル(DDPM)を解釈するフレームワークこのフレームワークをDatasaurus Dozen bullseye, dino, circleの3つのデータセットに適用する。提案手法は, 変位, 速度, クラスタリング, ドリフト場力学などの軌道特性を定量的に評価する。
論文参考訳（メタデータ） (2025-09-09T14:53:19Z)
ESTM: An Enhanced Dual-Branch Spectral-Temporal Mamba for Anomalous Sound Detection [39.234515088121086]
本稿では、時間周波数デカップリングモデルを用いたデュアルパス・マンバアーキテクチャに基づく新しいフレームワークESTMを提案する。 ESTMは、Melスペクトルと生音声特徴を融合させることにより、異なる時間セグメントと周波数帯域からリッチな特徴表現を抽出する。本実験は, ESTMがDCASE 2020 Task 2データセットの異常検出性能を向上させることを示す。
論文参考訳（メタデータ） (2025-09-02T16:23:49Z)
Convergence of physics-informed neural networks modeling time-harmonic wave fields [0.0]
低周波の3次元室内音響症例について検討し, 音源定義と境界条件数を変化させた。 PINNアーキテクチャのロスランドスケープに着目し,収束挙動を評価する。この開発は、吸音器を含む室内音響の低周波挙動をモデル化することを目的としたイニシアチブの一部である。
論文参考訳（メタデータ） (2025-05-18T19:12:14Z)
AV-Surf: Surface-Enhanced Geometry-Aware Novel-View Acoustic Synthesis [4.751910547396398]
複雑な実環境下での音響伝搬の正確なモデル化は、新しい視点音響合成(NVAS)に不可欠である空間音響モデルを改善するため,NVASのための表面形状認識手法を提案する。本稿では,エミッタ周辺を理解するために,幾何的制約を周波数クエリに組み込んだ2つのクロスアテンション型変換器を提案する。
論文参考訳（メタデータ） (2025-03-17T04:22:53Z)
Generative Human Geometry Distribution [49.58025398670139]
我々は、最近提案された、高忠実度で単一の人間の幾何学をモデル化可能な、幾何学的分布に基づいて構築する。本稿では,ネットワークパラメータではなく2次元特徴写像として分布を符号化する手法と,ガウスではなく領域としてSMPLモデルを提案する。実験の結果,提案手法は既存の最先端手法よりも優れており,幾何学的品質が57%向上していることがわかった。
論文参考訳（メタデータ） (2025-03-03T11:55:19Z)
Physics-constrained coupled neural differential equations for one dimensional blood flow modeling [0.3749861135832073]
計算心血管モデリングは、血流動態を理解する上で重要な役割を担っている。有限要素法(FEM)に基づく従来の1次元モデルは、3次元平均解に比べて精度が低いことが多い。本研究では1次元血流モデルの精度を向上させる物理制約付き機械学習手法を提案する。
論文参考訳（メタデータ） (2024-11-08T15:22:20Z)
Radio Frequency Signal based Human Silhouette Segmentation: A Sequential Diffusion Approach [26.987963024941635]
高品質セグメンテーションを共同で合成するための2段階連続拡散モデル(SDM)を提案する。クロスビューブロックは、拡散モデルをマルチスケールで導くために考案された。時間ブロックはフレームレベルのモデルを微調整して、周波数時間コンテキストとモーションダイナミクスを組み込むように設計されている。
論文参考訳（メタデータ） (2024-07-27T12:44:21Z)
4Diffusion: Multi-view Video Diffusion Model for 4D Generation [55.82208863521353]
現在の4D生成法は, 高度な拡散生成モデルの助けを借りて, 有意義な有効性を実現している。モノクロビデオから空間的・時間的に一貫した4Dコンテンツを生成することを目的とした,新しい4D生成パイプライン,すなわち4Diffusionを提案する。
論文参考訳（メタデータ） (2024-05-31T08:18:39Z)
StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文参考訳（メタデータ） (2023-12-02T02:27:58Z)
SE(3) Diffusion Model-based Point Cloud Registration for Robust 6D Object Pose Estimation [66.16525145765604]
実世界のシナリオにおける6次元オブジェクトポーズ推定のためのSE(3)拡散モデルに基づく点クラウド登録フレームワークを提案する。提案手法は,3次元登録タスクをデノナイズ拡散過程として定式化し,音源雲の姿勢を段階的に洗練する。実世界のTUD-L, LINEMOD, およびOccluded-LINEMODデータセットにおいて, 拡散登録フレームワークが顕著なポーズ推定性能を示すことを示す。
論文参考訳（メタデータ） (2023-10-26T12:47:26Z)
Stage-by-stage Wavelet Optimization Refinement Diffusion Model for Sparse-View CT Reconstruction [14.037398189132468]
本稿では,Sparse-view CT再構成のためのSWORD(Stage-by-stage Optimization Refinement Diffusion)モデルを提案する。具体的には、低周波および高周波生成モデルを統合する統一的な数学的モデルを構築し、最適化手順で解を実現する。提案手法は,低周波発生,高周波高精細化,領域変換の3段階を含む,確立された最適化理論に根ざした。
論文参考訳（メタデータ） (2023-08-30T10:48:53Z)
Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文参考訳（メタデータ） (2023-08-18T16:41:57Z)
Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models [33.343489006271255]
拡散モデルは、高品質なサンプルを持つ新しい最先端の生成モデルとして登場した。そこで本研究では, モデルに基づく2次元拡散を, 全次元にわたるコヒーレントな再構成を達成できるように, 実験時の残りの方向で先行する2次元拡散を拡大することを提案する。提案手法は,1つのコモディティGPU上で動作可能であり,新しい最先端技術を確立する。
論文参考訳（メタデータ） (2022-11-19T10:32:21Z)
Implicit Neural Spatial Filtering for Multichannel Source Separation in the Waveform Domain [131.74762114632404]
モデルはエンドツーエンドで訓練され、空間処理を暗黙的に実行する。提案したモデルを実世界のデータセット上で評価し,そのモデルがオラクルビームフォーマの性能と一致することを示す。
論文参考訳（メタデータ） (2022-06-30T17:13:01Z)
Multi-Slice Fusion for Sparse-View and Limited-Angle 4D CT Reconstruction [3.045887205265198]
複数の低次元デノイザの融合に基づく新しい4次元再構成アルゴリズムであるマルチスライス融合を提案する。分散異種クラスタ上でのマルチスライス融合を実装し,大規模な4次元ボリュームを適切な時間で再構築する。
論文参考訳（メタデータ） (2020-08-01T02:32:43Z)
Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文参考訳（メタデータ） (2020-07-09T13:23:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。