論文の概要: HRTF Interpolation using a Spherical Neural Process Meta-Learner
- arxiv url: http://arxiv.org/abs/2310.13430v1
- Date: Fri, 20 Oct 2023 11:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 23:03:11.118021
- Title: HRTF Interpolation using a Spherical Neural Process Meta-Learner
- Title(参考訳): 球状神経過程メタリアナーを用いたhrtf補間
- Authors: Etienne Thuillier and Craig Jin and Vesa V\"alim\"aki
- Abstract要約: 本稿では,HRTF誤り訂正に特化した畳み込みニューラルプロセスメタラーナを提案する。
一般集団平均HRTFは、補正の前に最初の推定値を形成する。
トレーニングされたモデルは、最先端の手法と比較して最大3dBの相対誤差削減を達成する。
- 参考スコア(独自算出の注目度): 1.3505077405741583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Several individualization methods have recently been proposed to estimate a
subject's Head-Related Transfer Function (HRTF) using convenient input
modalities such as anthropometric measurements or pinnae photographs. There
exists a need for adaptively correcting the estimation error committed by such
methods using a few data point samples from the subject's HRTF, acquired using
acoustic measurements or perceptual feedback. To this end, we introduce a
Convolutional Conditional Neural Process meta-learner specialized in HRTF error
interpolation. In particular, the model includes a Spherical Convolutional
Neural Network component to accommodate the spherical geometry of HRTF data. It
also exploits potential symmetries between the HRTF's left and right channels
about the median axis. In this work, we evaluate the proposed model's
performance purely on time-aligned spectrum interpolation grounds under a
simplified setup where a generic population-mean HRTF forms the initial
estimates prior to corrections instead of individualized ones. The trained
model achieves up to 3 dB relative error reduction compared to state-of-the-art
interpolation methods despite being trained using only 85 subjects. This
improvement translates up to nearly a halving of the data point count required
to achieve comparable accuracy, in particular from 50 to 28 points to reach an
average of -20 dB relative error per interpolated feature. Moreover, we show
that the trained model provides well-calibrated uncertainty estimates.
Accordingly, such estimates can inform the sequential decision problem of
acquiring as few correcting HRTF data points as needed to meet a desired level
of HRTF individualization accuracy.
- Abstract(参考訳): 近年,人の頭部伝達関数(HRTF)を人体計測やピンナ写真などの便利な入力モダリティを用いて推定する手法が提案されている。
被験者のhrtfからいくつかのデータポイントサンプルを使用して、音響計測や知覚フィードバックを用いて取得した推定誤差を適応的に補正する必要性がある。
この目的のために、HRTFエラー補間に特化した畳み込み条件付きニューラルプロセスメタラーナを導入する。
特に、このモデルには、HRTFデータの球形状に対応する球状畳み込みニューラルネットワークコンポーネントが含まれている。
また、中央軸付近のHRTFの左右チャネル間の潜在的な対称性を利用する。
本研究では,一般集団平均HRTFが個別化ではなく修正に先立って初期推定値を生成するという簡易な設定の下で,時間整合スペクトル補間場でのモデルの性能を純粋に評価する。
訓練されたモデルでは,85名の被験者で訓練されたにもかかわらず,最先端補間法と比較して最大3dBの相対誤差を低減できる。
この改善は、同等の精度を達成するのに必要なデータポイント数の半分近く、特に補間された機能あたりの平均 -20 dB の相対誤差に到達するために 50 から 28 のポイントに変換される。
さらに,訓練されたモデルが不確実性推定の精度が高いことを示す。
これにより、所望のHRTF個人化精度を満たすために必要なHRTFデータポイントの補正を少なくして取得するシーケンシャルな決定問題を報知することができる。
関連論文リスト
- HRTF Estimation using a Score-based Prior [20.62078965099636]
本稿では,スコアベース拡散モデルに基づく頭部伝達関数推定手法を提案する。
HRTFは人間の発話などの自然な励起信号を用いて残響環境で推定される。
HRTFにおける高周波コンテンツの大きなばらつきを,拡散前の拡散が考慮できることを示す。
論文 参考訳(メタデータ) (2024-10-02T14:00:41Z) - DF2: Distribution-Free Decision-Focused Learning [53.2476224456902]
決定中心学習(DFL)は近年,予測最適化問題に対する強力なアプローチとして出現している。
既存のエンドツーエンドDFL法は、モデル誤差、サンプル平均近似誤差、予測対象の分布に基づくパラメータ化の3つの重大なボトルネックによって妨げられている。
DF2は,これら3つのボトルネックに明示的に対処するために設計された,初となるテキストフリーな意思決定型学習手法である。
論文 参考訳(メタデータ) (2023-08-11T00:44:46Z) - Mitigating Dataset Bias by Using Per-sample Gradient [9.290757451344673]
PGD(Per-sample Gradient-based Debiasing)は,一様バッチサンプリングによるモデルトレーニング,サンプル勾配の基準に比例して各サンプルの重要性の設定,重要バッチサンプリングを用いたモデルトレーニングの3段階からなる。
種々の合成および実世界のデータセットに対する既存のベースラインと比較して,本手法は分類タスクの最先端の精度を示した。
論文 参考訳(メタデータ) (2022-05-31T11:41:02Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Optimal Model Averaging: Towards Personalized Collaborative Learning [0.0]
連合学習では、参加ノード間のデータや目的の違いが、各ノードに対してパーソナライズされた機械学習モデルをトレーニングするためのアプローチを動機付けている。
そのようなアプローチの1つは、局所的に訓練されたモデルとグローバルモデルの間の重み付き平均化である。
局所モデルと比較して予測される2乗誤差を減少させるモデル平均化の正の量が常に存在することがわかった。
論文 参考訳(メタデータ) (2021-10-25T13:33:20Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - On Minimum Word Error Rate Training of the Hybrid Autoregressive
Transducer [40.63693071222628]
ハイブリッド自己回帰変換器(HAT)の最小単語誤り率(MWER)訓練について検討する。
約3万時間のトレーニングデータを用いた実験から,MWERトレーニングがHATモデルの精度を向上させることを示す。
論文 参考訳(メタデータ) (2020-10-23T21:16:30Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。