論文の概要: Autoregressive Guidance of Deep Spatially Selective Filters using Bayesian Tracking for Efficient Extraction of Moving Speakers
- arxiv url: http://arxiv.org/abs/2603.23723v1
- Date: Tue, 24 Mar 2026 21:19:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.027898
- Title: Autoregressive Guidance of Deep Spatially Selective Filters using Bayesian Tracking for Efficient Extraction of Moving Speakers
- Title(参考訳): ベイジアントラッキングを用いた移動話者の効率的な抽出のための深部空間選択フィルタの自己回帰誘導
- Authors: Jakob Kienegger, Timo Gerkmann,
- Abstract要約: 本研究では,拡張信号を軽量な追跡アルゴリズムに組み込む戦略について検討し,深部空間フィルタを自己回帰的に誘導する手法を提案する。
その結果, 自動回帰化はベイジアントラッカーの精度を著しく向上させ, 計算オーバーヘッドの増大を伴わずとも, 優れた向上をもたらすことがわかった。
- 参考スコア(独自算出の注目度): 28.32055656460997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep spatially selective filters achieve high-quality enhancement with real-time capable architectures for stationary speakers of known directions. To retain this level of performance in dynamic scenarios when only the speakers' initial directions are given, accurate, yet computationally lightweight tracking algorithms become necessary. Assuming a frame-wise causal processing style, temporal feedback allows for leveraging the enhanced speech signal to improve tracking performance. In this work, we investigate strategies to incorporate the enhanced signal into lightweight tracking algorithms and autoregressively guide deep spatial filters. Our proposed Bayesian tracking algorithms are compatible with arbitrary deep spatial filters. To increase the realism of simulated trajectories during development and evaluation, we propose and publish a novel dataset based on the social force model. Results validate that the autoregressive incorporation significantly improves the accuracy of our Bayesian trackers, resulting in superior enhancement with none or only negligibly increased computational overhead. Real-world recordings complement these findings and demonstrate the generalizability of our methods to unseen, challenging acoustic conditions.
- Abstract(参考訳): 空間選択的な深層フィルタは、既知の方向の定常話者のためのリアルタイム能動的アーキテクチャによる高品質な拡張を実現する。
このレベルの性能を維持するには、話者の初期方向のみが与えられる場合、正確だが計算量的に軽量な追跡アルゴリズムが必要である。
フレーム単位の因果処理スタイルを仮定すると、時間的フィードバックは、拡張された音声信号を活用して追跡性能を向上させることができる。
本研究では,拡張信号を軽量な追跡アルゴリズムに組み込む戦略について検討し,深部空間フィルタを自己回帰的に誘導する手法を提案する。
提案したベイズ追跡アルゴリズムは、任意の深部空間フィルタと互換性がある。
開発・評価における模擬軌道の現実性を高めるために,社会力モデルに基づく新しいデータセットを提案し,公開する。
その結果, 自動回帰化はベイジアントラッカーの精度を著しく向上させ, 計算オーバーヘッドの増大を伴わずとも, 優れた向上をもたらすことがわかった。
実世界の録音はこれらの知見を補完し、我々の手法の一般化可能性を示し、難解な音響条件を提示する。
関連論文リスト
- Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data [0.29494468099506904]
本稿では,GPS軌道を道路網に合わせるための空間時間マッチングアルゴリズムの潜在的な改善について検討する。
本手法では, 動的バッファ, 適応観測確率, 時間的評価関数の再設計, 行動解析の4つの改良を提案する。
実験の結果は、様々な指標で性能効率とパス品質が大幅に向上したことを示している。
論文 参考訳(メタデータ) (2026-03-10T09:25:53Z) - Dynamic Momentum Recalibration in Online Gradient Learning [6.6375578955686345]
Gradient Descent(SGD)とその運動量変化は、ディープラーニング最適化のバックボーンを形成する。
本研究では信号処理のレンズを通して勾配の更新を再解釈し、固定運動量係数が本質的にバイアスと分散のバランスを歪め、歪んだあるいは最適以下のパラメータの更新をもたらすことを明らかにする。
SGDF(SGD with Filter)を提案する。
論文 参考訳(メタデータ) (2026-03-06T10:23:40Z) - Self-Steering Deep Non-Linear Spatially Selective Filters for Efficient Extraction of Moving Speakers under Weak Guidance [14.16697537117357]
代わりに粒子フィルタの形で低複雑さ追跡アルゴリズムを利用する新しい手法を提案する。
両アルゴリズムの自己回帰的相互作用が追跡精度を大幅に向上し,高い性能向上をもたらすことを示す。
論文 参考訳(メタデータ) (2025-07-03T16:54:56Z) - Attention-Driven Multichannel Speech Enhancement in Moving Sound Source
Scenarios [11.811571392419324]
音声強調アルゴリズムは典型的に静止音源を仮定するが、これは現実との共通のミスマッチであり、現実のシナリオではその性能を制限している。
本稿では,動的設定のための注意駆動型空間フィルタリング技術について述べる。
論文 参考訳(メタデータ) (2023-12-17T16:12:35Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Automated classification of pre-defined movement patterns: A comparison
between GNSS and UWB technology [55.41644538483948]
リアルタイム位置情報システム(RTLS)は、人間の動きパターンからデータを収集することができる。
本研究の目的は、小さな領域における人間の動きパターンを分類する自動化された枠組みを設計し、評価することである。
論文 参考訳(メタデータ) (2023-03-10T14:46:42Z) - Filter-enhanced MLP is All You Need for Sequential Recommendation [89.0974365344997]
オンラインプラットフォームでは、ログされたユーザの行動データはノイズを含まないことは避けられない。
周波数領域の雑音を減衰させる信号処理から,フィルタアルゴリズムのアイデアを借用する。
逐次レコメンデーションタスクのための学習可能なフィルタを備えたオールMLPモデルである textbfFMLP-Rec を提案する。
論文 参考訳(メタデータ) (2022-02-28T05:49:35Z) - Deep Impulse Responses: Estimating and Parameterizing Filters with Deep
Networks [76.830358429947]
高雑音および地中設定におけるインパルス応答推定は難しい問題である。
本稿では,ニューラル表現学習の最近の進歩に基づいて,インパルス応答のパラメータ化と推定を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T18:57:23Z) - Adaptive Low-Pass Filtering using Sliding Window Gaussian Processes [71.23286211775084]
ガウス過程回帰に基づく適応型低域通過フィルタを提案する。
本研究では,提案手法の誤差が一様境界であることを示す。
論文 参考訳(メタデータ) (2021-11-05T17:06:59Z) - Self-Tuning Stochastic Optimization with Curvature-Aware Gradient
Filtering [53.523517926927894]
サンプルごとのHessian-vector積と勾配を用いて、自己チューニングの二次構造を構築する。
モデルに基づく手続きが雑音勾配設定に収束することを証明する。
これは自己チューニング二次体を構築するための興味深いステップである。
論文 参考訳(メタデータ) (2020-11-09T22:07:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。