論文の概要: Unsupervised Acoustic Scene Mapping Based on Acoustic Features and
Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2301.00448v1
- Date: Sun, 1 Jan 2023 17:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 16:22:30.136860
- Title: Unsupervised Acoustic Scene Mapping Based on Acoustic Features and
Dimensionality Reduction
- Title(参考訳): 音響的特徴と次元的縮小に基づく教師なし音響シーンマッピング
- Authors: Idan Cohen, Ofir Lindenbaum and Sharon Gannot
- Abstract要約: データの自然な構造を生かした教師なしのデータ駆動型アプローチを導入する。
本手法は,実測値から標準データ座標を学習するためのオフライン深層学習方式であるローカル共形オートエンコーダ(LOCA)に基づいて構築する。
- 参考スコア(独自算出の注目度): 19.818087225770967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical methods for acoustic scene mapping require the estimation of time
difference of arrival (TDOA) between microphones. Unfortunately, TDOA
estimation is very sensitive to reverberation and additive noise. We introduce
an unsupervised data-driven approach that exploits the natural structure of the
data. Our method builds upon local conformal autoencoders (LOCA) - an offline
deep learning scheme for learning standardized data coordinates from
measurements. Our experimental setup includes a microphone array that measures
the transmitted sound source at multiple locations across the acoustic
enclosure. We demonstrate that LOCA learns a representation that is isometric
to the spatial locations of the microphones. The performance of our method is
evaluated using a series of realistic simulations and compared with other
dimensionality-reduction schemes. We further assess the influence of
reverberation on the results of LOCA and show that it demonstrates considerable
robustness.
- Abstract(参考訳): 音響シーンマッピングの古典的手法は、マイク間の到着時間差(TDOA)を推定する必要がある。
残念ながら、TDOA推定は残響や付加音に非常に敏感である。
データの自然な構造を生かした教師なしのデータ駆動型アプローチを導入する。
この手法は,測定値から標準データ座標を学習するためのオフラインディープラーニングスキームであるlocal conformal autoencoder (loca) を基盤としている。
実験では,透過音源を音響エンクロージャ内の複数箇所で測定するマイクロホンアレイを試作した。
LOCAがマイクロホンの空間的位置と等尺性を持つ表現を学習していることを示す。
本手法の性能は, 実測シミュレーションを用いて評価し, 他の次元還元法との比較を行った。
さらに, 残響がLOCAの結果に及ぼす影響を評価し, かなりの堅牢性を示した。
関連論文リスト
- Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Neural Acoustic Context Field: Rendering Realistic Room Impulse Response
With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。
RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。
実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文 参考訳(メタデータ) (2023-09-27T19:50:50Z) - Generative adversarial networks with physical sound field priors [6.256923690998173]
本稿では,GANを用いた音場再構築のための深層学習に基づくアプローチを提案する。
提案手法は, 平面波ベースと室内圧力の統計的分布を用いて, 限られた数の測定値から音場を再構成する。
提案手法は, 音場再構成に有望な手法であることを示す。
論文 参考訳(メタデータ) (2023-08-01T10:11:23Z) - Self-Supervised Visual Acoustic Matching [63.492168778869726]
音響マッチングは、ターゲットの音響環境に録音されたかのように、音声クリップを再合成することを目的としている。
そこで本研究では,対象のシーン画像と音声のみを含む,視覚的音響マッチングのための自己教師型アプローチを提案する。
提案手法は,条件付きGANフレームワークと新しいメトリクスを用いて,室内音響をアンタングル化し,音をターゲット環境に再合成する方法を共同で学習する。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - RealImpact: A Dataset of Impact Sound Fields for Real Objects [29.066504517249083]
制御条件下で記録された実物体衝撃音の大規模データセットであるRealImpactを提案する。
RealImpactには、50の毎日の物体の衝撃音の15万の録音と詳細なアノテーションが含まれている。
本研究では,物体衝撃音を推定するための現在のシミュレーション手法の参考として,我々のデータセットを用いた予備試行を行う。
論文 参考訳(メタデータ) (2023-06-16T16:25:41Z) - Few-Shot Audio-Visual Learning of Environment Acoustics [89.16560042178523]
室内インパルス応答 (RIR) 関数は、周囲の物理的環境がリスナーが聴く音をどう変換するかをキャプチャする。
我々は、空間で観測された画像とエコーのスパースセットに基づいて、RIRを推測する方法を探る。
3次元環境のための最先端オーディオ視覚シミュレータを用いた実験において,本手法が任意のRIRを生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-08T16:38:24Z) - Blind Room Parameter Estimation Using Multiple-Multichannel Speech
Recordings [37.145413836886455]
部屋の幾何学的パラメータや音響的パラメータを知ることは、オーディオ拡張現実、音声のデバーベレーション、音声法医学などの応用に有用である。
室内の総表面積,体積,および周波数依存残響時間と平均表面吸収を共同で推定する問題について検討した。
単一チャネルとチャネル間キューの両方を活用する新しい畳み込みニューラルネットワークアーキテクチャを提案し、大規模で現実的なシミュレーションデータセットでトレーニングする。
論文 参考訳(メタデータ) (2021-07-29T08:51:49Z) - C-SL: Contrastive Sound Localization with Inertial-Acoustic Sensors [5.101801159418222]
任意の幾何形状の移動慣性音響センサアレイを用いたコントラスト音像定位(C-SL)を導入する。
C-SLは、音響測定から、自己教師された方法でアレイ中心の方向へのマッピングを学習する。
我々は、C-SLが提供する緩やかな校正プロセスが、真のパーソナライズされた補聴器アプリケーションへの道を開くと信じている。
論文 参考訳(メタデータ) (2020-06-09T06:36:44Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。