論文の概要: Audio scene monitoring using redundant un-localized microphone arrays
- arxiv url: http://arxiv.org/abs/2103.01830v1
- Date: Tue, 2 Mar 2021 16:10:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 19:12:48.464050
- Title: Audio scene monitoring using redundant un-localized microphone arrays
- Title(参考訳): 冗長非局在マイクロホンアレイを用いた音場モニタリング
- Authors: Peter Gerstoft, Yihan Hu, Chaitanya Patil, Ardel Alegre, Michael J.
Bianco, Yoav Freund, and Francois Grondin
- Abstract要約: 複数のマイクロホンアレイを備えた部屋で音源をローカライズするシステムを提案する。
既存の多くのアプローチとは異なり、空間内の配列の位置は未知であると仮定される。
- 参考スコア(独自算出の注目度): 10.334172684650634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a system for localizing sound sources in a room with several
microphone arrays. Unlike most existing approaches, the positions of the arrays
in space are assumed to be unknown. Each circular array performs direction of
arrival (DOA) estimation independently. The DOAs are then fed to a fusion
center where they are concatenated and used to perform the localization based
on two proposed methods, which require only few labeled source locations for
calibration. The first proposed method is based on principal component analysis
(PCA) of the observed DOA and does not require any calibration. The array
cluster can then perform localization on a manifold defined by the PCA of
concatenated DOAs over time. The second proposed method performs localization
using an affine transformation between the DOA vectors and the room manifold.
The PCA approach has fewer requirements on the training sequence, but is less
robust to missing DOAs from one of the arrays. The approach is demonstrated
with a set of five 8-microphone circular arrays, placed at unknown fixed
locations in an office. Both the PCA approach and the direct approach can
easily map out a rectangle based on a few calibration points with similar
accuracy as calibration points. The methods demonstrated here provide a step
towards monitoring activities in a smart home and require little installation
effort as the array locations are not needed.
- Abstract(参考訳): 複数のマイクロホンアレイを備えた部屋で音源をローカライズするシステムを提案する。
既存の多くのアプローチとは異なり、空間内の配列の位置は未知であると仮定される。
各円配列は、独立して到着方向推定(DOA)を行う。
doasは融合センターに供給され、結合され、キャリブレーションのためにラベル付きソース位置をほとんど必要としない2つの提案方法に基づいてローカライズを行うために使用される。
最初の提案方法は、観察されたDOAの主成分分析(PCA)に基づいており、校正を必要としません。
配列クラスタは、時間とともに連結DOAのPCAによって定義される多様体上でローカライズを行うことができる。
提案手法は, DOAベクトルと室内多様体間のアフィン変換を用いて局所化を行う。
PCAアプローチはトレーニングシーケンスの要件が少ないが、アレイの1つからDOAを欠いた場合の堅牢性は低い。
このアプローチは、オフィス内の未知の固定位置に配置された5つの8マイクロホン円配列で実証される。
PCAアプローチと直接アプローチの両方は、キャリブレーションポイントと同じような精度で数個のキャリブレーションポイントに基づいて、容易に矩形をマッピングすることができる。
ここで示した方法は、スマートホームにおけるアクティビティを監視するためのステップを提供し、配列位置を必要としないため、インストールの手間をほとんど必要としない。
関連論文リスト
- Coupled Laplacian Eigenmaps for Locally-Aware 3D Rigid Point Cloud Matching [0.0]
局所構造を考慮したグラフラプラシアン固有写像に基づく新しい手法を提案する。
ラプラシアン固有写像の順序と符号のあいまいさに対処するために、結合ラプラシアンと呼ばれる新しい作用素を導入する。
これらの高次元空間間の類似性は、形状に一致するような局所的な意味のあるスコアを与えることを示す。
論文 参考訳(メタデータ) (2024-02-27T10:10:12Z) - SubspaceNet: Deep Learning-Aided Subspace Methods for DoA Estimation [36.647703652676626]
SubspaceNetは、観測を区別可能な部分空間に分割する方法を学ぶデータ駆動型DoA推定器である。
SubspaceNetは、コヒーレントソース、広帯域信号、低いSNR、配列ミスマッチ、限られたスナップショットに対処する様々なDoA推定アルゴリズムを実現する。
論文 参考訳(メタデータ) (2023-06-04T06:30:13Z) - DAC: Detector-Agnostic Spatial Covariances for Deep Local Features [11.494662473750505]
現在の深部視覚特徴検出器は検出された特徴の空間的不確かさをモデル化していない。
本稿では,事前訓練したディープ特徴検出器に接続可能な2つのポストホック共分散推定法を提案する。
論文 参考訳(メタデータ) (2023-05-20T17:43:09Z) - Adaptive Spot-Guided Transformer for Consistent Local Feature Matching [64.30749838423922]
局所的特徴マッチングのための適応スポットガイド変換器(ASTR)を提案する。
ASTRは、統一された粗いアーキテクチャにおける局所的な一貫性とスケールのバリエーションをモデル化する。
論文 参考訳(メタデータ) (2023-03-29T12:28:01Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - An End-to-End Transformer Model for Crowd Localization [64.15335535775883]
頭の位置を予測するクラウドローカライゼーションは、単にカウントするよりも実用的でハイレベルなタスクである。
既存の方法は擬似有界ボックスや事前設計されたローカライゼーションマップを使用し、複雑な後処理に頼って先頭位置を得る。
本稿では,レグレッションベースパラダイムの課題を解決するエレガントでエンドツーエンドなクラウドローカライゼーションTRansformerを提案する。
論文 参考訳(メタデータ) (2022-02-26T05:21:30Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - VarArray: Array-Geometry-Agnostic Continuous Speech Separation [26.938313513582642]
マイクロホンアレイを用いた連続音声分離は、自然な会話の書き起こしにおける音声重なり問題に対処する上で有望であることが示された。
本稿では,アレージオメトリーに依存しない音声分離ニューラルネットワークモデルであるVarArrayを提案する。
論文 参考訳(メタデータ) (2021-10-12T05:31:46Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。