論文の概要: Permutation Invariant Recurrent Neural Networks for Sound Source
Tracking Applications
- arxiv url: http://arxiv.org/abs/2306.08510v1
- Date: Wed, 14 Jun 2023 13:53:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 18:48:03.353828
- Title: Permutation Invariant Recurrent Neural Networks for Sound Source
Tracking Applications
- Title(参考訳): 音源追跡のための置換不変リカレントニューラルネットワーク
- Authors: David Diaz-Guerra, Archontis Politis, Antonio Miguel, Jose R. Beltran,
Tuomas Virtanen
- Abstract要約: 入力状態と状態の両方を表すために無順序集合を用いる新しい再帰的アーキテクチャを提案する。
各音源の情報は個別の埋め込みで表現され、新しい推定値はその順序に関係なくトラックされた軌跡に割り当てられる。
- 参考スコア(独自算出の注目度): 23.52962865511909
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many multi-source localization and tracking models based on neural networks
use one or several recurrent layers at their final stages to track the movement
of the sources. Conventional recurrent neural networks (RNNs), such as the long
short-term memories (LSTMs) or the gated recurrent units (GRUs), take a vector
as their input and use another vector to store their state. However, this
approach results in the information from all the sources being contained in a
single ordered vector, which is not optimal for permutation-invariant problems
such as multi-source tracking. In this paper, we present a new recurrent
architecture that uses unordered sets to represent both its input and its state
and that is invariant to the permutations of the input set and equivariant to
the permutations of the state set. Hence, the information of every sound source
is represented in an individual embedding and the new estimates are assigned to
the tracked trajectories regardless of their order.
- Abstract(参考訳): ニューラルネットワークに基づく多くのマルチソースローカライゼーションと追跡モデルは、最終段階で1つまたは複数の繰り返しレイヤを使用してソースの移動を追跡する。
長い短期記憶(LSTM)やゲートリカレントユニット(GRU)のような従来のリカレントニューラルネットワーク(RNN)は、ベクトルを入力として、別のベクトルを使って状態を記憶する。
しかし、このアプローチは、単一の順序ベクトルに含まれる全てのソースからの情報をもたらすため、マルチソース追跡のような置換不変問題には最適ではない。
本稿では,その入力と状態の両方を表現するために非順序集合を使用し,入力集合の置換に不変であり,状態集合の置換に同値である新しい再帰的アーキテクチャを提案する。
したがって、各音源の情報は個別の埋め込みで表現され、新しい推定値はその順序に関係なくトラックされた軌跡に割り当てられる。
関連論文リスト
- Recurrent Stochastic Configuration Networks for Temporal Data Analytics [3.8719670789415925]
本稿では,問題解決のためのコンフィグレーションネットワーク(RSCN)のリカレントバージョンを開発する。
我々は、初期RCCNモデルを構築し、その後、オンラインで出力重みを更新する。
数値的な結果は,提案したRCCNが全データセットに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2024-06-21T03:21:22Z) - Locality-Aware Generalizable Implicit Neural Representation [54.93702310461174]
一般化可能な暗黙的ニューラル表現(INR)は、単一の連続関数が複数のデータインスタンスを表現することを可能にする。
本稿では、変換器エンコーダと局所性を考慮したINRデコーダを組み合わせた一般化可能なINRのための新しいフレームワークを提案する。
我々のフレームワークは、従来の一般化可能なINRよりも大幅に優れており、下流タスクにおける局所性を考慮した潜在能力の有効性を検証している。
論文 参考訳(メタデータ) (2023-10-09T11:26:58Z) - Return of the RNN: Residual Recurrent Networks for Invertible Sentence
Embeddings [0.0]
本研究では、教師なし符号化タスクで訓練された残効再帰ネットワークを用いて、非可逆文埋め込みのための新しいモデルを提案する。
ニューラルネットワーク翻訳モデルに共通する確率的出力ではなく、回帰に基づく出力層を用いて入力シーケンスのワードベクトルを再構成する。
RNNはLSTMや2次最適化法などのメモリユニットを必要とすることを考えると、このモデルはADAMによる高精度かつ高速なトレーニングを実現している。
論文 参考訳(メタデータ) (2023-03-23T15:59:06Z) - Permutation Equivariant Neural Functionals [92.0667671999604]
この研究は、他のニューラルネットワークの重みや勾配を処理できるニューラルネットワークの設計を研究する。
隠れた層状ニューロンには固有の順序がないため, 深いフィードフォワードネットワークの重みに生じる置換対称性に着目する。
実験の結果, 置換同変ニューラル関数は多種多様なタスクに対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-02-27T18:52:38Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - A Correspondence Variational Autoencoder for Unsupervised Acoustic Word
Embeddings [50.524054820564395]
そこで本稿では,変数分割音声セグメントを固定次元表現にマッピングするための教師なしモデルを提案する。
結果として得られる音響単語の埋め込みは、低リソース言語とゼロリソース言語のための検索、発見、インデックスシステムの基礎を形成することができる。
論文 参考訳(メタデータ) (2020-12-03T19:24:42Z) - Rotation-Invariant Gait Identification with Quaternion Convolutional
Neural Networks [7.638280076041963]
本稿では,ネットワークアーキテクチャであるQuaternion CNNを紹介する。
我々は,このネットワークが,マルチユーザ回転不変歩行分類設定において,従来のCNNよりも著しく優れていることを実証的に示す。
論文 参考訳(メタデータ) (2020-08-04T23:22:12Z) - RE-MIMO: Recurrent and Permutation Equivariant Neural MIMO Detection [85.44877328116881]
無線通信システムにおけるシンボル検出のための新しいニューラルネットワークを提案する。
無線通信システムにおけるいくつかの重要な考察に動機付けられている。
その性能を既存手法と比較し,ネットワークが可変数の送信機を効率的に処理できることを示す。
論文 参考訳(メタデータ) (2020-06-30T22:43:01Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。