論文の概要: Multi-Modal Recurrent Fusion for Indoor Localization
- arxiv url: http://arxiv.org/abs/2203.00510v2
- Date: Wed, 2 Mar 2022 02:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-06 13:12:57.127156
- Title: Multi-Modal Recurrent Fusion for Indoor Localization
- Title(参考訳): 屋内定位のためのマルチモーダルリカレント核融合
- Authors: Jianyuan Yu and Pu (Perry) Wang and Toshiaki Koike-Akino and Philip V.
Orlik
- Abstract要約: 本稿では、Wi-Fi、慣性測定ユニット(IMU)、UWB(UWB)を含むマルチモーダル無線信号を用いた屋内位置決めについて考察する。
繰り返しニューラルネットワークのコンテキストにおける各モードの現在の隠れ状態を組み合わせるために,マルチストリームリカレント融合法を提案する。
- 参考スコア(独自算出の注目度): 24.138127040942127
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper considers indoor localization using multi-modal wireless signals
including Wi-Fi, inertial measurement unit (IMU), and ultra-wideband (UWB). By
formulating the localization as a multi-modal sequence regression problem, a
multi-stream recurrent fusion method is proposed to combine the current hidden
state of each modality in the context of recurrent neural networks while
accounting for the modality uncertainty which is directly learned from its own
immediate past states. The proposed method was evaluated on the large-scale
SPAWC2021 multi-modal localization dataset and compared with a wide range of
baseline methods including the trilateration method, traditional fingerprinting
methods, and convolution network-based methods.
- Abstract(参考訳): 本稿では、Wi-Fi、慣性測定ユニット(IMU)、UWB(UWB)などのマルチモーダル無線信号を用いた屋内位置決めについて検討する。
局所化をマルチモーダルシーケンス回帰問題として定式化することにより、再帰ニューラルネットワークの文脈における各モダリティの現在隠れ状態と、その直近の過去状態から直接学習されるモダリティの不確かさとを組み合わせたマルチストリームリカレント融合法を提案する。
提案手法は, 大規模SPAWC2021マルチモーダルローカライゼーションデータセットを用いて評価し, トリラレーション法, 従来のフィンガープリント法, 畳み込みネットワークベースの手法を含む幅広いベースライン手法と比較した。
関連論文リスト
- Application of Multimodal Fusion Deep Learning Model in Disease Recognition [14.655086303102575]
本稿では,従来の単一モーダル認識手法の欠点を克服する,革新的なマルチモーダル融合深層学習手法を提案する。
特徴抽出段階では、画像ベース、時間的、構造化されたデータソースから高度な特徴を抽出するために最先端のディープラーニングモデルを適用する。
その結果, マルチモーダル融合モデルにおいて, 複数の評価指標にまたがる大きな利点が示された。
論文 参考訳(メタデータ) (2024-05-22T23:09:49Z) - A Multimodal Intermediate Fusion Network with Manifold Learning for
Stress Detection [1.2430809884830318]
本稿では,多様体学習に基づく次元減少を伴う中間的マルチモーダル融合ネットワークを提案する。
マルチモーダルネットワークと単調ネットワークの異なるバリエーションについて,様々な次元削減手法を比較した。
多次元スケーリング(MDS)法による中間レベル融合は96.00%の精度で有望な結果を示した。
論文 参考訳(メタデータ) (2024-03-12T21:06:19Z) - Improved off-policy training of diffusion samplers [93.66433483772055]
本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-07T18:51:49Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Generalizing Multimodal Variational Methods to Sets [35.69942798534849]
本稿では,マルチモーダル潜在空間を学習するために,Set Multimodal VAE(SMVAE)と呼ばれる新しい変分法を提案する。
共同モダリティ後部分布を直接モデル化することにより、提案したSMVAEは、複数のモダリティ間で情報を交換し、分解による欠点を補うことを学習する。
論文 参考訳(メタデータ) (2022-12-19T23:50:19Z) - Multi-view Multi-label Anomaly Network Traffic Classification based on
MLP-Mixer Neural Network [55.21501819988941]
畳み込みニューラルネットワーク(CNN)に基づく既存のネットワークトラフィック分類は、グローバルな情報関連を無視しながら、トラフィックデータの局所的なパターンを強調することが多い。
本稿では,エンドツーエンドのネットワークトラフィック分類手法を提案する。
論文 参考訳(メタデータ) (2022-10-30T01:52:05Z) - Multi-Modal Mutual Information Maximization: A Novel Approach for
Unsupervised Deep Cross-Modal Hashing [73.29587731448345]
我々はCross-Modal Info-Max Hashing (CMIMH)と呼ばれる新しい手法を提案する。
モーダル内およびモーダル間の類似性を両立できる情報表現を学習する。
提案手法は、他の最先端のクロスモーダル検索手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2021-12-13T08:58:03Z) - Globally Convergent Multilevel Training of Deep Residual Networks [0.0]
ディープ残差ネットワーク(ResNets)のためのグローバル収束型マルチレベルトレーニング手法を提案する。
この手法は,学習中のミニバッチサイズを適応的に調整することにより,ハイブリッド(確率的-決定論的)な設定で動作する。
論文 参考訳(メタデータ) (2021-07-15T19:08:58Z) - Deep Multimodal Fusion by Channel Exchanging [87.40768169300898]
本稿では,異なるモードのサブネットワーク間で動的にチャネルを交換するパラメータフリーマルチモーダル融合フレームワークを提案する。
このような交換プロセスの有効性は、畳み込みフィルタを共有してもBN層をモダリティで分離しておくことで保証される。
論文 参考訳(メタデータ) (2020-11-10T09:53:20Z) - Searching Multi-Rate and Multi-Modal Temporal Enhanced Networks for
Gesture Recognition [89.0152015268929]
RGB-Dジェスチャ認識のための最初のニューラルアーキテクチャサーチ(NAS)手法を提案する。
提案手法は,1)3次元中央差分畳畳み込み(3D-CDC)ファミリーによる時間的表現の強化,および多モードレート分岐と横方向接続のための最適化されたバックボーンを含む。
結果として得られたマルチレートネットワークは、RGBと深さ変調と時間力学の関係を理解するための新しい視点を提供する。
論文 参考訳(メタデータ) (2020-08-21T10:45:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。