Fugu-MT 論文翻訳(概要): Multidomain Multimodal Fusion For Human Action Recognition Using Inertial Sensors

論文の概要: Multidomain Multimodal Fusion For Human Action Recognition Using Inertial Sensors

arxiv url: http://arxiv.org/abs/2008.09748v1
Date: Sat, 22 Aug 2020 03:46:12 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-26 07:36:45.283899
Title: Multidomain Multimodal Fusion For Human Action Recognition Using Inertial Sensors
Title（参考訳）: 慣性センサを用いた人間行動認識のためのマルチドメインマルチモーダルフュージョン
Authors: Zeeshan Ahmad and Naimul Khan
Abstract要約: 入力モダリティの異なる領域から相補的特徴と相補的特徴を抽出する新しいマルチドメイン多モード融合フレームワークを提案する。異なる領域の特徴は畳み込みニューラルネットワーク(CNN)によって抽出され、続いてCCF(Canonical correlation based Fusion)によって融合され、人間の行動認識の精度が向上する。
参考スコア（独自算出の注目度）: 1.52292571922932
License: http://creativecommons.org/licenses/by/4.0/
Abstract: One of the major reasons for misclassification of multiplex actions during action recognition is the unavailability of complementary features that provide the semantic information about the actions. In different domains these features are present with different scales and intensities. In existing literature, features are extracted independently in different domains, but the benefits from fusing these multidomain features are not realized. To address this challenge and to extract complete set of complementary information, in this paper, we propose a novel multidomain multimodal fusion framework that extracts complementary and distinct features from different domains of the input modality. We transform input inertial data into signal images, and then make the input modality multidomain and multimodal by transforming spatial domain information into frequency and time-spectrum domain using Discrete Fourier Transform (DFT) and Gabor wavelet transform (GWT) respectively. Features in different domains are extracted by Convolutional Neural networks (CNNs) and then fused by Canonical Correlation based Fusion (CCF) for improving the accuracy of human action recognition. Experimental results on three inertial datasets show the superiority of the proposed method when compared to the state-of-the-art.
Abstract（参考訳）: アクション認識中に多重アクションを誤分類する主な理由の1つは、アクションに関する意味的な情報を提供する補完機能がないことである。異なるドメインでは、これらの特徴は異なるスケールと強度で存在します。既存の文献では、特徴は異なるドメインで独立に抽出されるが、これらのマルチドメイン機能の融合による利点は実現されていない。本稿では,この課題に対処し,補完的情報の完全集合を抽出するため,入力モダリティの異なる領域から相補的かつ識別的な特徴を抽出する,新しいマルチドメインマルチモーダル融合フレームワークを提案する。入力慣性データを信号画像に変換し,それぞれ離散フーリエ変換(DFT)とガボルウェーブレット変換(GWT)を用いて空間領域情報を周波数および時間スペクトル領域に変換することにより,入力モダリティ多重領域とマルチモーダルを生成する。異なる領域の特徴は畳み込みニューラルネットワーク(CNN)によって抽出され、続いてCCF(Canonical correlation based Fusion)によって融合され、人間の行動認識の精度が向上する。 3つの慣性データセットに対する実験結果から,提案手法の最先端性を示した。

関連論文リスト

Single-Domain Generalized Object Detection by Balancing Domain Diversity and Invariance [4.782038032310931]
オブジェクト検出のための単一ドメイン一般化(S-DGOD)は、単一のソースドメインから未知のターゲットドメインに知識を転送することを目的としている。ドメイン間の固有の多様性のため、不変性に過度に重点を置いていると、モデルが実際の画像の違いを見落としてしまう可能性がある。
論文参考訳（メタデータ） (2025-02-06T07:41:24Z)
Integrating Frequency Guidance into Multi-source Domain Generalization for Bearing Fault Diagnosis [24.85752780864944]
本稿では,FARNetというFourierベースのAugmentation Restruction Networkを提案する。本発明のネットワークは、振幅スペクトルサブネットワークと位相スペクトルサブネットワークとから構成され、ソースドメインとターゲットドメインとの相違を順次低減する。モデル出力の決定境界を従来の三重項損失と比較して洗練するために,一般化に寄与する多様体三重項損失を提案する。
論文参考訳（メタデータ） (2025-02-01T20:23:03Z)
Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文参考訳（メタデータ） (2024-12-05T06:15:08Z)
Investigating the potential of Sparse Mixtures-of-Experts for multi-domain neural machine translation [59.41178047749177]
トレーニング中に見られるさまざまなドメインのデータを扱うことができ、トレーニング中に見つからないドメインに対して堅牢な効率的なモデルを開発することを目的として、マルチドメインニューラルネットワーク翻訳に重点を置いている。 SMOE(Sparse Mixture-of-Experts)モデルは、効率的なモデルスケーリングを可能にするため、このタスクに適していると仮定する。マルチドメインシナリオにおけるSMoEの有用性を検証するための一連の実験を行い、Transformerの簡単な幅スケーリングは、実際はよりシンプルで驚くほど効率的なアプローチであり、SMoEと同等の性能レベルに達することを発見した。
論文参考訳（メタデータ） (2024-07-01T09:45:22Z)
A Multi-Stage Adaptive Feature Fusion Neural Network for Multimodal Gait Recognition [15.080096318551346]
多くの既存の歩行認識アルゴリズムは単調であり、少数のマルチモーダル歩行認識アルゴリズムは一度だけマルチモーダル融合を行う。特徴抽出プロセスの異なる段階において多段階の融合を行う多段階特徴融合戦略(MSFFS)を提案する。また,シルエットと骨格のセマンティックな関連性を考慮したAFFM(Adaptive Feature fusion Module)を提案する。
論文参考訳（メタデータ） (2023-12-22T03:25:15Z)
Unified Contrastive Fusion Transformer for Multimodal Human Action Recognition [13.104967563769533]
我々は、Unified Contrastive Fusion Transformer (UCFFormer)と呼ばれる新しいマルチモーダル核融合アーキテクチャを導入する。 UCFFormerは、人間の行動認識(HAR)性能を向上させるために、さまざまなディストリビューションとデータを統合する。 We present the Factorized Time-Modality Attention to perform self-attention for the Unified Transformer。
論文参考訳（メタデータ） (2023-09-10T14:10:56Z)
Improving Anomaly Segmentation with Multi-Granularity Cross-Domain Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文参考訳（メタデータ） (2023-08-16T22:54:49Z)
Learning multi-domain feature relation for visible and Long-wave Infrared image patch matching [39.88037892637296]
我々は、VL-CMIMと呼ばれる最大の可視・長波長赤外線画像パッチマッチングデータセットを提示する。さらに,マルチドメイン特徴関連学習ネットワーク(MD-FRN)を提案する。
論文参考訳（メタデータ） (2023-08-09T11:23:32Z)
Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment [59.831917206058435]
ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文参考訳（メタデータ） (2023-01-01T08:38:07Z)
Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文参考訳（メタデータ） (2022-02-10T06:23:56Z)
Variational Attention: Propagating Domain-Specific Knowledge for Multi-Domain Learning in Crowd Counting [75.80116276369694]
群集カウントでは, 激しいラベル付けの問題により, 新しい大規模データセットを収集する難易度が知覚される。マルチドメイン共同学習を活用し,DKPNet(Domain-specific Knowledge Propagating Network)を提案する。主に、異なるドメインに対する注意分布を明示的にモデル化する、新しい変動注意法(VA)技術を提案する。
論文参考訳（メタデータ） (2021-08-18T08:06:37Z)
AFAN: Augmented Feature Alignment Network for Cross-Domain Object Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文参考訳（メタデータ） (2021-06-10T05:01:20Z)
Learning to Combine: Knowledge Aggregation for Multi-Source Domain Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文参考訳（メタデータ） (2020-07-17T07:52:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。