論文の概要: Attention-based Dual-stream Vision Transformer for Radar Gait
Recognition
- arxiv url: http://arxiv.org/abs/2111.12290v1
- Date: Wed, 24 Nov 2021 06:16:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 16:11:50.914178
- Title: Attention-based Dual-stream Vision Transformer for Radar Gait
Recognition
- Title(参考訳): レーダー歩行認識のためのアテンションベースデュアルストリーム視覚変換器
- Authors: Shiliang Chen, Wentao He, Jianfeng Ren, Xudong Jiang
- Abstract要約: レーダー歩行認識は、光の変動に頑丈で、プライバシーに対する侵害も少ない。
本研究では、注意に基づく融合を伴う2重ストリームニューラルネットワークを提案し、識別情報を完全集約する。
提案手法は,レーダ歩行認識のための大規模なベンチマークデータセット上で検証され,最先端のソリューションよりも著しく優れていることを示す。
- 参考スコア(独自算出の注目度): 24.90100456414406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Radar gait recognition is robust to light variations and less infringement on
privacy. Previous studies often utilize either spectrograms or cadence velocity
diagrams. While the former shows the time-frequency patterns, the latter
encodes the repetitive frequency patterns. In this work, a dual-stream neural
network with attention-based fusion is proposed to fully aggregate the
discriminant information from these two representations. The both streams are
designed based on the Vision Transformer, which well captures the gait
characteristics embedded in these representations. The proposed method is
validated on a large benchmark dataset for radar gait recognition, which shows
that it significantly outperforms state-of-the-art solutions.
- Abstract(参考訳): レーダー歩行認識は、光の変動に頑丈で、プライバシーに対する侵害も少ない。
以前の研究では、しばしば分光図またはケイデンス速度図を利用する。
前者は時間周波数パターンを示し、後者は繰り返し周波数パターンを符号化する。
本研究では,これら2つの表現から識別情報を完全に集約するために,注意に基づく融合を用いた2ストリームニューラルネットワークを提案する。
両方のストリームはVision Transformerに基づいて設計されており、これらの表現に埋め込まれた歩行特性をうまく捉えている。
提案手法は,レーダ歩行認識のための大規模なベンチマークデータセット上で検証され,最先端のソリューションよりも著しく優れていることを示す。
関連論文リスト
- Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - G3R: Generating Rich and Fine-grained mmWave Radar Data from 2D Videos for Generalized Gesture Recognition [19.95047010486547]
我々は、リッチな2Dビデオを利用してリアルなレーダデータを生成するソフトウェアパイプラインを開発した。
ユーザジェスチャの多彩できめ細かな反射特性をシミュレートする課題に対処する。
我々は、公開データソースと自己収集現実レーダデータからの2Dビデオを用いて、G3Rを実装し、評価する。
論文 参考訳(メタデータ) (2024-04-23T11:22:59Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - Semantic Segmentation of Radar Detections using Convolutions on Point
Clouds [59.45414406974091]
本稿では,レーダ検出を点雲に展開する深層学習手法を提案する。
このアルゴリズムは、距離依存クラスタリングと入力点雲の事前処理により、レーダ固有の特性に適応する。
我々のネットワークは、レーダポイント雲のセマンティックセグメンテーションのタスクにおいて、PointNet++に基づく最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-05-22T07:09:35Z) - T-FFTRadNet: Object Detection with Swin Vision Transformers from Raw ADC
Radar Signals [0.0]
周波数変調連続波レーダを用いた物体検出は、自律システムの分野でますます人気が高まっている。
レーダーは、LiDARのような他の放射型センサーで見られるような欠点を持っておらず、主に雨や雪などの気象条件による帰還信号の劣化や損失がある。
本稿では,レーダ物体検出の分野に階層型スウィンビジョントランスフォーマーを導入し,前処理で異なる入力に対して,異なるレーダ構成で操作可能であることを示す。
論文 参考訳(メタデータ) (2023-03-29T18:04:19Z) - HDNet: Hierarchical Dynamic Network for Gait Recognition using
Millimeter-Wave Radar [13.19744551082316]
mmWaveレーダを用いた歩行認識のための階層型動的ネットワーク(HDNet)を提案する。
提案手法の優位性を証明するため,2つの公開ミリ波レーダに基づく歩行認識データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-11-01T07:34:22Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - Waveform Selection for Radar Tracking in Target Channels With Memory via
Universal Learning [14.796960833031724]
シーンの状態に関する部分的な情報を用いてレーダーの波形を適応させることは、多くの現実的なシナリオにおいてパフォーマンス上の利点をもたらすことが示されている。
本研究では,レーダ環境インタフェースの圧縮モデルを構築するレーダシステムについて,文脈木として検討する。
提案手法はシミュレーション実験で検証され、2つの最先端波形選択方式による追従性能の向上が示されている。
論文 参考訳(メタデータ) (2021-08-02T21:27:56Z) - Fake Visual Content Detection Using Two-Stream Convolutional Neural
Networks [14.781702606707642]
周波数領域と空間領域の特徴を補完する2ストリーム畳み込みニューラルネットワークアーキテクチャであるTwoStreamNetを提案する。
提案手法は, 現状の偽コンテンツ検出装置に比べ, 大幅に性能が向上した。
論文 参考訳(メタデータ) (2021-01-03T18:05:07Z) - RadarNet: Exploiting Radar for Robust Perception of Dynamic Objects [73.80316195652493]
我々は、自動運転車の文脈における認識のためにRadarを利用する問題に取り組む。
我々は、LiDARとRadarの両方のセンサーを知覚に利用した新しいソリューションを提案する。
RadarNetと呼ばれる我々のアプローチは、ボクセルベースの早期核融合と注意に基づく後期核融合を特徴としている。
論文 参考訳(メタデータ) (2020-07-28T17:15:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。