論文の概要: BGaitR-Net: Occluded Gait Sequence reconstructionwith temporally
constrained model for gait recognition
- arxiv url: http://arxiv.org/abs/2110.09564v1
- Date: Mon, 18 Oct 2021 18:28:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 04:35:25.524380
- Title: BGaitR-Net: Occluded Gait Sequence reconstructionwith temporally
constrained model for gait recognition
- Title(参考訳): BGaitR-Net:時間制約付き歩行認識モデルを用いた歩行系列再構成
- Authors: Somnath Sendhil Kumara, Pratik Chattopadhyaya, Lipo Wang
- Abstract要約: 入力シーケンスで隠蔽されたフレームを識別する,新しいディープラーニングベースのアルゴリズムを開発した。
次に、歩行シーケンスに存在する次の時間情報を利用して、これらのフレームを再構築する。
我々のLSTMモデルでは,歩行周期の周期パターンと時間的に整合するフレームを再構成し,オクルージョンを生成する。
- 参考スコア(独自算出の注目度): 1.151614782416873
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in computational resources and Deep Learning
methodologies has significantly benefited development of intelligent
vision-based surveillance applications. Gait recognition in the presence of
occlusion is one of the challenging research topics in this area, and the
solutions proposed by researchers to date lack in robustness and also dependent
of several unrealistic constraints, which limits their practical applicability.
We improve the state-of-the-art by developing novel deep learning-based
algorithms to identify the occluded frames in an input sequence and next
reconstruct these occluded frames by exploiting the spatio-temporal information
present in the gait sequence. The multi-stage pipeline adopted in this work
consists of key pose mapping, occlusion detection and reconstruction, and
finally gait recognition. While the key pose mapping and occlusion detection
phases are done %using Constrained KMeans Clustering and via a graph sorting
algorithm, reconstruction of occluded frames is done by fusing the key
pose-specific information derived in the previous step along with the
spatio-temporal information contained in a gait sequence using a Bi-Directional
Long Short Time Memory. This occlusion reconstruction model has been trained
using synthetically occluded CASIA-B and OU-ISIR data, and the trained model is
termed as Bidirectional Gait Reconstruction Network BGait-R-Net. Our LSTM-based
model reconstructs occlusion and generates frames that are temporally
consistent with the periodic pattern of a gait cycle, while simultaneously
preserving the body structure.
- Abstract(参考訳): 近年の計算資源と深層学習手法の進歩は、知的視覚に基づく監視アプリケーションの開発に大きく貢献している。
咬合の存在下での歩行認識は、この分野で難しい研究テーマの1つであり、研究者がこれまで提案してきた解決策は堅牢性が欠如しており、実用的な適用性を制限するいくつかの非現実的な制約にも依存している。
本稿では,入力列内のオクルードされたフレームを識別する新しいディープラーニングアルゴリズムを開発し,さらに,歩行列に存在する時空間情報を活用してこれらのオクルードされたフレームを再構築する。
本研究で採用されている多段階パイプラインは,キーポーズマッピング,咬合検出と再構成,最後に歩行認識からなる。
制約付きkmeansクラスタリングおよびグラフソートアルゴリズムを用いて、キーポーズマッピング及びオクルージョン検出フェーズを%で行う一方、双方向長短記憶を用いた歩行シーケンスに含まれる時空間情報とともに、前段のキーポーズ固有情報を用いてオクルードフレームの再構成を行う。
CASIA-B と OU-ISIR のデータを用いて,このオクルージョン再構成モデルを訓練し,双方向歩行再構成ネットワーク BGait-R-Net と呼ぶ。
LSTMモデルでは,歩行周期の周期パターンと時間的に一致したフレームを同時に保持しながら,咬合を再構成し,フレームを生成する。
関連論文リスト
- State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Revisiting the Temporal Modeling in Spatio-Temporal Predictive Learning
under A Unified View [73.73667848619343]
UTEP(Unified S-Temporal Predictive Learning)は,マイクロテンポラリスケールとマクロテンポラリスケールを統合した再帰的および再帰的フリーな手法を再構築する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2023-10-09T16:17:42Z) - A Novel end-to-end Framework for Occluded Pixel Reconstruction with
Spatio-temporal Features for Improved Person Re-identification [0.842885453087587]
人の身元確認は、公共の安全を高めるために群衆の動きを監視し、追跡するために不可欠である。
本研究では、ディープニューラルネットワークからなるRGB画像/映像の効果的な閉塞検出・再構成フレームワークを開発することにより、有効な解を提案する。
具体的には、CNNベースのオクルージョン検出モデルが個々の入力フレームを分類し、次いでConv-LSTMおよびオートエンコーダを用いて、シーケンシャル(ビデオ)および非シーケンシャル(画像)データに対して、オクルードされたフレームに対応するオクルード画素を再構成する。
論文 参考訳(メタデータ) (2023-04-16T08:14:29Z) - Gated Recurrent Neural Networks with Weighted Time-Delay Feedback [59.125047512495456]
重み付き時間遅延フィードバック機構を備えた新しいゲートリカレントユニット(GRU)を導入する。
我々は、$tau$-GRUが、最先端のリカレントユニットやゲート型リカレントアーキテクチャよりも早く収束し、より一般化できることを示します。
論文 参考訳(メタデータ) (2022-12-01T02:26:34Z) - Gait Cycle Reconstruction and Human Identification from Occluded
Sequences [2.198430261120653]
我々は,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
我々はLSTMネットワークを用いて,前向きと後向きの両方から隠蔽フレームの埋め込みを予測する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
論文 参考訳(メタデータ) (2022-06-20T16:04:31Z) - Recurrence-in-Recurrence Networks for Video Deblurring [58.49075799159015]
最先端のビデオデブロアリング法は、しばしばフレーム間の時間的依存性をモデル化するために、リカレントニューラルネットワークを採用する。
本稿では,短距離メモリの限界に対処する再帰型ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-12T11:58:13Z) - An Attention-based ConvLSTM Autoencoder with Dynamic Thresholding for
Unsupervised Anomaly Detection in Multivariate Time Series [2.9685635948299995]
本稿では,異常検出と診断を行うための動的閾値保持(ACLAE-DT)フレームワークを用いた非教師付き注意型畳み込み長短期記憶(ConvLSTM)オートエンコーダを提案する。
フレームワークは、システムステータスを特徴付ける機能イメージを構築する前に、データの事前処理と強化から始まります。
構築した特徴画像は注意に基づくConvLSTMオートエンコーダに入力される。
その後、再構成エラーを計算し、統計に基づく動的しきい値決定機構により異常を検出し診断する。
論文 参考訳(メタデータ) (2022-01-23T04:01:43Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。