論文の概要: Gait Cycle Reconstruction and Human Identification from Occluded
Sequences
- arxiv url: http://arxiv.org/abs/2206.13395v1
- Date: Mon, 20 Jun 2022 16:04:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 00:49:45.147384
- Title: Gait Cycle Reconstruction and Human Identification from Occluded
Sequences
- Title(参考訳): 付加配列からの歩行周期の再構築と人間の同定
- Authors: Abhishek Paul, Manav Mukesh Jain, Jinesh Jain, Pratik Chattopadhyay
- Abstract要約: 我々は,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
我々はLSTMネットワークを用いて,前向きと後向きの両方から隠蔽フレームの埋め込みを予測する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
- 参考スコア(独自算出の注目度): 2.198430261120653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gait-based person identification from videos captured at surveillance sites
using Computer Vision-based techniques is quite challenging since these walking
sequences are usually corrupted with occlusion, and a complete cycle of gait is
not always available. In this work, we propose an effective neural
network-based model to reconstruct the occluded frames in an input sequence
before carrying out gait recognition. Specifically, we employ LSTM networks to
predict an embedding for each occluded frame both from the forward and the
backward directions, and next fuse the predictions from the two LSTMs by
employing a network of residual blocks and convolutional layers. While the
LSTMs are trained to minimize the mean-squared loss, the fusion network is
trained to optimize the pixel-wise cross-entropy loss between the ground-truth
and the reconstructed samples. Evaluation of our approach has been done using
synthetically occluded sequences generated from the OU-ISIR LP and CASIA-B data
and real-occluded sequences present in the TUM-IITKGP data. The effectiveness
of the proposed reconstruction model has been verified through the Dice score
and gait-based recognition accuracy using some popular gait recognition
methods. Comparative study with existing occlusion handling methods in gait
recognition highlights the superiority of our proposed occlusion reconstruction
approach over the others.
- Abstract(参考訳): コンピュータビジョンに基づく技術を用いて監視サイトで撮影された映像からの歩行に基づく人物識別は、通常これらの歩行シーケンスは閉塞で腐敗しており、歩行の完全なサイクルが常に利用可能であるとは限らないため、非常に困難である。
本研究では,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
具体的には、各隠蔽フレームの前後方向の埋め込みをLSTMネットワークを用いて予測し、次に残留ブロックと畳み込み層のネットワークを用いて2つのLSTMからの予測を融合する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
提案手法の評価は,OU-ISIR LPおよびCASIA-BデータとTUM-IITKGPデータ中の実包摂配列から生成された合成包摂配列を用いて行った。
提案手法の有効性は,一般的な歩行認識手法を用いて,Diceスコアと歩行に基づく認識精度を用いて検証されている。
歩行認識における既存のオクルージョンハンドリング手法との比較研究は,提案したオクルージョン再構築手法が他よりも優れていることを示す。
関連論文リスト
- Comprehensive Botnet Detection by Mitigating Adversarial Attacks, Navigating the Subtleties of Perturbation Distances and Fortifying Predictions with Conformal Layers [1.6001193161043425]
ボットネット(Botnet)は、悪意あるアクターによって制御されるコンピュータネットワークで、重要なサイバーセキュリティ上の課題を提示する。
本研究は、機械学習ベースのボットネット検出システムを弱体化させることを目的として、攻撃者が引き起こす高度な敵操作に対処する。
ISCXデータセットとISOTデータセットに基づいてトレーニングされた機械学習とディープラーニングアルゴリズムを活用するフローベース検出アプローチを導入する。
論文 参考訳(メタデータ) (2024-09-01T08:53:21Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - A Novel end-to-end Framework for Occluded Pixel Reconstruction with
Spatio-temporal Features for Improved Person Re-identification [0.842885453087587]
人の身元確認は、公共の安全を高めるために群衆の動きを監視し、追跡するために不可欠である。
本研究では、ディープニューラルネットワークからなるRGB画像/映像の効果的な閉塞検出・再構成フレームワークを開発することにより、有効な解を提案する。
具体的には、CNNベースのオクルージョン検出モデルが個々の入力フレームを分類し、次いでConv-LSTMおよびオートエンコーダを用いて、シーケンシャル(ビデオ)および非シーケンシャル(画像)データに対して、オクルードされたフレームに対応するオクルード画素を再構成する。
論文 参考訳(メタデータ) (2023-04-16T08:14:29Z) - Stable Deep MRI Reconstruction using Generative Priors [13.400444194036101]
本稿では,参照等級画像のみを生成的設定でトレーニングした,新しいディープニューラルネットワークベース正規化器を提案する。
その結果,最先端のディープラーニング手法に匹敵する競争性能が示された。
論文 参考訳(メタデータ) (2022-10-25T08:34:29Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Robust lEarned Shrinkage-Thresholding (REST): Robust unrolling for
sparse recover [87.28082715343896]
我々は、モデルミス特定を前進させるのに堅牢な逆問題を解決するためのディープニューラルネットワークについて検討する。
我々は,アルゴリズムの展開手法を根底にある回復問題のロバストバージョンに適用することにより,新しい堅牢なディープニューラルネットワークアーキテクチャを設計する。
提案したRESTネットワークは,圧縮センシングとレーダイメージングの両問題において,最先端のモデルベースおよびデータ駆動アルゴリズムを上回る性能を示す。
論文 参考訳(メタデータ) (2021-10-20T06:15:45Z) - BGaitR-Net: Occluded Gait Sequence reconstructionwith temporally
constrained model for gait recognition [1.151614782416873]
入力シーケンスで隠蔽されたフレームを識別する,新しいディープラーニングベースのアルゴリズムを開発した。
次に、歩行シーケンスに存在する次の時間情報を利用して、これらのフレームを再構築する。
我々のLSTMモデルでは,歩行周期の周期パターンと時間的に整合するフレームを再構成し,オクルージョンを生成する。
論文 参考訳(メタデータ) (2021-10-18T18:28:18Z) - Using Deep Image Priors to Generate Counterfactual Explanations [38.62513524757573]
ディープ画像先行(DIP)は、潜在表現エンコーディングからプレイメージを得るために用いられる。
本稿では,予測器と共同で学習した補助損失推定器に基づく新たな正規化戦略を提案する。
論文 参考訳(メタデータ) (2020-10-22T20:40:44Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。