論文の概要: A Novel end-to-end Framework for Occluded Pixel Reconstruction with
Spatio-temporal Features for Improved Person Re-identification
- arxiv url: http://arxiv.org/abs/2304.07721v1
- Date: Sun, 16 Apr 2023 08:14:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 17:37:55.649424
- Title: A Novel end-to-end Framework for Occluded Pixel Reconstruction with
Spatio-temporal Features for Improved Person Re-identification
- Title(参考訳): 時空間的特徴を有するオクルード画素再構成のための新しいエンド・ツー・エンドフレームワークによる人物再同定
- Authors: Prathistith Raj Medi, Ghanta Sai Krishna, Praneeth Nemani,
Satyanarayana Vollala, Santosh Kumar
- Abstract要約: 人の身元確認は、公共の安全を高めるために群衆の動きを監視し、追跡するために不可欠である。
本研究では、ディープニューラルネットワークからなるRGB画像/映像の効果的な閉塞検出・再構成フレームワークを開発することにより、有効な解を提案する。
具体的には、CNNベースのオクルージョン検出モデルが個々の入力フレームを分類し、次いでConv-LSTMおよびオートエンコーダを用いて、シーケンシャル(ビデオ)および非シーケンシャル(画像)データに対して、オクルードされたフレームに対応するオクルード画素を再構成する。
- 参考スコア(独自算出の注目度): 0.842885453087587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Person re-identification is vital for monitoring and tracking crowd movement
to enhance public security. However, re-identification in the presence of
occlusion substantially reduces the performance of existing systems and is a
challenging area. In this work, we propose a plausible solution to this problem
by developing effective occlusion detection and reconstruction framework for
RGB images/videos consisting of Deep Neural Networks. Specifically, a CNN-based
occlusion detection model classifies individual input frames, followed by a
Conv-LSTM and Autoencoder to reconstruct the occluded pixels corresponding to
the occluded frames for sequential (video) and non-sequential (image) data,
respectively. The quality of the reconstructed RGB frames is further refined
and fine-tuned using a Conditional Generative Adversarial Network (cGAN). Our
method is evaluated on four well-known public data sets of the domain, and the
qualitative reconstruction results are indeed appealing. Quantitative
evaluation in terms of re-identification accuracy of the Siamese network showed
an exceptional Rank-1 accuracy after occluded pixel reconstruction on various
datasets. A comparative analysis with state-of-the-art approaches also
demonstrates the robustness of our work for use in real-life surveillance
systems.
- Abstract(参考訳): 人身元確認は、大衆の安全を高めるために群衆の動きを監視し追跡するために不可欠である。
しかし,隠蔽の存在下での再同定は既存システムの性能を大幅に低下させ,課題となっている。
本研究では,深層ニューラルネットワークを用いたrgb画像/映像の効果的なオクルージョン検出および再構成フレームワークを開発することにより,この問題に対する合理的な解決法を提案する。
具体的には、CNNベースのオクルージョン検出モデルは、個別の入力フレームを分類し、次いでConv-LSTMとオートエンコーダとで、シーケンシャル(ビデオ)データと非シーケンシャル(画像)データに対応する隠蔽画素を再構成する。
再構成されたRGBフレームの品質をさらに改善し、条件付き生成逆数ネットワーク(cGAN)を用いて微調整する。
本手法はドメインの4つのよく知られた公開データセット上で評価され,質的再構成結果が実に魅力的である。
シームズネットワークの再同定精度の定量的評価は, 様々なデータセット上で画素再構成を行った後, 例外的なランク1精度を示した。
最先端のアプローチとの比較分析はまた、実生活監視システムにおける我々の仕事の堅牢性を示している。
関連論文リスト
- Multi-feature Reconstruction Network using Crossed-mask Restoration for Unsupervised Industrial Anomaly Detection [4.742650815342744]
産業生産における品質検査には, 教師なし異常検出が重要である。
本稿では,クロスマスク復元を用いた多機能再構成ネットワークMFRNetを提案する。
提案手法は,4つの公開データセットと1つの自作データセットにおいて,他の最先端のデータセットと高い競争力,あるいは大幅に上回っている。
論文 参考訳(メタデータ) (2024-04-20T05:13:56Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Uncertainty-Aware Null Space Networks for Data-Consistent Image
Reconstruction [0.0]
近年の深層学習の進歩をもとに,最先端の再構築手法が開発されている。
医用画像などの安全クリティカルな領域で使用するためには, ネットワーク再構築は, 利用者に再構成画像を提供するだけでなく, ある程度の信頼を得る必要がある。
この研究は、入力依存のスケールマップを推定することによって、データ依存の不確実性をモデル化する逆問題に対する最初のアプローチである。
論文 参考訳(メタデータ) (2023-04-14T06:58:44Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - Gait Cycle Reconstruction and Human Identification from Occluded
Sequences [2.198430261120653]
我々は,歩行認識を行う前に,隠蔽されたフレームを入力シーケンスで再構築する有効なニューラルネットワークモデルを提案する。
我々はLSTMネットワークを用いて,前向きと後向きの両方から隠蔽フレームの埋め込みを予測する。
LSTMは平均二乗損失を最小限に抑えるために訓練されるが、核融合ネットワークは、接地構造と再構成されたサンプルの間の画素単位のクロスエントロピー損失を最適化するために訓練される。
論文 参考訳(メタデータ) (2022-06-20T16:04:31Z) - BGaitR-Net: Occluded Gait Sequence reconstructionwith temporally
constrained model for gait recognition [1.151614782416873]
入力シーケンスで隠蔽されたフレームを識別する,新しいディープラーニングベースのアルゴリズムを開発した。
次に、歩行シーケンスに存在する次の時間情報を利用して、これらのフレームを再構築する。
我々のLSTMモデルでは,歩行周期の周期パターンと時間的に整合するフレームを再構成し,オクルージョンを生成する。
論文 参考訳(メタデータ) (2021-10-18T18:28:18Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Limited View Tomographic Reconstruction Using a Deep Recurrent Framework
with Residual Dense Spatial-Channel Attention Network and Sinogram
Consistency [25.16002539710169]
本稿では,同じブロックを複数回積み重ねる新しい繰り返し再構成フレームワークを提案する。
本研究では, 再帰的なブロックの中間出力のシングラムと一致するように, リカレント・フレームワークにインターリーブされたシングラム整合層を構築した。
本アルゴリズムは, 狭角化と狭角化の両面において, 既存の最先端のニューラル手法よりも一貫した, 顕著な改善を実現している。
論文 参考訳(メタデータ) (2020-09-03T16:39:48Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。