論文の概要: Camera-Conditioned Stable Feature Generation for Isolated Camera
Supervised Person Re-IDentification
- arxiv url: http://arxiv.org/abs/2203.15210v1
- Date: Tue, 29 Mar 2022 03:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 06:52:26.614505
- Title: Camera-Conditioned Stable Feature Generation for Isolated Camera
Supervised Person Re-IDentification
- Title(参考訳): 孤立型カメラ監視者再識別のためのカメラコンディショニング安定特徴生成
- Authors: Chao Wu, Wenhang Ge, Ancong Wu, Xiaobin Chang
- Abstract要約: クロスカメラ画像は、ISolated Camera Supervised 設定下では利用できない可能性がある。
新しいパイプラインは、モデルトレーニングのためにフィーチャースペース内のクロスカメラサンプルを合成することによって導入される。
2つのISCS人物Re-IDデータセットの実験は、競合相手に対するCCSFGの優位性を実証している。
- 参考スコア(独自算出の注目度): 24.63519986072777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To learn camera-view invariant features for person Re-IDentification (Re-ID),
the cross-camera image pairs of each person play an important role. However,
such cross-view training samples could be unavailable under the ISolated Camera
Supervised (ISCS) setting, e.g., a surveillance system deployed across distant
scenes.To handle this challenging problem, a new pipeline is introduced by
synthesizing the cross-camera samples in the feature space for model training.
Specifically, the feature encoder and generator are end-to-end optimized under
a novel method, Camera-Conditioned Stable Feature Generation (CCSFG). Its joint
learning procedure raises concern on the stability of generative model
training. Therefore, a new feature generator, $\sigma$-Regularized Conditional
Variational Autoencoder ($\sigma$-Reg.~CVAE), is proposed with theoretical and
experimental analysis on its robustness. Extensive experiments on two ISCS
person Re-ID datasets demonstrate the superiority of our CCSFG to the
competitors.
- Abstract(参考訳): 人物再識別のためのカメラビュー不変特徴(re-id)を学習するために、各人物のクロスカメラ画像対が重要な役割を果たす。
しかし、このようなクロスビュートレーニングサンプルは、例えば遠方のシーンに展開する監視システムなど、孤立したカメラ監視(isc)設定下では使用できない可能性があり、この課題に対処するために、モデルトレーニングのための機能空間におけるクロスカメラサンプルを合成することで、新たなパイプラインを導入する。
特に、特徴エンコーダ及びジェネレータは、カメラコンディネート安定特徴生成(ccsfg)という新しい方法の下でエンドツーエンドに最適化される。
その共同学習手順は、生成モデルトレーニングの安定性を懸念する。
従って、新しい機能ジェネレータである$\sigma$-Regularized Conditional Variational Autoencoder($\sigma$-Reg)がある。
CVAE) は, その堅牢性に関する理論的および実験的解析によって提案されている。
ISCSの2つのRe-IDデータセットに対する大規模な実験は、競合相手に対するCCSFGの優位性を実証している。
関連論文リスト
- TranStable: Towards Robust Pixel-level Online Video Stabilization by Jointing Transformer and CNN [3.0980248517369158]
ビデオの安定化は、しばしば歪みと過剰な収穫に苦しむ。
本稿では,これらの課題に対処する新しいエンドツーエンドフレームワークであるTranStableを提案する。
NUS、DeepStab、Selfieベンチマークの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-01-25T08:51:31Z) - OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3243031301164]
OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。
コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。
OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文 参考訳(メタデータ) (2024-11-22T17:55:15Z) - Robust Ensemble Person Re-Identification via Orthogonal Fusion with Occlusion Handling [4.431087385310259]
排除は、個人再識別(ReID)における大きな課題の1つとして残されている。
本稿では,CNN と Transformer アーキテクチャを併用し,ロバストな特徴表現を生成する深層アンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2024-03-29T18:38:59Z) - OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。
提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。
本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文 参考訳(メタデータ) (2024-03-18T07:41:39Z) - A Transformer Model for Boundary Detection in Continuous Sign Language [55.05986614979846]
Transformerモデルは、分離された手話認識と連続手話認識の両方に使用される。
トレーニングプロセスは、入力されたビデオから抽出された手指キーポイントの特徴を豊かにする、孤立した手指ビデオを使用する。
トレーニングされたモデルと後処理の手法が組み合わさって、連続した手話ビデオ内の孤立した手話境界を検出する。
論文 参考訳(メタデータ) (2024-02-22T17:25:01Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Domain-adaptive Person Re-identification without Cross-camera Paired
Samples [12.041823465553875]
長距離シーンから収集されたクロスカメラ歩行者のサンプルには、ポジティブなサンプルがないことが多い。
クロスカメラの負のサンプルを用いて、地域間歩行者の同一性マッチングを実現することは極めて困難である。
クロスカメラ一貫した識別特徴学習に焦点を当てた新しいドメイン適応型人物認識手法を提案する。
論文 参考訳(メタデータ) (2023-07-13T02:42:28Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - Joint Noise-Tolerant Learning and Meta Camera Shift Adaptation for
Unsupervised Person Re-Identification [60.36551512902312]
unsupervised person re-identification (re-ID) は、ラベルのないデータで識別モデルを学ぶことを目的としている。
一般的な方法としては、クラスタ化によって擬似ラベルを取得し、モデルを最適化するために使用する方法がある。
本稿では,両問題を解決するための統一フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-08T09:13:06Z) - Towards Precise Intra-camera Supervised Person Re-identification [54.86892428155225]
人物の再識別(Re-ID)のためのカメラ内監視(ICS)は、アイデンティティラベルが各カメラビュー内に独立してアノテートされていると仮定する。
カメラ間ラベルの欠如により、ICS Re-ID問題は、完全に監督されたラベルよりもはるかに難しい。
われわれの手法は、2つのデータセットで最先端の完全教師付き手法に匹敵する性能を発揮する。
論文 参考訳(メタデータ) (2020-02-12T11:56:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。