論文の概要: Unsupervised Video Person Re-identification via Noise and Hard frame
Aware Clustering
- arxiv url: http://arxiv.org/abs/2106.05441v1
- Date: Thu, 10 Jun 2021 00:52:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-12 21:05:31.745762
- Title: Unsupervised Video Person Re-identification via Noise and Hard frame
Aware Clustering
- Title(参考訳): 騒音・フレーム認識クラスタリングによる教師なし映像人物の再識別
- Authors: Pengyu Xie, Xin Xu, Zheng Wang, and Toshihiko Yamasaki
- Abstract要約: 教師なしビデオベースの人物識別(re-ID)手法は、画像ベースのものよりも、ビデオトラックレットからよりリッチな特徴を抽出する。
本稿では,ノイズ・ハードフレーム・アウェア・クラスタリング(NHAC)手法を提案する。
- 参考スコア(独自算出の注目度): 35.721091621607385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised video-based person re-identification (re-ID) methods extract
richer features from video tracklets than image-based ones. The
state-of-the-art methods utilize clustering to obtain pseudo-labels and train
the models iteratively. However, they underestimate the influence of two kinds
of frames in the tracklet: 1) noise frames caused by detection errors or heavy
occlusions exist in the tracklet, which may be allocated with unreliable labels
during clustering; 2) the tracklet also contains hard frames caused by pose
changes or partial occlusions, which are difficult to distinguish but
informative. This paper proposes a Noise and Hard frame Aware Clustering (NHAC)
method. NHAC consists of a graph trimming module and a node re-sampling module.
The graph trimming module obtains stable graphs by removing noise frame nodes
to improve the clustering accuracy. The node re-sampling module enhances the
training of hard frame nodes to learn rich tracklet information. Experiments
conducted on two video-based datasets demonstrate the effectiveness of the
proposed NHAC under the unsupervised re-ID setting.
- Abstract(参考訳): 教師なしビデオベース人物識別(re-ID)手法は、画像ベースよりもビデオトラッカーからリッチな特徴を抽出する。
最先端の手法はクラスタリングを利用して擬似ラベルを取得し、反復的にモデルをトレーニングする。
しかし、トラックレット内の2種類のフレームの影響を過小評価している: 1) 検出エラーや重閉塞によるノイズフレームがトラックレット内に存在し、クラスタリング中に信頼できないラベルが割り当てられる可能性がある; 2) トラックレットには、ポーズの変化や部分閉塞による硬いフレームが含まれており、識別が難しい。
本稿では,ノイズ・ハードフレーム・アウェア・クラスタリング(NHAC)手法を提案する。
NHACはグラフトリミングモジュールとノード再サンプリングモジュールで構成される。
グラフトリミングモジュールは、ノイズフレームノードを除去して安定したグラフを取得し、クラスタリング精度を向上させる。
ノード再サンプリングモジュールは、ハードフレームノードのトレーニングを強化し、豊富なトラックレット情報を学ぶ。
2つのビデオベースデータセットで実施された実験は、教師なしのre-ID設定の下で提案されたNHACの有効性を示す。
関連論文リスト
- Unleashing the Potential of Tracklets for Unsupervised Video Person Re-Identification [40.83058938096914]
本稿では、教師なしの映像人物の再識別を促進するためのSSR-C(Self-Supervised Refined Clustering)フレームワークを提案する。
教師なしビデオ人物再同定のためのSSR-Cは最先端の教師付き手法に匹敵する結果が得られる。
論文 参考訳(メタデータ) (2024-06-20T12:30:12Z) - SSVOD: Semi-Supervised Video Object Detection with Sparse Annotations [12.139451002212063]
SSVODはビデオのモーションダイナミクスを利用して、スパースアノテーション付き大規模未ラベルフレームを利用する。
提案手法は,ImageNet-VID, Epic-KITCHENS, YouTube-VISの既存手法に比べて,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-09-04T06:41:33Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Cleaning Label Noise with Clusters for Minimally Supervised Anomaly
Detection [26.062659852373653]
ビデオレベルラベルのみを用いてトレーニングした弱い教師付き異常検出法を定式化する。
提案手法は UCF-crime と ShanghaiTech のデータセットでそれぞれ78.27% と84.16% のフレームレベル AUC が得られる。
論文 参考訳(メタデータ) (2021-04-30T06:03:24Z) - Weakly Supervised Video Salient Object Detection [79.51227350937721]
本稿では,relabeled relabeled "fixation guided scribble annotations" に基づく最初の弱教師付きビデオサリエント物体検出モデルを提案する。
効果的なマルチモーダル学習と長期時間文脈モデリングを実現するために,「アプレンス・モーション・フュージョン・モジュール」と双方向のConvLSTMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-06T09:48:38Z) - Learning to Track Instances without Video Annotations [85.9865889886669]
本稿では,ラベル付き画像データセットとラベルなしビデオシーケンスのみを用いたインスタンス追跡ネットワークを学習する,新しい半教師付きフレームワークを提案する。
画像のみを訓練しても,学習した特徴表現は出現の変動にロバストであることが判明した。
さらに、このモジュールを単一ステージのインスタンスセグメンテーションとポーズ推定フレームワークに統合します。
論文 参考訳(メタデータ) (2021-04-01T06:47:41Z) - ANL: Anti-Noise Learning for Cross-Domain Person Re-Identification [25.035093667770052]
2つのモジュールを含むアンチノイズラーニング(ANL)アプローチを提案します。
FDAモジュールは、カメラ回りのコントラスト学習と逆適応を通じて、ID関連サンプルを収集し、ID非関連サンプルを分散するように設計されています。
reliable sample selection(rss)モジュールは、ノイズラベルを訂正し、メインモデルの信頼できるサンプルを選択するために補助モデルを使用する。
論文 参考訳(メタデータ) (2020-12-27T02:38:45Z) - A Self-Reasoning Framework for Anomaly Detection Using Video-Level
Labels [17.615297975503648]
監視ビデオにおける異常事象の検出は、画像およびビデオ処理コミュニティの間で困難かつ実践的な研究課題である。
本稿では、ビデオレベルラベルのみを用いて自己推論方式で訓練されたディープニューラルネットワークに基づく、弱い教師付き異常検出フレームワークを提案する。
提案するフレームワークは,UCF-crimeやShanghaiTech,Ped2など,公開されている実世界の異常検出データセット上で評価されている。
論文 参考訳(メタデータ) (2020-08-27T02:14:15Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。