Fugu-MT 論文翻訳(概要): Unsupervised Video Person Re-identification via Noise and Hard frame Aware Clustering

論文の概要: Unsupervised Video Person Re-identification via Noise and Hard frame Aware Clustering

arxiv url: http://arxiv.org/abs/2106.05441v1
Date: Thu, 10 Jun 2021 00:52:06 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-12 21:05:31.745762
Title: Unsupervised Video Person Re-identification via Noise and Hard frame Aware Clustering
Title（参考訳）: 騒音・フレーム認識クラスタリングによる教師なし映像人物の再識別
Authors: Pengyu Xie, Xin Xu, Zheng Wang, and Toshihiko Yamasaki
Abstract要約: 教師なしビデオベースの人物識別(re-ID)手法は、画像ベースのものよりも、ビデオトラックレットからよりリッチな特徴を抽出する。本稿では,ノイズ・ハードフレーム・アウェア・クラスタリング(NHAC)手法を提案する。
参考スコア（独自算出の注目度）: 35.721091621607385
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unsupervised video-based person re-identification (re-ID) methods extract richer features from video tracklets than image-based ones. The state-of-the-art methods utilize clustering to obtain pseudo-labels and train the models iteratively. However, they underestimate the influence of two kinds of frames in the tracklet: 1) noise frames caused by detection errors or heavy occlusions exist in the tracklet, which may be allocated with unreliable labels during clustering; 2) the tracklet also contains hard frames caused by pose changes or partial occlusions, which are difficult to distinguish but informative. This paper proposes a Noise and Hard frame Aware Clustering (NHAC) method. NHAC consists of a graph trimming module and a node re-sampling module. The graph trimming module obtains stable graphs by removing noise frame nodes to improve the clustering accuracy. The node re-sampling module enhances the training of hard frame nodes to learn rich tracklet information. Experiments conducted on two video-based datasets demonstrate the effectiveness of the proposed NHAC under the unsupervised re-ID setting.
Abstract（参考訳）: 教師なしビデオベース人物識別(re-ID)手法は、画像ベースよりもビデオトラッカーからリッチな特徴を抽出する。最先端の手法はクラスタリングを利用して擬似ラベルを取得し、反復的にモデルをトレーニングする。しかし、トラックレット内の2種類のフレームの影響を過小評価している: 1) 検出エラーや重閉塞によるノイズフレームがトラックレット内に存在し、クラスタリング中に信頼できないラベルが割り当てられる可能性がある; 2) トラックレットには、ポーズの変化や部分閉塞による硬いフレームが含まれており、識別が難しい。本稿では,ノイズ・ハードフレーム・アウェア・クラスタリング(NHAC)手法を提案する。 NHACはグラフトリミングモジュールとノード再サンプリングモジュールで構成される。グラフトリミングモジュールは、ノイズフレームノードを除去して安定したグラフを取得し、クラスタリング精度を向上させる。ノード再サンプリングモジュールは、ハードフレームノードのトレーニングを強化し、豊富なトラックレット情報を学ぶ。 2つのビデオベースデータセットで実施された実験は、教師なしのre-ID設定の下で提案されたNHACの有効性を示す。

関連論文リスト

Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
DIFFVSGG: Diffusion-Driven Online Video Scene Graph Generation [61.59996525424585]
DIFFVSGGはオンラインのVSGGソリューションで、このタスクを反復的なシーングラフ更新問題とみなしている。オブジェクト分類の復号化、境界ボックス回帰、グラフ生成の3つのタスクを1つの共有特徴埋め込みを用いて統合する。 DIFFVSGGはさらに、後続のフレームの予測が過去のフレームの結果をLCMの条件入力として活用する継続的時間的推論を促進する。
論文参考訳（メタデータ） (2025-03-18T06:49:51Z)
RDSA: A Robust Deep Graph Clustering Framework via Dual Soft Assignment [18.614842530666834]
我々は、Dual Soft Assignment (RDSA)を介してRobust Deep Graph Clustering Frameworkと呼ばれる新しいフレームワークを導入する。 RDSAは3つの主要なコンポーネントから構成される: (i) グラフのトポロジ的特徴とノード属性を効果的に統合するノード埋め込みモジュール、 (ii) ノード割り当てに親和性行列を利用することでグラフモジュラリティを改善する構造ベースのソフトアサインモジュール、 (iii) コミュニティランドマークを識別し、モデルの堅牢性を高めるためにノード割り当てを洗練させるノードベースのソフトアサインモジュール。我々はRDSAを実世界の様々なデータセットで評価し、既存の状態と比較して優れた性能を示す。
論文参考訳（メタデータ） (2024-10-29T05:18:34Z)
Unleashing the Potential of Tracklets for Unsupervised Video Person Re-Identification [40.83058938096914]
本稿では、教師なしの映像人物の再識別を促進するためのSSR-C(Self-Supervised Refined Clustering)フレームワークを提案する。教師なしビデオ人物再同定のためのSSR-Cは最先端の教師付き手法に匹敵する結果が得られる。
論文参考訳（メタデータ） (2024-06-20T12:30:12Z)
SSVOD: Semi-Supervised Video Object Detection with Sparse Annotations [12.139451002212063]
SSVODはビデオのモーションダイナミクスを利用して、スパースアノテーション付き大規模未ラベルフレームを利用する。提案手法は,ImageNet-VID, Epic-KITCHENS, YouTube-VISの既存手法に比べて,大幅な性能向上を実現している。
論文参考訳（メタデータ） (2023-09-04T06:41:33Z)
Multi-Granularity Denoising and Bidirectional Alignment for Weakly Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。 MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文参考訳（メタデータ） (2023-05-09T03:33:43Z)
Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文参考訳（メタデータ） (2021-05-22T10:17:38Z)
Cleaning Label Noise with Clusters for Minimally Supervised Anomaly Detection [26.062659852373653]
ビデオレベルラベルのみを用いてトレーニングした弱い教師付き異常検出法を定式化する。提案手法は UCF-crime と ShanghaiTech のデータセットでそれぞれ78.27% と84.16% のフレームレベル AUC が得られる。
論文参考訳（メタデータ） (2021-04-30T06:03:24Z)
Weakly Supervised Video Salient Object Detection [79.51227350937721]
本稿では,relabeled relabeled "fixation guided scribble annotations" に基づく最初の弱教師付きビデオサリエント物体検出モデルを提案する。効果的なマルチモーダル学習と長期時間文脈モデリングを実現するために,「アプレンス・モーション・フュージョン・モジュール」と双方向のConvLSTMベースのフレームワークを提案する。
論文参考訳（メタデータ） (2021-04-06T09:48:38Z)
Learning to Track Instances without Video Annotations [85.9865889886669]
本稿では,ラベル付き画像データセットとラベルなしビデオシーケンスのみを用いたインスタンス追跡ネットワークを学習する,新しい半教師付きフレームワークを提案する。画像のみを訓練しても,学習した特徴表現は出現の変動にロバストであることが判明した。さらに、このモジュールを単一ステージのインスタンスセグメンテーションとポーズ推定フレームワークに統合します。
論文参考訳（メタデータ） (2021-04-01T06:47:41Z)
ANL: Anti-Noise Learning for Cross-Domain Person Re-Identification [25.035093667770052]
2つのモジュールを含むアンチノイズラーニング(ANL)アプローチを提案します。 FDAモジュールは、カメラ回りのコントラスト学習と逆適応を通じて、ID関連サンプルを収集し、ID非関連サンプルを分散するように設計されています。 reliable sample selection(rss)モジュールは、ノイズラベルを訂正し、メインモデルの信頼できるサンプルを選択するために補助モデルを使用する。
論文参考訳（メタデータ） (2020-12-27T02:38:45Z)
A Self-Reasoning Framework for Anomaly Detection Using Video-Level Labels [17.615297975503648]
監視ビデオにおける異常事象の検出は、画像およびビデオ処理コミュニティの間で困難かつ実践的な研究課題である。本稿では、ビデオレベルラベルのみを用いて自己推論方式で訓練されたディープニューラルネットワークに基づく、弱い教師付き異常検出フレームワークを提案する。提案するフレームワークは,UCF-crimeやShanghaiTech,Ped2など,公開されている実世界の異常検出データセット上で評価されている。
論文参考訳（メタデータ） (2020-08-27T02:14:15Z)
Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。 2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文参考訳（メタデータ） (2020-04-07T17:16:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。