論文の概要: Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search
- arxiv url: http://arxiv.org/abs/2302.12986v1
- Date: Sat, 25 Feb 2023 04:48:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 19:34:23.171398
- Title: Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search
- Title(参考訳): 弱教師付き人物探索のための自己相似性駆動スケール不変学習
- Authors: Benzhi Wang, Yang Yang, Jinlin Wu, Guo-jun Qi, Zhen Lei
- Abstract要約: 自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 66.95134080902717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised person search aims to jointly detect and match persons with
only bounding box annotations. Existing approaches typically focus on improving
the features by exploring relations of persons. However, scale variation
problem is a more severe obstacle and under-studied that a person often owns
images with different scales (resolutions). On the one hand, small-scale images
contain less information of a person, thus affecting the accuracy of the
generated pseudo labels. On the other hand, the similarity of cross-scale
images is often smaller than that of images with the same scale for a person,
which will increase the difficulty of matching. In this paper, we address this
problem by proposing a novel one-step framework, named Self-similarity driven
Scale-invariant Learning (SSL). Scale invariance can be explored based on the
self-similarity prior that it shows the same statistical properties of an image
at different scales. To this end, we introduce a Multi-scale Exemplar Branch to
guide the network in concentrating on the foreground and learning
scale-invariant features by hard exemplars mining. To enhance the
discriminative power of the features in an unsupervised manner, we introduce a
dynamic multi-label prediction which progressively seeks true labels for
training. It is adaptable to different types of unlabeled data and serves as a
compensation for clustering based strategy. Experiments on PRW and CUHK-SYSU
databases demonstrate the effectiveness of our method.
- Abstract(参考訳): 弱教師付き人物探索は、境界ボックスアノテーションのみを持つ人物を共同で検出し、マッチングすることを目的としている。
既存のアプローチは通常、人の関係を探求することによって特徴を改善することに重点を置いている。
しかし、スケール変動問題はより深刻な障害であり、異なるスケール(解像度)の画像を所有することが多い。
一方、小規模画像では人物の情報が少ないため、生成された擬似ラベルの精度に影響を及ぼす。
一方、クロススケール画像の類似度は、人の同じスケールの画像の類似度よりも小さい場合が多く、マッチングの困難さが増大する。
本稿では,自己相似性駆動型スケール不変学習(ssl)という,新しい一段階フレームワークを提案することで,この問題に対処する。
スケール不変性は、異なるスケールで画像の同じ統計的性質を示す前に自己相似性に基づいて探索することができる。
そこで本研究では,前景に集中してネットワークを誘導し,ハードexemplarsによるスケール不変特徴を学習するマルチスケールexemplarブランチを提案する。
教師なしの方法で特徴の識別力を高めるために,訓練のための真のラベルを徐々に求める動的多ラベル予測を導入する。
異なる種類のラベルのないデータに対応でき、クラスタリングベースの戦略の補償として機能する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
関連論文リスト
- Pseudo-Pair based Self-Similarity Learning for Unsupervised Person
Re-identification [47.44945334929426]
擬似ペアを用いた自己相似学習手法を提案する。
本稿では,画像に擬似ラベルを付与する手法を提案する。
個々の画像から同相性を用いて局所的な識別特徴を学習し、同相性を介して画像間のパッチ対応を検出する。
論文 参考訳(メタデータ) (2022-07-09T04:05:06Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - MixSiam: A Mixture-based Approach to Self-supervised Representation
Learning [33.52892899982186]
近年,ラベルのないデータから視覚表現を学習する過程が顕著に進展している。
従来のシアムネットワークに対する混合型アプローチであるMixSiamを提案する。
論文 参考訳(メタデータ) (2021-11-04T08:12:47Z) - Learning from Partially Overlapping Labels: Image Segmentation under
Annotation Shift [68.6874404805223]
腹部臓器分節の文脈におけるラベルの重複から学ぶためのいくつかの方法を提案する。
半教師付きアプローチと適応的クロスエントロピー損失を組み合わせることで、不均一な注釈付きデータをうまく活用できることが判明した。
論文 参考訳(メタデータ) (2021-07-13T09:22:24Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z) - Learning to Compare Relation: Semantic Alignment for Few-Shot Learning [48.463122399494175]
本稿では,コンテンツアライメントに頑健な関係を比較するための新しいセマンティックアライメントモデルを提案する。
数ショットの学習データセットについて広範な実験を行う。
論文 参考訳(メタデータ) (2020-02-29T08:37:02Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。