論文の概要: Weakly Supervised Person Search with Region Siamese Networks
- arxiv url: http://arxiv.org/abs/2109.06109v1
- Date: Mon, 13 Sep 2021 16:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:32:51.778962
- Title: Weakly Supervised Person Search with Region Siamese Networks
- Title(参考訳): 地域シームズネットワークを用いた弱監視人探索
- Authors: Chuchu Han, Kai Su, Dongdong Yu, Zehuan Yuan, Changxin Gao, Nong Sang,
Yi Yang and Changhu Wang
- Abstract要約: 教師付き学習は人検索において支配的であるが、境界ボックスとアイデンティティの詳細なラベル付けが必要である。
私たちは、バウンディングボックスアノテーションのみが利用できる弱い教師付き設定を提示します。
我々のモデルはCUHK-SYSUベンチマークで87.1%のランク1と86.0%のmAPを達成している。
- 参考スコア(独自算出の注目度): 65.76237418040071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Supervised learning is dominant in person search, but it requires elaborate
labeling of bounding boxes and identities. Large-scale labeled training data is
often difficult to collect, especially for person identities. A natural
question is whether a good person search model can be trained without the need
of identity supervision. In this paper, we present a weakly supervised setting
where only bounding box annotations are available. Based on this new setting,
we provide an effective baseline model termed Region Siamese Networks
(R-SiamNets). Towards learning useful representations for recognition in the
absence of identity labels, we supervise the R-SiamNet with instance-level
consistency loss and cluster-level contrastive loss. For instance-level
consistency learning, the R-SiamNet is constrained to extract consistent
features from each person region with or without out-of-region context. For
cluster-level contrastive learning, we enforce the aggregation of closest
instances and the separation of dissimilar ones in feature space. Extensive
experiments validate the utility of our weakly supervised method. Our model
achieves the rank-1 of 87.1% and mAP of 86.0% on CUHK-SYSU benchmark, which
surpasses several fully supervised methods, such as OIM and MGTS, by a clear
margin. More promising performance can be reached by incorporating extra
training data. We hope this work could encourage the future research in this
field.
- Abstract(参考訳): 教師付き学習は人検索において支配的であるが、境界ボックスとアイデンティティの詳細なラベル付けが必要である。
大規模ラベル付きトレーニングデータは、特に個人idの収集が難しい場合が多い。
自然な疑問は、優れた人物探索モデルがアイデンティティの監督なしに訓練できるかどうかである。
本稿では,バウンディングボックスアノテーションのみが使用可能な弱教師付き設定を提案する。
この新たな設定に基づいて、Regional Siamese Networks (R-SiamNets) と呼ばれる効果的なベースラインモデルを提供する。
識別ラベルなしの認識のための有用な表現の学習に向けて,r-siamnetのインスタンスレベルの一貫性損失とクラスタレベルのコントラスト損失を監督する。
インスタンスレベルの一貫性学習では、R-SiamNetは、各個人領域から領域外コンテキストの有無に関わらず、一貫性のある特徴を抽出するように制約されている。
クラスタレベルのコントラスト学習では、最も近いインスタンスの集約と特徴空間における異種インスタンスの分離が実施される。
広範な実験により,本手法の有用性が検証された。
OIM や MGTS などの完全教師付き手法をクリアマージンで上回る CUHK-SYSU ベンチマークでは,87.1% のランク-1 と 86.0% の mAP が達成されている。
より有望なパフォーマンスは、追加のトレーニングデータを組み込むことで達成できる。
この研究が将来この分野での研究を促進することを願っている。
関連論文リスト
- Hierarchical Point-based Active Learning for Semi-supervised Point Cloud
Semantic Segmentation [48.40853126077237]
大規模ポイントクラウドデータをポイントワイドラベルで取得することは、労働集約的だ。
アクティブラーニングは、この目的を達成するための効果的な戦略の1つだが、まだ探索されていない。
本稿では,階層的なポイントベースアクティブラーニング戦略を開発する。
論文 参考訳(メタデータ) (2023-08-22T03:52:05Z) - Nearest Neighbor-Based Contrastive Learning for Hyperspectral and LiDAR
Data Classification [45.026868970899514]
本稿では,Nearest Neighbor-based Contrastive Learning Network (NNCNet)を提案する。
具体的には,近隣地域間のセマンティック関係を強化した近傍データ拡張手法を提案する。
さらに,HSIデータとLiDARデータ間の2次・高次特徴相互作用を生かしたバイリニアアテンションモジュールを設計する。
論文 参考訳(メタデータ) (2023-01-09T13:43:54Z) - Ladder Siamese Network: a Method and Insights for Multi-level
Self-Supervised Learning [9.257121691188008]
Siamese-network-based self-supervised learning (SSL) は、トレーニングにおける収束の遅さと不安定さに悩まされている。
本稿では,Ladder Siamese Network と呼ばれるディープネットの各段階における中間的な自己スーパービジョンを利用するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-25T00:49:25Z) - Self-Ensembling GAN for Cross-Domain Semantic Segmentation [107.27377745720243]
本稿では,セマンティックセグメンテーションのためのクロスドメインデータを利用した自己理解型生成逆数ネットワーク(SE-GAN)を提案する。
SE-GANでは、教師ネットワークと学生ネットワークは、意味分節マップを生成するための自己組織化モデルを構成する。
その単純さにもかかわらず、SE-GANは敵の訓練性能を大幅に向上させ、モデルの安定性を高めることができる。
論文 参考訳(メタデータ) (2021-12-15T09:50:25Z) - Going Deeper into Semi-supervised Person Re-identification [12.37129078618206]
トレーニングデータのサブセットのみをラベル付けする,半教師付きアプローチに重点を置いています。
提案手法は,3つの大規模人物のre-idデータセットにおいて,最先端の結果よりも優れる。
論文 参考訳(メタデータ) (2021-07-24T09:28:13Z) - Semi-supervised Left Atrium Segmentation with Mutual Consistency
Training [60.59108570938163]
3次元MR画像からの半教師付き左房分割のための新しいMultual Consistency Network(MC-Net)を提案する。
我々のMC-Netは1つのエンコーダと2つのわずかに異なるデコーダから構成されており、2つのデコーダの予測誤差は教師なしの損失として変換される。
我々は,公開左心房(la)データベース上でmc-netを評価し,ラベルなしデータを効果的に活用することで印象的な性能向上を実現する。
論文 参考訳(メタデータ) (2021-03-04T09:34:32Z) - Unsupervised Attention Based Instance Discriminative Learning for Person
Re-Identification [5.233788055084763]
事前学習をせずにエンドツーエンドで訓練された人物再識別のための教師なしフレームワークを提案する。
提案手法は,グループ畳み込みを組み合わせ,複数スケールでの空間的注意力を高める新しいアテンション機構を利用する。
我々はMarket1501とDukeMTMC-reIDデータセットを用いて広範囲に解析を行い、我々の手法が常に最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:08:31Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Unsupervised Feature Learning by Cross-Level Instance-Group
Discrimination [68.83098015578874]
我々は、インスタンスグループ化ではなく、クロスレベルな識別によって、インスタンス間の類似性を対照的な学習に統合する。
CLDは、教師なし学習を、自然データや現実世界のアプリケーションに効果的に近づける。
セルフスーパービジョン、セミスーパービジョン、トランスファーラーニングベンチマークに関する新たな最先端技術は、報告されたすべてのパフォーマンスでMoCo v2とSimCLRを上回っている。
論文 参考訳(メタデータ) (2020-08-09T21:13:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。