論文の概要: Camera-Driven Representation Learning for Unsupervised Domain Adaptive
Person Re-identification
- arxiv url: http://arxiv.org/abs/2308.11901v1
- Date: Wed, 23 Aug 2023 04:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 16:00:31.044263
- Title: Camera-Driven Representation Learning for Unsupervised Domain Adaptive
Person Re-identification
- Title(参考訳): 教師なしドメイン適応人物再同定のためのカメラ駆動表現学習
- Authors: Geon Lee, Sanghoon Lee, Dohyung Kim, Younghoon Shin, Yongsang Yoon,
Bumsub Ham
- Abstract要約: 本稿では,カメララベルを利用したカリキュラム学習フレームワークを導入し,情報ソースからターゲットドメインへの知識の伝達を段階的に行う。
各カリキュラムシーケンスに対して、ターゲット領域の人物画像の擬似ラベルを生成し、教師付き方法でreIDモデルをトレーニングする。
擬似ラベルはカメラに対して非常に偏りがあり、同一のカメラから得られた人物画像は、異なるIDであっても同一の擬似ラベルを持つ可能性が高いことを示唆している。
- 参考スコア(独自算出の注目度): 33.25577310265293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel unsupervised domain adaption method for person
re-identification (reID) that generalizes a model trained on a labeled source
domain to an unlabeled target domain. We introduce a camera-driven curriculum
learning (CaCL) framework that leverages camera labels of person images to
transfer knowledge from source to target domains progressively. To this end, we
divide target domain dataset into multiple subsets based on the camera labels,
and initially train our model with a single subset (i.e., images captured by a
single camera). We then gradually exploit more subsets for training, according
to a curriculum sequence obtained with a camera-driven scheduling rule. The
scheduler considers maximum mean discrepancies (MMD) between each subset and
the source domain dataset, such that the subset closer to the source domain is
exploited earlier within the curriculum. For each curriculum sequence, we
generate pseudo labels of person images in a target domain to train a reID
model in a supervised way. We have observed that the pseudo labels are highly
biased toward cameras, suggesting that person images obtained from the same
camera are likely to have the same pseudo labels, even for different IDs. To
address the camera bias problem, we also introduce a camera-diversity (CD) loss
encouraging person images of the same pseudo label, but captured across various
cameras, to involve more for discriminative feature learning, providing person
representations robust to inter-camera variations. Experimental results on
standard benchmarks, including real-to-real and synthetic-to-real scenarios,
demonstrate the effectiveness of our framework.
- Abstract(参考訳): 本稿では、ラベル付きソースドメイン上でトレーニングされたモデルをラベル付きターゲットドメインに一般化する、人物再識別(reID)のための新しい教師なしドメイン適応手法を提案する。
本研究では,個人画像のカメララベルを利用したカメラ駆動型カリキュラム学習(CaCL)フレームワークを導入する。
この目的のために、ターゲットドメインデータセットをカメララベルに基づいて複数のサブセットに分割し、最初にモデルを単一のサブセット(つまり、単一のカメラがキャプチャした画像)でトレーニングする。
そして、カメラ駆動のスケジューリングルールで得られたカリキュラムシーケンスに従って、さらに多くのサブセットをトレーニングに活用する。
スケジューラは、各サブセットとソースドメインデータセットの間の最大平均不一致(mmd)を考慮する。
各カリキュラムシーケンスに対して,ターゲットドメイン内の人物画像の擬似ラベルを生成し,教師付きでreidモデルをトレーニングする。
疑似ラベルはカメラに対して非常に偏りがあり、同一カメラから取得した人物画像は異なるidであっても同じ疑似ラベルを持つ可能性が高いことを示唆する。
カメラバイアス問題に対処するために、同一の擬似ラベルの人物像を奨励するカメラ・ダイバーシティ(CD)ロスも導入するが、様々なカメラでキャプチャーされ、識別的特徴学習にもっと関与し、カメラ間変異に頑健な人物表現を提供する。
実実実および合成実実実シナリオを含む標準ベンチマークの実験結果から,本フレームワークの有効性を実証した。
関連論文リスト
- Camera-aware Label Refinement for Unsupervised Person Re-identification [19.099192313056296]
教師なしの人物再識別は、特定人物のイメージを識別ラベルなしで検索することを目的としている。
最近の教師なしRe-IDアプローチでは、クラスタリングをベースとして、クロスカメラの特徴的類似性を測定する手法が採用されている。
我々は、カメラ内類似性をクラスタリングすることで、カメラの差を小さくするtextbfCamera-textbfAware textbfLabel textbfRefinement(CALR)フレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-25T06:22:27Z) - CDFSL-V: Cross-Domain Few-Shot Learning for Videos [58.37446811360741]
ビデオのアクション認識は、いくつかのラベル付き例でのみ、新しいカテゴリを認識するための効果的なアプローチである。
既存のビデオアクション認識の方法は、同じドメインからの大きなラベル付きデータセットに依存している。
本稿では,自己教師付き学習とカリキュラム学習を活用した,クロスドメインな数ショットビデオ行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T19:44:27Z) - Pseudo Labels Refinement with Intra-camera Similarity for Unsupervised
Person Re-identification [8.779246907359706]
監視されていない人物の再識別(Re-ID)は、識別ラベルなしでカメラを介して人物画像を取得することを目的としている。
クラスタリングに基づくほとんどの手法は、画像の特徴を大まかにクラスタに分割し、異なるカメラ間のドメインシフトに起因する特徴分布ノイズを無視する。
本稿では,カメラ内類似点をクラスタリングする新しいラベルリファインメントフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-25T08:04:12Z) - Camera Alignment and Weighted Contrastive Learning for Domain Adaptation
in Video Person ReID [17.90248359024435]
人物再識別システム(ReID)は、大規模な完全ラベル画像データセットでトレーニングした場合、高い精度を達成することができる。
様々な運用状況(例えば、カメラの視点や照明など)に関連したドメインシフトは、パフォーマンスの大幅な低下に繋がる可能性がある。
本稿では、ビデオベースのReIDのための教師なしドメイン適応(UDA)に焦点を当てる。
論文 参考訳(メタデータ) (2022-11-07T15:32:56Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Camera-Tracklet-Aware Contrastive Learning for Unsupervised Vehicle
Re-Identification [4.5471611558189124]
車両識別ラベルのないマルチカメラ・トラックレット情報を用いたカメラ・トラックレット対応コントラスト学習(CTACL)を提案する。
提案したCTACLは、全車両画像(全車両画像)を複数のカメラレベルの画像に分割し、コントラスト学習を行う。
本稿では,ビデオベースおよび画像ベース車両のRe-IDデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2021-09-14T02:12:54Z) - Intra-Inter Camera Similarity for Unsupervised Person Re-Identification [50.85048976506701]
擬似ラベル生成のための新しいカメラ内類似性について検討する。
re-idモデルをカメラ内およびカメラ間擬似ラベルを用いて2段階訓練した。
この単純なinter-inter cameraの類似性は、複数のデータセットで驚くほど優れたパフォーマンスを生み出す。
論文 参考訳(メタデータ) (2021-03-22T08:29:04Z) - Joint Noise-Tolerant Learning and Meta Camera Shift Adaptation for
Unsupervised Person Re-Identification [60.36551512902312]
unsupervised person re-identification (re-ID) は、ラベルのないデータで識別モデルを学ぶことを目的としている。
一般的な方法としては、クラスタ化によって擬似ラベルを取得し、モデルを最適化するために使用する方法がある。
本稿では,両問題を解決するための統一フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-08T09:13:06Z) - Camera-aware Proxies for Unsupervised Person Re-Identification [60.26031011794513]
本稿では、アノテーションを必要としない純粋に教師なしの人物識別(Re-ID)問題に取り組む。
各クラスタを複数のプロキシに分割し、それぞれのプロキシが同じカメラからのインスタンスを表すことを提案する。
カメラ認識プロキシに基づいて、カメラ内およびカメラ間コントラスト学習コンポーネントをre-idモデル用に設計する。
論文 参考訳(メタデータ) (2020-12-19T12:37:04Z) - Domain Generalized Person Re-Identification via Cross-Domain Episodic
Learning [31.17248105464821]
本稿では、メタ学習戦略を進化させ、観測されたソースドメインラベル付きデータを活用するためのエピソード学習手法を提案する。
4つのベンチマークデータセットに対する実験により,最先端技術よりも提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2020-10-19T14:42:29Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。