論文の概要: Graph Sampling Based Deep Metric Learning for Generalizable Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2104.01546v1
- Date: Sun, 4 Apr 2021 06:44:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:35:55.341623
- Title: Graph Sampling Based Deep Metric Learning for Generalizable Person
Re-Identification
- Title(参考訳): グラフサンプリングに基づく一般化可能な人物再同定のための深度学習
- Authors: Shengcai Liao and Ling Shao
- Abstract要約: ディープフィーチャーマップで直接人物画像マッチングを作成する方法を検討します。
クエリ適応畳み込みカーネルをオンザフライで構築し,局所マッチングを実現する。
- 参考スコア(独自算出の注目度): 114.56752624945142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For person re-identification, existing deep networks often focus on
representation learning. However, without transfer learning, the learned model
is fixed as is, which is not adaptable for handling various unseen scenarios.
In this paper, beyond representation learning, we consider how to formulate
person image matching directly in deep feature maps. We treat image matching as
finding local correspondences in feature maps, and construct query-adaptive
convolution kernels on the fly to achieve local matching. In this way, the
matching process and results are interpretable, and this explicit matching is
more generalizable than representation features to unseen scenarios, such as
unknown misalignments, pose or viewpoint changes. To facilitate end-to-end
training of this architecture, we further build a class memory module to cache
feature maps of the most recent samples of each class, so as to compute image
matching losses for metric learning. Through direct cross-dataset evaluation,
the proposed Query-Adaptive Convolution (QAConv) method gains large
improvements over popular learning methods (about 10\%+ mAP), and achieves
comparable results to many transfer learning methods. Besides, a model-free
temporal cooccurrence based score weighting method called TLift is proposed,
which improves the performance to a further extent, achieving state-of-the-art
results in cross-dataset person re-identification. Code is available at
\url{https://github.com/ShengcaiLiao/QAConv}.
- Abstract(参考訳): 個人を再識別するために、既存のディープネットワークはしばしば表現学習に焦点を当てる。
しかし、トランスファーラーニングなしでは、学習モデルはそのままに固定され、様々な目に見えないシナリオに適応できない。
本稿では, 表現学習以外にも, 人物像のマッチングを深部特徴写像で直接定式化する方法を検討する。
画像マッチングを特徴マップにおける局所対応の探索として扱い、クエリ適応畳み込みカーネルをオンザフライで構築して局所マッチングを実現する。
このように、マッチングプロセスと結果は解釈可能であり、この明示的なマッチングは、未知のミスアライメントやポーズ、視点の変化のような見知らぬシナリオに対して、表現機能よりも一般化可能である。
このアーキテクチャのエンドツーエンドのトレーニングを容易にするため、各クラスの最新のサンプルの特徴マップをキャッシュするクラスメモリモジュールを構築し、メトリクス学習のための画像マッチング損失を計算する。
直接クロスデータセット評価により、提案手法は一般的な学習手法(約10\%+mAP)よりも大幅に改善され、多くの伝達学習手法に匹敵する結果が得られる。
さらに,TLift と呼ばれるモデルフリー時間的コクレンスに基づくスコア重み付け手法を提案する。
コードは \url{https://github.com/shengcailiao/qaconv} で入手できる。
関連論文リスト
- KAKURENBO: Adaptively Hiding Samples in Deep Neural Network Training [2.8804804517897935]
深層ニューラルネットワークのトレーニングにおいて,最も重要でないサンプルを隠蔽する手法を提案する。
我々は,学習プロセス全体への貢献に基づいて,与えられたエポックを除外するサンプルを適応的に見つける。
本手法は, ベースラインと比較して, 最大22%の精度でトレーニング時間を短縮できる。
論文 参考訳(メタデータ) (2023-10-16T06:19:29Z) - Global Proxy-based Hard Mining for Visual Place Recognition [3.6739949215165164]
本稿では, プロキシをベースとした世界規模のミニバッチサンプリングを行う手法を提案する。
そのため、ネットワークに新しいエンドツーエンドのトレーニング可能なブランチを追加し、効率的な場所記述子を生成する。
提案手法は,既存の2値損失関数と3値損失関数を組み合わせて,メモリと計算コストの最小化を図り得る。
論文 参考訳(メタデータ) (2023-02-28T00:43:13Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - A Maximum Log-Likelihood Method for Imbalanced Few-Shot Learning Tasks [3.2895195535353308]
数ショットアーキテクチャのための新しい最大ログ類似度指標を提案する。
提案手法は,従来の類似度指標よりも優れた性能を実現することを示す。
また,提案アルゴリズムは,評価データが不均衡である場合に,最先端のトランスダクティブな数ショット性能を実現することを示す。
論文 参考訳(メタデータ) (2022-11-26T21:31:00Z) - Global Contrastive Batch Sampling via Optimization on Sample
Permutations [28.72288652451881]
Global Contrastive Batch Sampling (GCBS) はバッチ割り当て問題に対する効率的な近似である。
GCBSは、文の埋め込みやコード検索タスクにおける最先端のパフォーマンスを改善している。
論文 参考訳(メタデータ) (2022-10-23T22:35:02Z) - Learning Fast Sample Re-weighting Without Reward Data [41.92662851886547]
本稿では,新たな報酬データを必要としない学習ベース高速サンプル再重み付け手法を提案する。
実験により,提案手法は,ラベルノイズや長い尾の認識に関する芸術的状況と比較して,競争力のある結果が得られることを示した。
論文 参考訳(メタデータ) (2021-09-07T17:30:56Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer
Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。
複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。
本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-10-26T14:52:42Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。