論文の概要: Dog nose print matching with dual global descriptor based on Contrastive
Learning
- arxiv url: http://arxiv.org/abs/2206.00580v1
- Date: Wed, 1 Jun 2022 15:49:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 14:11:02.472446
- Title: Dog nose print matching with dual global descriptor based on Contrastive
Learning
- Title(参考訳): コントラスト学習に基づくデュアルグローバルディスクリプタを用いた犬の鼻の印刷マッチング
- Authors: Bin Li, Zhongan Wang, Nan Wu, Shuai Shi, Qijun Ma
- Abstract要約: 複数のグローバルディスクリプタを組み合わせてマルチレベルの画像特徴を利用するデュアルグローバルディスクリプタモデルを提案する。
このフレームワークはCVPR2022 Biometrics Workshop Pet Biometric Challengeのトップ2を達成している。
- 参考スコア(独自算出の注目度): 9.617541993101867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent studies in biometric-based identification tasks have shown that deep
learning methods can achieve better performance. These methods generally
extract the global features as descriptor to represent the original image.
Nonetheless, it does not perform well for biometric identification under
fine-grained tasks. The main reason is that the single image descriptor
contains insufficient information to represent image. In this paper, we present
a dual global descriptor model, which combines multiple global descriptors to
exploit multi level image features. Moreover, we utilize a contrastive loss to
enlarge the distance between image representations of confusing classes. The
proposed framework achieves the top2 on the CVPR2022 Biometrics Workshop Pet
Biometric Challenge. The source code and trained models are publicly available
at: https://github.com/flyingsheepbin/pet-biometrics
- Abstract(参考訳): 近年,生体計測に基づく識別タスクの研究により,深層学習がより優れた性能を達成できることが示されている。
これらの手法は一般に、原画像を表すディスクリプタとしてグローバル特徴を抽出する。
しかし,細粒度タスクでは生体認証ではうまく機能しない。
主な理由は、単一の画像ディスクリプタが画像を表すのに不十分な情報を含んでいるからである。
本稿では,マルチレベル画像機能を利用するために,複数のグローバルディスクリプタを組み合わせたデュアルグローバルディスクリプタモデルを提案する。
さらに,混乱クラスの画像表現間の距離を拡大するために,コントラスト損失を利用する。
提案されたフレームワークはCVPR2022 Biometrics Workshop Pet Biometric Challengeのトップ2を達成している。
ソースコードとトレーニングされたモデルは、https://github.com/flyingsheepbin/pet-biometricsで公開されている。
関連論文リスト
- UniGS: Unified Representation for Image Generation and Segmentation [105.08152635402858]
カラーマップを使用してエンティティレベルのマスクを表現し、さまざまなエンティティ番号の課題に対処します。
マスク表現を支援するために、位置認識カラーパレットとプログレッシブ二分法モジュールを含む2つの新しいモジュールが提案されている。
論文 参考訳(メタデータ) (2023-12-04T15:59:27Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - A Semi-Paired Approach For Label-to-Image Translation [6.888253564585197]
ラベル・ツー・イメージ翻訳のための半教師付き(半ペア)フレームワークを初めて紹介する。
半ペア画像設定では、小さなペアデータとより大きなペア画像とラベルのセットにアクセスすることができる。
本稿では,この共有ネットワークのためのトレーニングアルゴリズムを提案し,非表現型クラスに着目した希少なクラスサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-23T16:13:43Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Combining Metric Learning and Attention Heads For Accurate and Efficient
Multilabel Image Classification [0.0]
マルチラベル分類における2つの一般的なアプローチについて再検討する。
トランスフォーマーベースヘッドはグラフベースのブランチよりも優れた結果が得られると考えられるが、適切なトレーニング戦略により、グラフベースの手法はわずかに精度の低下を示すことができると論じる。
論文 参考訳(メタデータ) (2022-09-14T12:06:47Z) - Facing the Void: Overcoming Missing Data in Multi-View Imagery [0.783788180051711]
本稿では,この問題に頑健な多視点画像分類のための新しい手法を提案する。
提案手法は,最先端の深層学習とメートル法学習に基づいて,他のアプリケーションやドメインに容易に適応し,活用することができる。
その結果,提案アルゴリズムは,最先端手法と比較して,多視点画像分類精度の向上を図っている。
論文 参考訳(メタデータ) (2022-05-21T13:21:27Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。