論文の概要: Unified Representation Learning for Cross Model Compatibility
- arxiv url: http://arxiv.org/abs/2008.04821v1
- Date: Tue, 11 Aug 2020 16:14:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 11:53:49.204815
- Title: Unified Representation Learning for Cross Model Compatibility
- Title(参考訳): クロスモデル対応のための統一表現学習
- Authors: Chien-Yi Wang, Ya-Liang Chang, Shang-Ta Yang, Dong Chen, Shang-Hong
Lai
- Abstract要約: 視覚検索アプリケーションのコンテキストにおけるクロスモデル適合性問題に対処する統一表現学習フレームワークを提案する。
異なる埋め込みモデル間の相互互換性により、視覚検索システムは、ユーザイメージを再エンコードすることなく、アイデンティティを正しく認識し、検索することができる。
- 参考スコア(独自算出の注目度): 19.808287296481208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a unified representation learning framework to address the Cross
Model Compatibility (CMC) problem in the context of visual search applications.
Cross compatibility between different embedding models enables the visual
search systems to correctly recognize and retrieve identities without
re-encoding user images, which are usually not available due to privacy
concerns. While there are existing approaches to address CMC in face
identification, they fail to work in a more challenging setting where the
distributions of embedding models shift drastically. The proposed solution
improves CMC performance by introducing a light-weight Residual Bottleneck
Transformation (RBT) module and a new training scheme to optimize the embedding
spaces. Extensive experiments demonstrate that our proposed solution
outperforms previous approaches by a large margin for various challenging
visual search scenarios of face recognition and person re-identification.
- Abstract(参考訳): 本稿では,ビジュアル検索アプリケーションのコンテキストにおいて,CMC(Cross Model Compatibility)問題に対処するための統一表現学習フレームワークを提案する。
異なる埋め込みモデル間の相互互換性により、視覚検索システムはユーザのイメージを再エンコードすることなく、アイデンティティを正しく認識し、取得することができる。
顔認証においてCMCに対処するアプローチは存在するが、埋め込みモデルの分布が劇的に変化するような、より困難な環境では機能しない。
提案手法は,軽量なResidual Bottleneck Transformation (RBT)モジュールと,埋め込み空間を最適化する新たなトレーニングスキームを導入することにより,MCC性能を向上させる。
大規模な実験により,提案手法は顔認識と人物再同定の難解な視覚検索シナリオにおいて,従来の手法よりも優れた性能を示した。
関連論文リスト
- Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.48494594909123]
相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文 参考訳(メタデータ) (2024-01-18T15:56:23Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Diversity is Definitely Needed: Improving Model-Agnostic Zero-shot
Classification via Stable Diffusion [22.237426507711362]
モデル非依存ゼロショット分類(モデル非依存ゼロショット分類、英: Model-Agnostic Zero-Shot Classification、MA-ZSC)とは、訓練中に実際の画像を使わずに、実際の画像を分類するための非特異な分類アーキテクチャを訓練することである。
近年の研究では、拡散モデルを用いて合成訓練画像を生成することが、MA-ZSCに対処するための潜在的な解決策となることが示されている。
本研究では,事前学習した拡散モデルを用いてテキスト・画像生成プロセスの修正を行い,多様性を高める。
論文 参考訳(メタデータ) (2023-02-07T07:13:53Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Switchable Representation Learning Framework with Self-compatibility [50.48336074436792]
自己整合性(SFSC)を考慮した交換可能な表現学習フレームワークを提案する。
SFSCは1つのトレーニングプロセスを通じて、異なる能力を持つ一連の互換性のあるサブモデルを生成する。
SFSCは評価データセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-06-16T16:46:32Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z) - Semi-supervised Classification using Attention-based Regularization on
Coarse-resolution Data [6.4466362693513055]
粗い分解能の監督を利用して、より微細な分解能のモデルを訓練するための分類アルゴリズムを提案する。
異なる解像度は、マルチビューフレームワークでデータの異なるビューとしてモデル化されます。
テキストデータを用いた衛星観測と感情分類を用いた都市域マッピングの現実的適用実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-01-03T21:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。