論文の概要: ASMR: Learning Attribute-Based Person Search with Adaptive Semantic
Margin Regularizer
- arxiv url: http://arxiv.org/abs/2108.04533v1
- Date: Tue, 10 Aug 2021 09:19:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 21:33:58.329222
- Title: ASMR: Learning Attribute-Based Person Search with Adaptive Semantic
Margin Regularizer
- Title(参考訳): ASMR:Adaptive Semantic Margin Regularizerを用いた属性に基づく人物探索
- Authors: Boseung Jeong, Jicheol Park, Suha Kwak
- Abstract要約: 属性に基づく人物探索の文脈において,クロスモーダルな埋め込みを学習する際の新たな損失を提示する。
我々の損失は、意味的距離によって適応的に決定されるマージンによって、一対の個人カテゴリーを分割する。
単純な埋め込みモデルにより、ベルやホイッスルを使わずに、公開ベンチマークで最先端の記録を達成できる。
- 参考スコア(独自算出の注目度): 12.590415345079991
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Attribute-based person search is the task of finding person images that are
best matched with a set of text attributes given as query. The main challenge
of this task is the large modality gap between attributes and images. To reduce
the gap, we present a new loss for learning cross-modal embeddings in the
context of attribute-based person search. We regard a set of attributes as a
category of people sharing the same traits. In a joint embedding space of the
two modalities, our loss pulls images close to their person categories for
modality alignment. More importantly, it pushes apart a pair of person
categories by a margin determined adaptively by their semantic distance, where
the distance metric is learned end-to-end so that the loss considers importance
of each attribute when relating person categories. Our loss guided by the
adaptive semantic margin leads to more discriminative and semantically
well-arranged distributions of person images. As a consequence, it enables a
simple embedding model to achieve state-of-the-art records on public benchmarks
without bells and whistles.
- Abstract(参考訳): 属性に基づく人物検索は、クエリとして与えられたテキスト属性のセットに最もよくマッチする人物画像を見つけるタスクである。
このタスクの主な課題は、属性と画像の間の大きなモダリティギャップである。
このギャップを減らすために,属性に基づく人物探索の文脈において,モーダルな埋め込みを学習する際の新たな損失を提示する。
属性のセットを、同じ特性を共有する人々のカテゴリとみなします。
2つのモダリティの合同埋め込み空間において、損失は、モダリティアライメントのための個人カテゴリに近いイメージを引き出す。
さらに重要なことに、その意味的距離によって適応的に決定されるマージンによって、2つの人カテゴリを分割し、その距離メトリックをエンドツーエンドに学習することで、人カテゴリに関連する各属性の重要性を考慮する。
適応的セマンティック・マージンによって導かれる損失は、より差別的でセマンティックに適切に配置された人物画像の分布につながる。
その結果、単純な埋め込みモデルにより、ベルやホイッスルを使わずに、公開ベンチマークで最先端の記録を達成できる。
関連論文リスト
- Improving Text-based Person Search via Part-level Cross-modal Correspondence [29.301950609839796]
粗大な埋め込みベクトルを抽出する効率的なエンコーダデコーダモデルを提案する。
また、個人IDのみを監督として、きめ細かい情報を捉えることを学ぶという課題もある。
本稿では,各部位の共通度を定量化する,共通性に基づく新たなランキング損失を提案する。
論文 参考訳(メタデータ) (2024-12-31T07:29:50Z) - MARS: Paying more attention to visual attributes for text-based person search [6.438244172631555]
本稿ではMARS(Mae-Attribute-Relation-Sensitive)という新しいTBPSアーキテクチャを提案する。
ビジュアルレコンストラクションロスと属性ロスという2つの重要なコンポーネントを導入することで、現在の最先端モデルを強化する。
CUHK-PEDES、ICFG-PEDES、RSTPReidの3つの一般的なデータセットの実験では、パフォーマンス改善が報告されている。
論文 参考訳(メタデータ) (2024-07-05T06:44:43Z) - CLEAR: Cross-Transformers with Pre-trained Language Model is All you need for Person Attribute Recognition and Retrieval [0.18749305679160366]
属性認識と属性ベースの検索は、人間中心の2つのコアタスクである。
個人属性認識のための頑健なクロストランスフォーマーネットワークを導入する。
また、アダプタのいくつかの追加パラメータのみをトレーニングするための効果的なトレーニング戦略も導入しています。
CLEARは、両方のタスクに対して最先端のパフォーマンスまたは競合的な結果を達成する。
論文 参考訳(メタデータ) (2024-03-10T07:31:06Z) - AttrSeg: Open-Vocabulary Semantic Segmentation via Attribute
Decomposition-Aggregation [33.25304533086283]
オープンボキャブラリセマンティックセグメンテーションは、推論時に新しいオブジェクトカテゴリをセグメンテーションする必要がある難しいタスクである。
最近の研究では、この課題に対処するために視覚言語による事前訓練が検討されているが、現実的なシナリオでは非現実的な仮定に悩まされている。
本研究は,新しい概念を理解する上で,人間の認知に触発された新しい属性分解集約フレームワークであるAttrSegを提案する。
論文 参考訳(メタデータ) (2023-08-31T19:34:09Z) - Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification [78.52704557647438]
補助的なアノテーションやデータなしに両方の制約に対処するために,新しいFIne-fine Representation and Recomposition (FIRe$2$) フレームワークを提案する。
FIRe$2$は、広く使われている5つのRe-IDベンチマークで最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2023-08-21T12:59:48Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - End-to-End Context-Aided Unicity Matching for Person Re-identification [100.02321122258638]
本稿では,人間同士の一致関係を学習・精査するための,エンドツーエンドの対人一意整合アーキテクチャを提案する。
サンプルのグローバルコンテキスト関係を用いて,ソフトマッチング結果を洗練し,両部グラフマッチングにより一致ユニシティに到達する。
実世界における人物再識別の応用を十分に考慮し, ワンショットとマルチショットの双方で一様マッチングを実現する。
論文 参考訳(メタデータ) (2022-10-20T07:33:57Z) - Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition [50.932864767867365]
本稿では,各属性に対する空間的および意味的一貫性を実現するために,2つの相補的正規化からなるフレームワークを提案する。
属性の正確な位置に基づいて,本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
その結果,提案手法はパラメータを増大させることなく,最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-09-13T03:36:44Z) - Matched sample selection with GANs for mitigating attribute confounding [30.488267816304177]
保護属性間の属性分布のバランスのとれたフルデータセットから画像のサブセットを選択するマッチングアプローチを提案する。
私たちのマッチングアプローチでは、セマンティック属性を保存する方法で、まず実際の画像を生成ネットワークの潜在空間に投影します。
次に、選択された保護属性にまたがるこの潜在空間で敵の一致を見つけ、セマンティクスと知覚属性が保護属性間でバランスをとるデータセットを生成する。
論文 参考訳(メタデータ) (2021-03-24T19:18:44Z) - Symbiotic Adversarial Learning for Attribute-based Person Search [86.7506832053208]
本稿では,共生学習の枠組みとして,共生学習の基盤に2つのGANを配置する。
具体的には、2種類の生成的敵ネットワークがトレーニングプロセスを通して協調的に学習する。
論文 参考訳(メタデータ) (2020-07-19T07:24:45Z) - Learning to Compare Relation: Semantic Alignment for Few-Shot Learning [48.463122399494175]
本稿では,コンテンツアライメントに頑健な関係を比較するための新しいセマンティックアライメントモデルを提案する。
数ショットの学習データセットについて広範な実験を行う。
論文 参考訳(メタデータ) (2020-02-29T08:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。