論文の概要: Group-CLIP Uncertainty Modeling for Group Re-Identification
- arxiv url: http://arxiv.org/abs/2502.06460v1
- Date: Mon, 10 Feb 2025 13:41:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:31:38.486215
- Title: Group-CLIP Uncertainty Modeling for Group Re-Identification
- Title(参考訳): グループ再同定のためのグループCLIP不確実性モデリング
- Authors: Qingxin Zhang, Haoyan Wei, Yang Qian,
- Abstract要約: Group ReIDは、重複しないカメラで歩行者のグループをマッチングすることを目的としている。
ほとんどの手法は、群像の特定のグループ構造のみを考慮した、確実性に基づくモデルに依存している。
本稿では,グループテキスト記述をメンバーとレイアウトのバリエーションに適応させるGCUM(Group-CLIP UncertaintyModeling)アプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Group Re-Identification (Group ReID) aims matching groups of pedestrians across non-overlapping cameras. Unlike single-person ReID, Group ReID focuses more on the changes in group structure, emphasizing the number of members and their spatial arrangement. However, most methods rely on certainty-based models, which consider only the specific group structures in the group images, often failing to match unseen group configurations. To this end, we propose a novel Group-CLIP UncertaintyModeling (GCUM) approach that adapts group text descriptions to undetermined accommodate member and layout variations. Specifically, we design a Member Variant Simulation (MVS)module that simulates member exclusions using a Bernoulli distribution and a Group Layout Adaptation (GLA) module that generates uncertain group text descriptions with identity-specific tokens. In addition, we design a Group RelationshipConstruction Encoder (GRCE) that uses group features to refine individual features, and employ cross-modal contrastive loss to obtain generalizable knowledge from group text descriptions. It is worth noting that we are the first to employ CLIP to GroupReID, and extensive experiments show that GCUM significantly outperforms state-of-the-art Group ReID methods.
- Abstract(参考訳): グループ再識別(Group ReID)は、重複しないカメラ間で歩行者のグループをマッチングすることを目的としている。
単独のReIDとは異なり、グループReIDはグループ構造の変化をより重視し、メンバーの数と空間配置を強調する。
しかし、ほとんどの手法は、グループイメージ内の特定のグループ構造のみを考慮する確実性に基づくモデルに依存しており、しばしば目に見えないグループ構成と一致しない。
そこで本研究では,グループテキスト記述を非決定型アタッチメント部材に適応させるGCUM(Group-CLIP Uncertainty Modeling)アプローチを提案する。
具体的には,ベルヌーイ分布を用いたメンバー排除をシミュレートするメンバー変数シミュレーション(MVS)モジュールと,識別固有のトークンで不確実なグループテキスト記述を生成するグループレイアウト適応(GLA)モジュールを設計する。
さらに,グループ特徴を用いたグループ関係構築エンコーダ (GRCE) を設計し,グループテキスト記述から一般化可能な知識を得るために,相互比較的損失を用いる。
私たちが最初にCLIPをGroupReIDに導入したことは注目に値する。また、広範な実験により、GCUMが最先端のGroup ReIDメソッドを著しく上回っていることが示されている。
関連論文リスト
- Vision Transformer based Random Walk for Group Re-Identification [15.63292108454152]
グループ再識別(re-ID)は、異なるカメラの下で同じ人とグループを一致させることを目的としている。
グループ再IDのための新しい視覚変換器に基づくランダムウォークフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-08T08:41:14Z) - The Research of Group Re-identification from Multiple Cameras [0.4955551943523977]
グループ再識別は、従来の再識別タスクにおいて、視点や人間のポーズのバリエーションによって妨げられているだけでなく、非常に難しい。
本稿では,グループ内の多粒度情報を活用してグループ再同定を容易にする手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T18:28:13Z) - Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic
Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。
既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。
マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文 参考訳(メタデータ) (2023-10-29T13:18:00Z) - Modeling the Q-Diversity in a Min-max Play Game for Robust Optimization [61.39201891894024]
群分布的ロバスト最適化(群 DRO)は、事前定義された群に対する最悪の損失を最小限にすることができる。
グループDROフレームワークをQ-Diversityを提案して再構築する。
インタラクティブなトレーニングモードによって特徴付けられるQ-Diversityは、アノテーションからグループ識別を緩和し、直接パラメータ化を行う。
論文 参考訳(メタデータ) (2023-05-20T07:02:27Z) - AggNet: Learning to Aggregate Faces for Group Membership Verification [20.15673797674449]
いくつかの顔認識アプリケーションでは、個人がグループのメンバーであるかどうかを、そのアイデンティティを明らかにすることなく確認することに興味がある。
いくつかの既存手法では、事前計算された顔記述子を離散的な埋め込みに量子化し、それらを一つのグループ表現に集約する機構が提案されている。
本稿では,顔記述子とアグリゲーション機構を協調的に学習し,エンドツーエンドのパフォーマンスを向上させるディープアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-17T10:48:34Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Focus on the Common Good: Group Distributional Robustness Follows [47.62596240492509]
本稿では,多様なグループ間で共有される特徴の学習を明示的に促進する,新しい,シンプルなアルゴリズムを提案する。
グループDROは、最低の正規化損失を持つグループに焦点を当て、代わりに、他のグループでもより良いパフォーマンスを実現するグループに焦点を当てるが、共有/共通機能を学ぶことにつながる可能性がある。
論文 参考訳(メタデータ) (2021-10-06T09:47:41Z) - Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。
本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。
本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:57:47Z) - Overcoming Data Sparsity in Group Recommendation [52.00998276970403]
グループレコメンデータシステムは、ユーザの個人的な好みだけでなく、嗜好集約戦略も正確に学習できなければならない。
本稿では,BGEM(Bipartite Graphding Model)とGCN(Graph Convolutional Networks)を基本構造として,グループとユーザ表現を統一的に学習する。
論文 参考訳(メタデータ) (2020-10-02T07:11:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。