論文の概要: Focus On Details: Online Multi-object Tracking with Diverse Fine-grained
Representation
- arxiv url: http://arxiv.org/abs/2302.14589v1
- Date: Tue, 28 Feb 2023 14:16:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 16:14:54.380843
- Title: Focus On Details: Online Multi-object Tracking with Diverse Fine-grained
Representation
- Title(参考訳): 詳細に焦点をあてる: 多様な細粒度表現を持つオンラインマルチオブジェクト追跡
- Authors: Hao Ren, Shoudong Han, Huilin Ding, Ziwen Zhang, Hongwei Wang, Faquan
Wang
- Abstract要約: 識別表現は、Multiple Object Tracking (MOT)において、各ターゲットにユニークな識別子を保持するために不可欠である
グローバル・ローカル・パースペクティブから包括的に外見を記述した多種多様なきめ細かな表現について検討する。
このきめ細かい表現は、高い特徴分解能と正確な意味情報を必要とする。
- 参考スコア(独自算出の注目度): 6.664609484694491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discriminative representation is essential to keep a unique identifier for
each target in Multiple object tracking (MOT). Some recent MOT methods extract
features of the bounding box region or the center point as identity embeddings.
However, when targets are occluded, these coarse-grained global representations
become unreliable. To this end, we propose exploring diverse fine-grained
representation, which describes appearance comprehensively from global and
local perspectives. This fine-grained representation requires high feature
resolution and precise semantic information. To effectively alleviate the
semantic misalignment caused by indiscriminate contextual information
aggregation, Flow Alignment FPN (FAFPN) is proposed for multi-scale feature
alignment aggregation. It generates semantic flow among feature maps from
different resolutions to transform their pixel positions. Furthermore, we
present a Multi-head Part Mask Generator (MPMG) to extract fine-grained
representation based on the aligned feature maps. Multiple parallel branches of
MPMG allow it to focus on different parts of targets to generate local masks
without label supervision. The diverse details in target masks facilitate
fine-grained representation. Eventually, benefiting from a Shuffle-Group
Sampling (SGS) training strategy with positive and negative samples balanced,
we achieve state-of-the-art performance on MOT17 and MOT20 test sets. Even on
DanceTrack, where the appearance of targets is extremely similar, our method
significantly outperforms ByteTrack by 5.0% on HOTA and 5.6% on IDF1. Extensive
experiments have proved that diverse fine-grained representation makes Re-ID
great again in MOT.
- Abstract(参考訳): 識別表現は、Multiple Object Tracking (MOT)において、各ターゲットに対してユニークな識別子を保持するために不可欠である。
最近のmot法は、境界ボックス領域や中心点の特徴をアイデンティティ埋め込みとして抽出する。
しかし、ターゲットがオクルードされるとき、これらの粗い粒度のグローバル表現は信頼できない。
この目的のために,グローバルおよびローカルな視点から外観を包括的に表現する多彩な細粒度表現について検討する。
このきめ細かい表現には高い特徴解像度と正確な意味情報が必要である。
文脈情報アグリゲーションの不特定による意味的ミスアライメントを効果的に軽減するために,マルチスケール特徴アライメントアグリゲーションに対してフローアライメントFPN(FAFPN)を提案する。
異なる解像度から特徴マップ間のセマンティックフローを生成し、画素位置を変換する。
さらに,アライメント特徴マップに基づいて細粒度表現を抽出するマルチヘッド部分マスク生成器(mpmg)を提案する。
MPMGの複数の並列ブランチは、ラベルの監督なしにターゲットの異なる部分に集中してローカルマスクを生成することができる。
ターゲットマスクの様々な詳細は、きめ細かい表現を促進する。
最終的に、正と負のサンプルのバランスが取れたShuffle-Group Smpling(SGS)トレーニング戦略の恩恵を受け、MOT17およびMOT20テストセットの最先端性能を達成する。
ターゲットの出現が極めて近いDanceTrackでも,HOTAではByteTrackが5.0%,IDF1では5.6%向上した。
広範囲な実験により、Re-IDがMOTで再び優れていることが証明された。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Fine-grained Background Representation for Weakly Supervised Semantic Segmentation [35.346567242839065]
本稿では,多様なBGセマンティクスを発見し,表現するために,FBR法を提案する。
そこで本研究では,FG陰性線を抽出し,地中コントラスト学習を効果的に行うためのアクティブサンプリング戦略を提案する。
本手法は,Pascal Voc および MS COCO テストセットにおいて,73.2 mIoU と 45.6 mIoU のセグメンテーション結果を得る。
論文 参考訳(メタデータ) (2024-06-22T06:45:25Z) - Attributes Grouping and Mining Hashing for Fine-Grained Image Retrieval [24.8065557159198]
微粒な画像検索のための属性グループとマイニングハッシュ(AGMH)を提案する。
AGMHはカテゴリ固有の視覚属性を複数の記述子にグループ化し、包括的特徴表現を生成する。
AGMHは、きめ細かいベンチマークデータセットの最先端メソッドに対して、一貫して最高のパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-11-10T14:01:56Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Segment as Points for Efficient Online Multi-Object Tracking and
Segmentation [66.03023110058464]
本稿では,コンパクトな画像表現を非秩序な2次元点クラウド表現に変換することで,セグメントに基づくインスタンス埋め込みの学習に有効な方法を提案する。
本手法は,画像ではなく,ランダムに選択された点から識別インスタンスの埋め込みを学習する,新たなトラッキング・バイ・ポイントのパラダイムを生成する。
PointTrackという名前のオンラインMOTSフレームワークは、最先端のすべてのメソッドを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-07-03T08:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。