論文の概要: Delving into the Trajectory Long-tail Distribution for Muti-object
Tracking
- arxiv url: http://arxiv.org/abs/2403.04700v1
- Date: Thu, 7 Mar 2024 17:48:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 13:16:48.316697
- Title: Delving into the Trajectory Long-tail Distribution for Muti-object
Tracking
- Title(参考訳): muti-object 追跡のための軌道長尾分布の検討
- Authors: Sijia Chen, En Yu, Jinyang Li, Wenbing Tao
- Abstract要約: 我々は追跡データの分布パターンを探索するパイオニアとなった。
既存のMOTデータセットで顕著な長尾分布問題を特定する。
我々は,この歪んだ分布の効果を緩和するベスポーク戦略を導入する。
- 参考スコア(独自算出の注目度): 28.363353010733167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple Object Tracking (MOT) is a critical area within computer vision,
with a broad spectrum of practical implementations. Current research has
primarily focused on the development of tracking algorithms and enhancement of
post-processing techniques. Yet, there has been a lack of thorough examination
concerning the nature of tracking data it self. In this study, we pioneer an
exploration into the distribution patterns of tracking data and identify a
pronounced long-tail distribution issue within existing MOT datasets. We note a
significant imbalance in the distribution of trajectory lengths across
different pedestrians, a phenomenon we refer to as "pedestrians trajectory
long-tail distribution". Addressing this challenge, we introduce a bespoke
strategy designed to mitigate the effects of this skewed distribution.
Specifically, we propose two data augmentation strategies, including Stationary
Camera View Data Augmentation (SVA) and Dynamic Camera View Data Augmentation
(DVA) , designed for viewpoint states and the Group Softmax (GS) module for
Re-ID. SVA is to backtrack and predict the pedestrian trajectory of tail
classes, and DVA is to use diffusion model to change the background of the
scene. GS divides the pedestrians into unrelated groups and performs softmax
operation on each group individually. Our proposed strategies can be integrated
into numerous existing tracking systems, and extensive experimentation
validates the efficacy of our method in reducing the influence of long-tail
distribution on multi-object tracking performance. The code is available at
https://github.com/chen-si-jia/Trajectory-Long-tail-Distribution-for-MOT.
- Abstract(参考訳): マルチオブジェクト追跡(MOT)はコンピュータビジョンにおいて重要な領域であり、幅広い実践的実装がある。
現在の研究は主に追跡アルゴリズムの開発と後処理技術の強化に焦点を当てている。
しかし、それ自身を追跡するデータの性質について、徹底的な調査が欠落している。
本研究では、追跡データの分布パターンを探索し、既存のMOTデータセットにおける顕著な長期分布問題を特定する。
異なる歩行者にまたがる軌道長の分布が著しく不均衡であることに留意し、この現象を「ペデストリアンの軌道長尾分布」と呼ぶ。
この課題に対処するために,我々は,この歪んだ分布の影響を軽減するために設計された自発的な戦略を導入する。
具体的には,SVA(Stationary Camera View Data Augmentation)とDVA(Dynamic Camera View Data Augmentation)の2つのデータ拡張戦略を提案する。
SVAは、テールクラスの歩行者軌道をバックトラックし予測することであり、DVAは拡散モデルを使用してシーンの背景を変更することである。
GSは歩行者を無関係のグループに分け、各グループでソフトマックス操作を行う。
提案手法は,多数の既存のトラッキングシステムに組み込むことが可能であり,多目的トラッキング性能に対する長期分布の影響を低減させるため,提案手法の有効性を検証した。
コードはhttps://github.com/chen-si-jia/Trajectory-Long-tail-Distribution-for-MOTで公開されている。
関連論文リスト
- Enhanced Object Tracking by Self-Supervised Auxiliary Depth Estimation Learning [15.364238035194854]
MDETrackと呼ばれる新しい手法を提案する。この手法は,シーンの深度を理解するための追加機能を備えたトラッキングネットワークを訓練する。
その結果,実際の深度を伴わずとも追跡精度が向上した。
論文 参考訳(メタデータ) (2024-05-23T05:43:38Z) - Improving Transferability for Cross-domain Trajectory Prediction via
Neural Stochastic Differential Equation [41.09061877498741]
外部要因とデータ取得戦略によるデータセット間での相違がある。
大規模データセットでトレーニングされたモデルの熟練した性能は、他の小規模データセットでの転送可能性に制限がある。
本稿では,ニューラル微分方程式(NSDE)の連続的利用に基づく不一致の緩和手法を提案する。
提案手法の有効性は,一般的なベンチマークデータセットであるnuScenes,Argoverse,Lyft,InterinterAction,Open Motionデータセット上で,最先端の軌道予測モデルに対して検証される。
論文 参考訳(メタデータ) (2023-12-26T06:50:29Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Concept Drift and Long-Tailed Distribution in Fine-Grained Visual Categorization: Benchmark and Method [84.68818879525568]
コンセプションドリフトとLong-Tailed Distributionデータセットを提案する。
インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
本稿ではCDLTに関連する学習課題に対処する機能組換えフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-04T12:42:45Z) - Large Scale Real-World Multi-Person Tracking [68.27438015329807]
本稿では,新しい大規模多人数追跡データセットであるtexttPersonPath22を提案する。
MOT17、HiEve、MOT20などの高品質なマルチオブジェクト追跡データセットよりも桁違いに大きい。
論文 参考訳(メタデータ) (2022-11-03T23:03:13Z) - SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset [5.962184741057505]
我々はSOMPT22データセットを紹介した。これは、都市監視のための高さ6-8mのポール上の静止カメラから撮影した注釈付きショートビデオを備えた、複数人の追跡のための新しいセットである。
我々は,新しいデータセット上での検出とreIDネットワークの利用方法について,MOTトラッカーをワンショットと2ステージに分類して分析する。
我々の新しいデータセットの実験結果から、SOTAは依然として高効率には程遠いことが示され、シングルショットトラッカーは高速実行と精度を競合性能と一体化するための良い候補である。
論文 参考訳(メタデータ) (2022-08-04T11:09:19Z) - Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。
SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文 参考訳(メタデータ) (2022-03-29T01:38:49Z) - 3D Multi-Object Tracking Using Graph Neural Networks with Cross-Edge
Modality Attention [9.150245363036165]
Batch3DMOTは、現実のシーンを、方向付き、非循環型、カテゴリー非結合な追跡グラフとして表現する。
モーダル間断続性を緩和するクロスエッジアテンション機構を用いたマルチモーダルグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-03-21T12:44:17Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Input-Output Balanced Framework for Long-tailed LiDAR Semantic
Segmentation [12.639524717464509]
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。
入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。
出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
論文 参考訳(メタデータ) (2021-03-26T05:42:11Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。