論文の概要: MOTS R-CNN: Cosine-margin-triplet loss for multi-object tracking
- arxiv url: http://arxiv.org/abs/2102.03512v1
- Date: Sat, 6 Feb 2021 05:03:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 08:08:34.918193
- Title: MOTS R-CNN: Cosine-margin-triplet loss for multi-object tracking
- Title(参考訳): MOTS R-CNN:マルチオブジェクトトラッキングのためのコサインマージントリプレット損失
- Authors: Amit Satish Unde and Renu M. Rameshan
- Abstract要約: マルチオブジェクトトラッキングの中心的なタスクの1つは、オブジェクトの意味的類似性と一致した距離メートル法を学習することである。
本稿では,コサイン・マージン・トラストティブ (CMC) とコサイン・マージン・トリップレット (CMT) の損失について,コントラスト型とトリプルト型の両方の損失関数を再構成することによって提案する。
次に,マルチオブジェクト追跡とセグメンテーションのためのMOTS R-CNNフレームワークを提案する。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the central tasks of multi-object tracking involves learning a
distance metric that is consistent with the semantic similarities of objects.
The design of an appropriate loss function that encourages discriminative
feature learning is among the most crucial challenges in deep neural
network-based metric learning. Despite significant progress, slow convergence
and a poor local optimum of the existing contrastive and triplet loss based
deep metric learning methods necessitates a better solution. In this paper, we
propose cosine-margin-contrastive (CMC) and cosine-margin-triplet (CMT) loss by
reformulating both contrastive and triplet loss functions from the perspective
of cosine distance. The proposed reformulation as a cosine loss is achieved by
feature normalization which distributes the learned features on a hypersphere.
We then propose the MOTS R-CNN framework for joint multi-object tracking and
segmentation, particularly targeted at improving the tracking performance.
Specifically, the tracking problem is addressed through deep metric learning
based on the proposed loss functions. We propose a scale-invariant tracking by
using a multi-layer feature aggregation scheme to make the model robust against
object scale variations and occlusions. The MOTS R-CNN achieves the
state-of-the-art tracking performance on the KITTI MOTS dataset. We show that
the MOTS R-CNN reduces the identity switching by $62\%$ and $61\%$ on cars and
pedestrians, respectively in comparison to Track R-CNN.
- Abstract(参考訳): マルチオブジェクト追跡の中心的なタスクの1つは、オブジェクトの意味的類似性と一致する距離メトリックの学習である。
識別的特徴学習を促進する適切な損失関数の設計は、ディープニューラルネットワークに基づくメトリック学習において最も重要な課題である。
大幅な進歩にもかかわらず、遅い収束と既存の対照的および三重損失ベースの深度メトリクス学習方法の局所最適性の欠如は、より良いソリューションを必要とします。
本稿では,コサイン距離の観点からコントラスト損失関数と三重項損失関数の両方を再構成し,コサインマージンコントラスト関数 (cmc) とコサインマージン三重項損失 (cmt) を提案する。
超球面上で学習した特徴を分配する特徴正規化により,コサイン損失として提案した再構成を実現する。
そこで我々は,MOTS R-CNNのマルチオブジェクト・トラッキングとセグメンテーションのためのフレームワークを提案する。
具体的には,提案する損失関数に基づくディープメトリック学習によって追跡問題に対処する。
オブジェクトのスケール変動やオクルージョンに対して頑健なモデルを実現するために,多層特徴集約スキームを用いたスケール不変トラッカーを提案する。
MOTS R-CNNは、KITTI MOTSデータセット上で最先端のトラッキング性能を達成する。
我々は、MOTS R-CNNは、それぞれトラックR-CNNと比較して、車と歩行者のアイデンティティスイッチングを$62\%$と$61\%$減少させることを示しています。
関連論文リスト
- DiTMoS: Delving into Diverse Tiny-Model Selection on Microcontrollers [34.282971510732736]
我々は、セレクタ分類器アーキテクチャを備えた新しいDNNトレーニングおよび推論フレームワークであるDiTMoSを紹介する。
弱いモデルの合成は高い多様性を示すことができ、それらの結合は精度の上限を大幅に高めることができる。
我々は,Nucleo STM32F767ZIボード上にDiTMoSをデプロイし,人間の活動認識,キーワードスポッティング,感情認識のための時系列データセットに基づいて評価する。
論文 参考訳(メタデータ) (2024-03-14T02:11:38Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - SuSana Distancia is all you need: Enforcing class separability in metric
learning via two novel distance-based loss functions for few-shot image
classification [0.9236074230806579]
本稿では,少数のデータ間のクラス内距離とクラス間距離を調べることで,埋め込みベクトルの重要性を考慮に入れた2つの損失関数を提案する。
以上の結果から,miniImagenNetベンチマークの精度は,他のメトリクスベースの数ショット学習手法に比べて2%向上した。
論文 参考訳(メタデータ) (2023-05-15T23:12:09Z) - Improved Aggregating and Accelerating Training Methods for Spatial Graph
Neural Networks on Fraud Detection [0.0]
本稿では,CARE-GNNをResidual Layered CARE-GNN(RLC-GNN)と呼ばれるディープモデルに拡張する改良されたディープアーキテクチャを提案する。
RLC-GNNの3つの課題は、近隣情報の利用が制限に達すること、訓練の難しさ、およびノードの特徴や外部パターンに関する包括的な考慮の欠如である。
YelpとAmazonのデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-02-14T09:51:35Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - MOPS-Net: A Matrix Optimization-driven Network forTask-Oriented 3D Point
Cloud Downsampling [86.42733428762513]
MOPS-Netは行列最適化のための新しい解釈可能な深層学習手法である。
我々はMOPS-Netが様々なタスクに対して最先端の深層学習手法に対して好適な性能が得られることを示す。
論文 参考訳(メタデータ) (2020-05-01T14:01:53Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。