論文の概要: A Novel Bounding Box Regression Method for Single Object Tracking
- arxiv url: http://arxiv.org/abs/2405.10444v1
- Date: Thu, 16 May 2024 21:09:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-20 17:21:37.724385
- Title: A Novel Bounding Box Regression Method for Single Object Tracking
- Title(参考訳): 単一物体追跡のための新しいバウンディングボックス回帰法
- Authors: Omar Abdelaziz, Mohamed Sami Shehata,
- Abstract要約: 本稿では,2つの新しいバウンディングボックスレグレッションネットワーク(インセプションとデフォルマブル)を導入する。
実験およびアブレーション実験により、ODTrackにインストールされた初期モジュールは、3つのベンチマークで後者を上回る性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Locating an object in a sequence of frames, given its appearance in the first frame of the sequence, is a hard problem that involves many stages. Usually, state-of-the-art methods focus on bringing novel ideas in the visual encoding or relational modelling phases. However, in this work, we show that bounding box regression from learned joint search and template features is of high importance as well. While previous methods relied heavily on well-learned features representing interactions between search and template, we hypothesize that the receptive field of the input convolutional bounding box network plays an important role in accurately determining the object location. To this end, we introduce two novel bounding box regression networks: inception and deformable. Experiments and ablation studies show that our inception module installed on the recent ODTrack outperforms the latter on three benchmarks: the GOT-10k, the UAV123 and the OTB2015.
- Abstract(参考訳): 一連のフレームにオブジェクトを配置することは、そのシーケンスの最初のフレームに現れることを考えると、多くのステージを含む難しい問題である。
通常、最先端の手法は、視覚的エンコーディングまたはリレーショナルモデリングフェーズに新しいアイデアをもたらすことに重点を置いている。
しかし,本研究では,学習した共同検索とテンプレート機能による境界ボックスの回帰が重要であることを示す。
従来の手法は,検索とテンプレート間の相互作用をよく表現する特徴に大きく依存していたが,入力畳み込み境界ボックスネットワークの受容場は,オブジェクトの位置を正確に決定する上で重要な役割を担っている,という仮説を立てた。
この目的のために、我々は2つの新しいバウンディングボックス回帰ネットワーク(インセプションとデフォルマブル)を導入する。
実験およびアブレーション実験により、最近のODTrackにインストールされた我々の開始モジュールは、GOT-10k、UAV123、OTB2015の3つのベンチマークにおいて、後者よりも優れていることが示された。
関連論文リスト
- Prototype-based Cross-Modal Object Tracking [17.367890389752596]
クロスモーダル物体追跡は情報融合分野における重要な研究課題である。
本稿では,プロトタイプをベースとしたオブジェクトトラッカーProtoTrackを提案する。
特に,第1フレームからの固定サンプルと,異なるモダリティからの2つの代表サンプルを含む多種多様なサンプルを用いて,対象情報を表現するためのマルチモーダルプロトタイプを設計する。
論文 参考訳(メタデータ) (2023-12-22T06:49:44Z) - LEF: Late-to-Early Temporal Fusion for LiDAR 3D Object Detection [40.267769862404684]
時間的LiDAR点雲を用いた3次元物体検出のための特徴融合手法を提案する。
私たちの主な動機は、3Dオブジェクト検出器の初期段階にオブジェクト認識の潜伏埋め込みを融合させることです。
論文 参考訳(メタデータ) (2023-09-28T21:58:25Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - TrajectoryFormer: 3D Object Tracking Transformer with Predictive
Trajectory Hypotheses [51.60422927416087]
3Dマルチオブジェクトトラッキング(MOT)は、自律走行車やサービスロボットを含む多くのアプリケーションにとって不可欠である。
本稿では,新しいポイントクラウドベースの3DMOTフレームワークであるTrjectoryFormerを紹介する。
論文 参考訳(メタデータ) (2023-06-09T13:31:50Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - DAFNe: A One-Stage Anchor-Free Deep Model for Oriented Object Detection [16.21161769128316]
DAFNe: オブジェクト指向物体検出のためのワンステージアンカーフリーディープネットワークを提案する。
アンカーフリーモデルとして、DAFNeはバウンディングボックスアンカーの使用を控えることで予測複雑性を低減する。
低品質な予測に対する任意指向の有界箱に対する中心性関数の指向性を考慮した一般化を提案する。
論文 参考訳(メタデータ) (2021-09-13T17:37:20Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - End-to-end Deep Object Tracking with Circular Loss Function for Rotated
Bounding Box [68.8204255655161]
Transformer Multi-Head Attentionアーキテクチャに基づく新しいエンドツーエンドのディープラーニング手法を紹介します。
また,境界ボックスの重なりと向きを考慮に入れた新しいタイプの損失関数を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:29:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。