論文の概要: 360VOT: A New Benchmark Dataset for Omnidirectional Visual Object
Tracking
- arxiv url: http://arxiv.org/abs/2307.14630v1
- Date: Thu, 27 Jul 2023 05:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 15:38:31.532210
- Title: 360VOT: A New Benchmark Dataset for Omnidirectional Visual Object
Tracking
- Title(参考訳): 360VOT: 双方向ビジュアルオブジェクト追跡のためのベンチマークデータセット
- Authors: Huajian Huang, Yinzhe Xu, Yingshu Chen, and Sai-Kit Yeung
- Abstract要約: 360deg画像は、安定かつ長期のシーン知覚にとって重要な全方位視野を提供することができる。
本稿では,視覚的物体追跡のための360度デグ画像について検討し,歪みによる新たな課題について考察する。
今後の研究を促進するため,新しい大規模全方位追跡ベンチマークである360VOTを提案する。
- 参考スコア(独自算出の注目度): 10.87309734945868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 360{\deg} images can provide an omnidirectional field of view which is
important for stable and long-term scene perception. In this paper, we explore
360{\deg} images for visual object tracking and perceive new challenges caused
by large distortion, stitching artifacts, and other unique attributes of
360{\deg} images. To alleviate these problems, we take advantage of novel
representations of target localization, i.e., bounding field-of-view, and then
introduce a general 360 tracking framework that can adopt typical trackers for
omnidirectional tracking. More importantly, we propose a new large-scale
omnidirectional tracking benchmark dataset, 360VOT, in order to facilitate
future research. 360VOT contains 120 sequences with up to 113K high-resolution
frames in equirectangular projection. The tracking targets cover 32 categories
in diverse scenarios. Moreover, we provide 4 types of unbiased ground truth,
including (rotated) bounding boxes and (rotated) bounding field-of-views, as
well as new metrics tailored for 360{\deg} images which allow for the accurate
evaluation of omnidirectional tracking performance. Finally, we extensively
evaluated 20 state-of-the-art visual trackers and provided a new baseline for
future comparisons. Homepage: https://360vot.hkustvgd.com
- Abstract(参考訳): 360{\deg}画像は、安定かつ長期のシーン知覚に重要な全方位視野を提供することができる。
本稿では,視覚物体追跡のための360{\deg}画像について検討し,360{\deg}画像の歪み,縫製加工,その他の特徴による新たな課題について考察する。
これらの問題を緩和するために、ターゲットローカライゼーションの新たな表現、すなわちバウンディング・フィールド・オブ・ビューを生かし、全方位トラッキングに典型的なトラッカーを利用できる一般的な360トラッキングフレームワークを導入する。
さらに, 今後の研究を促進するために, 大規模全方位追跡ベンチマークデータセット 360vot を提案する。
360VOTは120のシーケンスと113Kの高解像度フレームを含んでいる。
追跡対象は、さまざまなシナリオで32のカテゴリをカバーする。
さらに,(回転)バウンディングボックスと(回転)バウンディング・フィールド・オブ・ビューと,360{\deg} 画像用に調整された新しいメトリクスにより,全方位追跡性能の高精度な評価が可能となる。
最後に、最先端の20のビジュアルトラッカーを広範囲に評価し、将来の比較のための新しいベースラインを提供した。
ホームページ: https://360vot.hkustvgd.com
関連論文リスト
- 360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos [16.372814014632944]
我々は全方向ビデオオブジェクトセグメンテーション(360VOS)と呼ばれる新しいコンポーネントを組み込んだ包括的なデータセットとベンチマークを提案する。
360VOSデータセットは、高密度のピクセルワイドマスクを伴い、290のシーケンスを含み、幅広いターゲットカテゴリをカバーする。
我々は最先端のアプローチをベンチマークし、提案した360度トラッキングフレームワークとトレーニングデータセットの有効性を実証する。
論文 参考訳(メタデータ) (2024-04-22T07:54:53Z) - See360: Novel Panoramic View Interpolation [24.965259708297932]
See360は、潜在空間視点推定を用いた360パノラマビューのための汎用的で効率的なフレームワークである。
提案手法は,4つのデータセットに対する任意のビューのリアルタイムレンダリングを実現するのに十分な汎用性を有することを示す。
論文 参考訳(メタデータ) (2024-01-07T09:17:32Z) - 360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries [24.345954562946385]
本稿では,視覚的ローカライゼーションのための地平線ポーズを持つ360$circ$画像からなる新しいベンチマークデータセットである360Locを紹介する。
360$circ$画像から低FoVクエリフレームを生成するための仮想カメラ手法を提案する。
一方向の視覚的ローカライゼーションは、対称性と繰り返し構造を持つ大規模シーンに挑戦する上で、より堅牢であることを示す。
論文 参考訳(メタデータ) (2023-11-29T06:42:12Z) - NeO 360: Neural Fields for Sparse View Synthesis of Outdoor Scenes [59.15910989235392]
屋外シーンのスパースビュー合成のためのNeO 360, Neural Fieldを紹介する。
NeO 360は、単一のまたは少数のRGB画像から360degのシーンを再構成する一般化可能な方法である。
我々の表現は、Voxel-basedとBird's-eye-view (BEV)の両方の表現の長所を組み合わせたものである。
論文 参考訳(メタデータ) (2023-08-24T17:59:50Z) - DIVOTrack: A Novel Dataset and Baseline Method for Cross-View
Multi-Object Tracking in DIVerse Open Scenes [74.64897845999677]
歩行者が密集したDIVerse Openのシーンを対象とした,新しいクロスビュー多目的追跡データセットを提案する。
私たちのDIVOTrackには15の異なるシナリオと953のクロスビュートラックがあります。
さらに,クロスモット(CrossMOT)という統合型共同検出・クロスビュートラッキングフレームワークを用いた新しいベースラインクロスビュートラッキング手法を提案する。
論文 参考訳(メタデータ) (2023-02-15T14:10:42Z) - CXTrack: Improving 3D Point Cloud Tracking with Contextual Information [59.55870742072618]
3Dオブジェクトトラッキングは、自律運転など、多くのアプリケーションにおいて重要な役割を果たす。
CXTrackは3次元オブジェクト追跡のためのトランスフォーマーベースのネットワークである。
CXTrackは29FPSで動作しながら最先端のトラッキング性能を実現する。
論文 参考訳(メタデータ) (2022-11-12T11:29:01Z) - AVisT: A Benchmark for Visual Object Tracking in Adverse Visibility [125.77396380698639]
AVisTは、視認性の悪いさまざまなシナリオにおける視覚的トラッキングのためのベンチマークである。
AVisTは、80kの注釈付きフレームを持つ120の挑戦的なシーケンスで構成されており、18の多様なシナリオにまたがっている。
我々は、属性間でのトラッキング性能を詳細に分析し、AVisTで17の人気のトラッカーと最近のトラッカーをベンチマークした。
論文 参考訳(メタデータ) (2022-08-14T17:49:37Z) - Field-of-View IoU for Object Detection in 360{\deg} Images [36.72543749626039]
本研究では,FoV-IoU(FoV-IoU)と360deg画像における物体検出のための360Augmentationという2つの基本手法を提案する。
FoV-IoUは2つの視野境界ボックスの交叉結合を球面画像で計算し、トレーニング、推論、評価に使用できる。
360Augmentationは、球面イメージをランダムに回転させ、球面から平面への投影によるバイアスを解決する360degオブジェクト検出タスクに特有のデータ拡張技術である。
論文 参考訳(メタデータ) (2022-02-07T14:01:59Z) - Tracking Objects as Points [83.9217787335878]
同時に検出と追跡を同時に行うアルゴリズムは,最先端技術よりもシンプルで,高速で,高精度である。
トラッカーであるCenterTrackは、前のフレームから一対のイメージと検出に検出モデルを適用します。
CenterTrackはシンプルで、オンライン(未来を覗くことはない)で、リアルタイムだ。
論文 参考訳(メタデータ) (2020-04-02T17:58:40Z) - A Fixation-based 360{\deg} Benchmark Dataset for Salient Object
Detection [21.314578493964333]
パノラマコンテンツ中の固定予測(FP)は、仮想現実(VR)アプリケーションの普及傾向とともに広く研究されている。
静止物体検出(SOD)は、実際のシーンを表すデータセットが欠如しているため、360度画像ではめったに探索されていない。
論文 参考訳(メタデータ) (2020-01-22T11:16:39Z) - Visual Question Answering on 360{\deg} Images [96.00046925811515]
VQA 360は、360度画像上で視覚的な質問に答える新しいタスクである。
最初のVQA 360データセットを収集し、様々な質問タイプに対して、約17,000の現実世界の画像検索用トリプルを含む。
論文 参考訳(メタデータ) (2020-01-10T08:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。