論文の概要: 7th AI Driving Olympics: 1st Place Report for Panoptic Tracking
- arxiv url: http://arxiv.org/abs/2112.05210v1
- Date: Thu, 9 Dec 2021 20:52:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 14:03:12.127215
- Title: 7th AI Driving Olympics: 1st Place Report for Panoptic Tracking
- Title(参考訳): 第7回ai運転オリンピック:パンオプティカルトラッキング第1位
- Authors: Rohit Mohan, Abhinav Valada
- Abstract要約: 私たちのアーキテクチャは、NeurIPS 2021で開かれた第7回AI運転オリンピックで、パノプティクストラッキングの挑戦に勝ちました。
提案手法では,3つの連続的に蓄積したスキャンを用いて局所的に一貫した汎視追跡IDを推定し,同時にスキャン間の重なりを推定し,与えられたシーケンスに対して一貫した一貫した汎視追跡IDを推定する。
NeurIPS 2021の第7回AI運転オリンピックのベンチマーク結果は、私たちのモデルは、Panoptic nuScenesデータセットの汎視追跡タスクにおいて、第1位にランクされていることを示している。
- 参考スコア(独自算出の注目度): 6.226227982115869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this technical report, we describe our EfficientLPT architecture that won
the panoptic tracking challenge in the 7th AI Driving Olympics at NeurIPS 2021.
Our architecture builds upon the top-down EfficientLPS panoptic segmentation
approach. EfficientLPT consists of a shared backbone with a modified
EfficientNet-B5 model comprising the proximity convolution module as the
encoder followed by the range-aware FPN to aggregate semantically rich
range-aware multi-scale features. Subsequently, we employ two task-specific
heads, the scale-invariant semantic head and hybrid task cascade with feedback
from the semantic head as the instance head. Further, we employ a novel
panoptic fusion module to adaptively fuse logits from each of the heads to
yield the panoptic tracking output. Our approach exploits three consecutive
accumulated scans to predict locally consistent panoptic tracking IDs and also
the overlap between the scans to predict globally consistent panoptic tracking
IDs for a given sequence. The benchmarking results from the 7th AI Driving
Olympics at NeurIPS 2021 show that our model is ranked #1 for the panoptic
tracking task on the Panoptic nuScenes dataset.
- Abstract(参考訳): この技術レポートでは、NeurIPS 2021で開かれた第7回AI運転オリンピックにおいて、パン光学追跡の挑戦に勝利した効率の良いLPTアーキテクチャについて述べる。
我々のアーキテクチャは、トップダウンの高効率LPSパノプティカルセグメンテーションアプローチに基づいている。
効率的なLPTは、近接畳み込みモジュールをエンコーダとする改良されたEfficientNet-B5モデルと、セマンティックにリッチな範囲対応のマルチスケール特徴を集約する範囲対応FPNからなる共有バックボーンで構成される。
次に,semantic headをインスタンスヘッドとして,scale-invariant semantic headとhybrid task cascadeの2つのタスク固有ヘッドを用いた。
さらに,各頭部のロジットを適応的に融合させてパン光学追跡出力を得るために,新しいパン光学融合モジュールを用いる。
提案手法では,3つの連続的に蓄積したスキャンを用いて局所的に一貫した汎視追跡IDを推定し,同時にスキャン間の重なりを推定し,与えられたシーケンスに対して一貫した汎視追跡IDを予測する。
ニューオリプス2021年の第7回ai運転オリンピックのベンチマーク結果は、我々のモデルはpanoptic nuscenesデータセットのpanopticトラッキングタスクで1位にランクされていることを示している。
関連論文リスト
- Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - SDTracker: Synthetic Data Based Multi-Object Tracking [8.43201092674197]
SDTrackerは、実世界のシーンの多目的追跡に合成データのポテンシャルを利用する手法である。
合成データのスタイルをランダムにするために、ImageNetデータセットを補助的に使用します。
また、未ラベルのMOT17トレーニングデータを効果的に活用するために擬似ラベル方式を採用する。
論文 参考訳(メタデータ) (2023-03-26T08:21:22Z) - Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences [49.91741677556553]
本研究では、認識タスクのための地域レベルの特徴表現を事前学習するための時間順述前文タスクであるTempOを提案する。
我々は各フレームを、オブジェクト検出やトラッキングシステムにとって自然な表現である、未順序な特徴ベクトルのセットで埋め込む。
BDD100K、nu Images、MOT17データセットの大規模な評価は、私たちのTempO事前学習アプローチがシングルフレームの自己教師型学習方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-02-17T18:18:27Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - Panoptic-PHNet: Towards Real-Time and High-Precision LiDAR Panoptic
Segmentation via Clustering Pseudo Heatmap [9.770808277353128]
本稿では,Panoptic-PHNetと呼ばれる高速かつ高性能なLiDARベースのフレームワークを提案する。
我々は、クラスタリング擬似ヒートマップを新しいパラダイムとして導入し、それに続いて、集中型グループ化モジュールが、効率的なクラスタリングのためにインスタンスセンタを生成する。
バックボーンデザインでは、細粒度のボクセル機能と2D Bird's Eye View (BEV)機能を異なる受容領域に融合し、詳細情報とグローバル情報の両方を利用する。
論文 参考訳(メタデータ) (2022-05-14T08:16:13Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z) - Robust Vision Challenge 2020 -- 1st Place Report for Panoptic
Segmentation [13.23676270963484]
私たちのネットワークは、最先端のEfficientPSアーキテクチャの軽量版です。
提案した共有バックボーンと改良されたEfficientNet-B5モデルをエンコーダとして,続いて2方向FPNで意味的にリッチなマルチスケール機能について学習する。
提案するパン光学融合モジュールは,各頭部のロジットを適応的に融合させ,パン光学分割出力を出力する。
論文 参考訳(メタデータ) (2020-08-23T21:41:43Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z) - MOPT: Multi-Object Panoptic Tracking [33.77171216778909]
マルチオブジェクト・パノプティブ・トラッキング(MOPT)と呼ばれる新しい知覚タスクを導入する。
MOPTは、時間とともに、"thing"クラスと"stuff"クラスのピクセルレベルのセマンティック情報、時間的コヒーレンス、ピクセルレベルの関連を活用できる。
視覚ベースとLiDARベースのMOPTの定量的,定性的な評価を行い,その効果を実証した。
論文 参考訳(メタデータ) (2020-04-17T11:45:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。