論文の概要: Ultra-Fast Adaptive Track Detection Network
- arxiv url: http://arxiv.org/abs/2405.13538v1
- Date: Wed, 22 May 2024 11:19:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-25 00:34:02.861738
- Title: Ultra-Fast Adaptive Track Detection Network
- Title(参考訳): 超高速適応トラック検出ネットワーク
- Authors: Hai Ni, Rui Wang, Scarlett Liu,
- Abstract要約: 本稿では,超高速適応トラック検出ネットワークを提案する。
SRailデータセットのF1スコアは98.68%、検出レートは473 FPSである。
- 参考スコア(独自算出の注目度): 4.873803159184741
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Railway detection is critical for the automation of railway systems. Existing models often prioritize either speed or accuracy, but achieving both remains a challenge. To address the limitations of presetting anchor groups that struggle with varying track proportions from different camera angles, an ultra-fast adaptive track detection network is proposed in this paper. This network comprises a backbone network and two specialized branches (Horizontal Coordinate Locator and Perspective Identifier). The Perspective Identifier selects the suitable anchor group from preset anchor groups, thereby determining the row coordinates of the railway track. Subsequently, the Horizontal Coordinate Locator provides row classification results based on multiple preset anchor groups. Then, utilizing the results from the Perspective Identifier, it generates the column coordinates of the railway track. This network is evaluated on multiple datasets, with the lightweight version achieving an F1 score of 98.68% on the SRail dataset and a detection rate of up to 473 FPS. Compared to the SOTA, the proposed model is competitive in both speed and accuracy. The dataset and code are available at https://github.com/idnihai/UFATD
- Abstract(参考訳): 鉄道検出は鉄道システムの自動化に不可欠である。
既存のモデルはスピードや精度を優先することが多いが、両方の達成は依然として困難である。
本稿では,異なるカメラ角度からのトラック比の変動に苦慮するアンカー群の制約に対処するため,超高速適応トラック検出ネットワークを提案する。
このネットワークは、バックボーンネットワークと2つの特別なブランチ(水平座標ロケータとパースペクティブ識別子)から構成される。
パースペクティブ同定器は、予め設定されたアンカー群から適切なアンカー群を選択し、鉄道線路の行座標を決定する。
その後、水平座標ロケータは、複数のプリセットアンカー群に基づく行分類結果を提供する。
そして、パースペクティブ識別子の結果を利用して、線路の列座標を生成する。
このネットワークは複数のデータセットで評価されており、軽量バージョンはSRailデータセットで98.68%、検出レートは473 FPSである。
SOTAと比較して、提案モデルは速度と精度の両面で競合する。
データセットとコードはhttps://github.com/idnihai/UFATDで公開されている。
関連論文リスト
- Multi-attention Associate Prediction Network for Visual Tracking [3.9628431811908533]
分類回帰予測ネットワークは、いくつかの現代のディープトラッカーにおいて驚くべき成功を収めている。
分類と回帰タスクには固有の違いがあるため、特徴マッチングの要求にも反対の要求がある。
上記の問題に対処するために,マルチアテンションアソシエイト予測ネットワーク(MAPNet)を提案する。
論文 参考訳(メタデータ) (2024-03-25T03:18:58Z) - Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.28025685503376]
SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。
SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。
このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-04-27T17:56:29Z) - Revisiting Color-Event based Tracking: A Unified Network, Dataset, and
Metric [53.88188265943762]
上記の機能を同時に実現したCEUTrack(Color-Event Unified Tracking)のためのシングルステージバックボーンネットワークを提案する。
提案するCEUTrackはシンプルで,効率的で,75FPS以上を達成し,新たなSOTA性能を実現している。
論文 参考訳(メタデータ) (2022-11-20T16:01:31Z) - SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset [5.962184741057505]
我々はSOMPT22データセットを紹介した。これは、都市監視のための高さ6-8mのポール上の静止カメラから撮影した注釈付きショートビデオを備えた、複数人の追跡のための新しいセットである。
我々は,新しいデータセット上での検出とreIDネットワークの利用方法について,MOTトラッカーをワンショットと2ステージに分類して分析する。
我々の新しいデータセットの実験結果から、SOTAは依然として高効率には程遠いことが示され、シングルショットトラッカーは高速実行と精度を競合性能と一体化するための良い候補である。
論文 参考訳(メタデータ) (2022-08-04T11:09:19Z) - Detection Recovery in Online Multi-Object Tracking with Sparse Graph
Tracker [17.00871668925939]
既存の共同検出・追跡手法では、従来のトラックレットと現在の検出とを一致させるために、ペアワイズ・リレーショナルな特徴を用いる。
Sparse Graph Tracker (SGT) はより差別的な高次関係特徴を用いた新しいオンライングラフトラッカーである。
MOT16/17/20とHiEve Challengeでは、SGTはリアルタイムの推論速度で最先端のトラッカーを上回っている。
論文 参考訳(メタデータ) (2022-05-02T15:09:36Z) - Adaptive Affinity for Associations in Multi-Target Multi-Camera Tracking [53.668757725179056]
本稿では,MTMCTにおけるアフィニティ推定を対応する対応範囲に適応させるための,単純かつ効果的な手法を提案する。
すべての外見の変化に対処する代わりに、データアソシエーション中に出現する可能性のあるものに特化したアフィニティメトリックを調整します。
ミスマッチを最小限に抑えるため、アダプティブアフィニティモジュールはグローバルなre-ID距離を大幅に改善する。
論文 参考訳(メタデータ) (2021-12-14T18:59:11Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - TDIOT: Target-driven Inference for Deep Video Object Tracking [0.2457872341625575]
本研究では,事前訓練したMask R-CNNディープオブジェクト検出器をベースラインとして採用する。
本研究では,Mask R-CNNのFPN-ResNet101バックボーン上に新しい推論アーキテクチャを導入し,検出と追跡を共同で行う。
提案する単一オブジェクトトラッカであるtdiotは、データアソシエーションに外観類似性に基づく時間マッチングを適用する。
論文 参考訳(メタデータ) (2021-03-19T20:45:06Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z) - Tracklets Predicting Based Adaptive Graph Tracking [51.352829280902114]
マルチオブジェクト追跡,すなわち textbfTPAGT のための,正確かつエンドツーエンドの学習フレームワークを提案する。
動作予測に基づいて、現在のフレーム内のトラックレットの特徴を再抽出する。
論文 参考訳(メタデータ) (2020-10-18T16:16:49Z) - Automatic extraction of road intersection points from USGS historical
map series using deep convolutional neural networks [0.0]
道路交差点のデータは、異なる地理空間的応用と分析に利用されてきた。
我々は、ディープ畳み込みニューラルネットワークを領域ベースCNNと呼ばれるオブジェクト検出タスクに使用する標準パラダイムを採用した。
また、従来のコンピュータビジョンアルゴリズムと比較して、RCNNはより正確な抽出を提供する。
論文 参考訳(メタデータ) (2020-07-14T23:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。