論文の概要: A Hybrid Approach To Real-Time Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2308.01248v1
- Date: Wed, 2 Aug 2023 16:02:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 12:24:14.911504
- Title: A Hybrid Approach To Real-Time Multi-Object Tracking
- Title(参考訳): リアルタイムマルチオブジェクトトラッキングへのハイブリッドアプローチ
- Authors: Vincenzo Mariano Scarrica, Ciro Panariello, Alessio Ferone, Antonino
Staiano
- Abstract要約: マルチオブジェクト追跡(Multi-Object Tracking、Multi-Target Tracking)は、コンピュータビジョンの重要な領域である。
本稿では,古典光学フローアルゴリズムとディープラーニングアーキテクチャを効果的に組み合わせた,リアルタイムマルチターゲットトラッキングのためのハイブリッド戦略を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-Object Tracking, also known as Multi-Target Tracking, is a significant
area of computer vision that has many uses in a variety of settings. The
development of deep learning, which has encouraged researchers to propose more
and more work in this direction, has significantly impacted the scientific
advancement around the study of tracking as well as many other domains related
to computer vision. In fact, all of the solutions that are currently
state-of-the-art in the literature and in the tracking industry, are built on
top of deep learning methodologies that produce exceptionally good results.
Deep learning is enabled thanks to the ever more powerful technology
researchers can use to handle the significant computational resources demanded
by these models. However, when real-time is a main requirement, developing a
tracking system without being constrained by expensive hardware support with
enormous computational resources is necessary to widen tracking applications in
real-world contexts. To this end, a compromise is to combine powerful deep
strategies with more traditional approaches to favor considerably lower
processing solutions at the cost of less accurate tracking results even though
suitable for real-time domains. Indeed, the present work goes in that
direction, proposing a hybrid strategy for real-time multi-target tracking that
combines effectively a classical optical flow algorithm with a deep learning
architecture, targeted to a human-crowd tracking system exhibiting a desirable
trade-off between performance in tracking precision and computational costs.
The developed architecture was experimented with different settings, and
yielded a MOTA of 0.608 out of the compared state-of-the-art 0.549 results, and
about half the running time when introducing the optical flow phase, achieving
almost the same performance in terms of accuracy.
- Abstract(参考訳): マルチオブジェクトトラッキング(multi-object tracking、マルチターゲットトラッキング)は、コンピュータビジョンの重要な領域であり、様々な設定で多くの用途がある。
深層学習(deep learning)の開発は、研究者にこの方向での研究をより多く提案するよう促しており、追跡研究やコンピュータビジョンに関連する多くの分野に関する科学的進歩に大きな影響を与えている。
実際、現在文学や追跡業界で最先端のソリューションはすべて、非常に優れた結果を生み出すディープラーニング方法論上に構築されています。
ディープラーニングは、研究者がこれらのモデルによって要求される重要な計算資源を扱うために利用できる、より強力な技術のおかげで実現されている。
しかし、リアルタイムが主な要件である場合、膨大な計算リソースを持つ高価なハードウェアサポートに制約されることなく、トラッキングシステムを開発することは、実世界の状況でアプリケーションの追跡を広げるために必要である。
この目的のために、より伝統的なアプローチと強力なディープ戦略を組み合わせることで、リアルタイムドメインに適しているにもかかわらず、より精度の低いトラッキング結果のコストで、かなり低い処理ソリューションを優先する。
実際、本研究は、従来の光学フローアルゴリズムとディープラーニングアーキテクチャを効果的に組み合わせたリアルタイムマルチターゲットトラッキングのハイブリッド戦略を提案し、精度と計算コストの追跡性能のトレードオフを示す人力追跡システムを対象としている。
開発したアーキテクチャは異なる設定で実験し、比較した0.549の結果のうち0.608のMOTAが得られ、光学フローフェーズの導入時のランニング時間の半分は精度でほぼ同じ性能を実現した。
関連論文リスト
- Real-time Monitoring and Analysis of Track and Field Athletes Based on Edge Computing and Deep Reinforcement Learning Algorithm [3.4836781982613534]
本研究は,陸上競技選手のリアルタイムモニタリングと分析に焦点を当てた。
エッジコンピューティングとディープラーニングアルゴリズムを統合したIoT最適化システムを提案する。
論文 参考訳(メタデータ) (2024-11-11T05:12:15Z) - Efficient Human Pose Estimation: Leveraging Advanced Techniques with MediaPipe [5.439359582541082]
本研究では,MediaPipeフレームワークを用いた人間のポーズ推定の大幅な向上について述べる。
この研究は精度、計算効率、リアルタイム処理能力の改善に焦点を当てている。
この進歩は、拡張現実、スポーツ分析、ヘルスケアに幅広く応用されている。
論文 参考訳(メタデータ) (2024-06-21T21:00:45Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Computation-efficient Deep Learning for Computer Vision: A Survey [121.84121397440337]
ディープラーニングモデルは、さまざまな視覚的知覚タスクにおいて、人間レベルのパフォーマンスに到達または超えた。
ディープラーニングモデルは通常、重要な計算資源を必要とし、現実のシナリオでは非現実的な電力消費、遅延、または二酸化炭素排出量につながる。
新しい研究の焦点は計算効率のよいディープラーニングであり、推論時の計算コストを最小限に抑えつつ、良好な性能を達成することを目指している。
論文 参考訳(メタデータ) (2023-08-27T03:55:28Z) - Multi-Fidelity Active Learning with GFlowNets [65.91555804996203]
本稿では,GFlowNetsをサンプルとして多要素能動学習アルゴリズムを提案する。
分子探索タスクの評価は,GFlowNetsを用いた多要素能動学習が,その単要素の予算のごく一部で高い評価の候補を発見できることを示す。
論文 参考訳(メタデータ) (2023-06-20T17:43:42Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - Scalable and Real-time Multi-Camera Vehicle Detection,
Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。
私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文 参考訳(メタデータ) (2022-04-15T12:47:01Z) - Improving the Accuracy of Early Exits in Multi-Exit Architectures via
Curriculum Learning [88.17413955380262]
マルチエクイットアーキテクチャにより、ディープニューラルネットワークは、正確なコストで厳密な期限に従うために、実行を早期に終了することができる。
カリキュラム学習を活用したマルチエクジットカリキュラム学習という新しい手法を紹介します。
本手法は, 標準訓練手法と比較して, 早期終了の精度を一貫して向上させる。
論文 参考訳(メタデータ) (2021-04-21T11:12:35Z) - Weakly-Supervised Domain Adaptation of Deep Regression Trackers via
Reinforced Knowledge Distillation [27.00282405409842]
このようなトラッカーのクラスをドメイン適応するための最初の方法論を示す。
本研究では,強化学習を弱監督の表現に用いる,弱監督型適応戦略を提案する。
5つの異なるロボットビジョン領域の実験は、我々の方法論の妥当性を実証している。
論文 参考訳(メタデータ) (2021-03-26T14:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。