論文の概要: Improving Object Detection, Multi-object Tracking, and Re-Identification
for Disaster Response Drones
- arxiv url: http://arxiv.org/abs/2201.01494v1
- Date: Wed, 5 Jan 2022 07:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 17:34:22.949195
- Title: Improving Object Detection, Multi-object Tracking, and Re-Identification
for Disaster Response Drones
- Title(参考訳): 災害対応ドローンの物体検出・多目的追跡・再同定の改善
- Authors: Chongkeun Paik, Hyunwoo J. Kim
- Abstract要約: 本研究の目的は,災害対応ドローンの複数のカメラとコンピュータビジョンを用いて,複数の物体を検出し,識別することである。
これらの問題を解決するために2つの簡単なアプローチが提案されている。
1つは高速マルチカメラシステムで、もう1つはトラックレットアソシエーションを追加し、もう1つは制限を解決するために高性能検出器とトラッカーを組み込んでいる。
- 参考スコア(独自算出の注目度): 11.84256047381657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We aim to detect and identify multiple objects using multiple cameras and
computer vision for disaster response drones. The major challenges are taming
detection errors, resolving ID switching and fragmentation, adapting to
multi-scale features and multiple views with global camera motion. Two simple
approaches are proposed to solve these issues. One is a fast multi-camera
system that added a tracklet association, and the other is incorporating a
high-performance detector and tracker to resolve restrictions. (...) The
accuracy of our first approach (85.71%) is slightly improved compared to our
baseline, FairMOT (85.44%) in the validation dataset. In the final results
calculated based on L2-norm error, the baseline was 48.1, while the proposed
model combination was 34.9, which is a great reduction of error by a margin of
27.4%. In the second approach, although DeepSORT only processes a quarter of
all frames due to hardware and time limitations, our model with DeepSORT
(42.9%) outperforms FairMOT (71.4%) in terms of recall. Both of our models
ranked second and third place in the `AI Grand Challenge' organized by the
Korean Ministry of Science and ICT in 2020 and 2021, respectively. The source
codes are publicly available at these URLs
(github.com/mlvlab/drone_ai_challenge, github.com/mlvlab/Drone_Task1,
github.com/mlvlab/Rony2_task3, github.com/mlvlab/Drone_task4).
- Abstract(参考訳): 我々は,災害対応ドローンの複数のカメラとコンピュータビジョンを用いて,複数の物体を検出し,識別することを目指している。
主な課題は、検出エラーの回避、ID切り替えとフラグメンテーションの解決、マルチスケール機能への適応、グローバルカメラモーションによる複数のビューである。
これらの問題を解決するために2つの簡単なアプローチが提案されている。
1つは、トラックレットアソシエーションを追加した高速マルチカメラシステムで、もう1つは、制限を解決するために高性能検出器とトラッカーを組み込んでいる。
(...)
最初のアプローチ(85.71%)の精度は、検証データセットのベースラインであるFairMOT(85.44%)と比べてわずかに改善されている。
L2-ノルム誤差に基づいて計算された最終的な結果では、ベースラインは48.1であり、提案されたモデルの組み合わせは34.9であり、誤差を27.4%削減する。
第2のアプローチでは、ハードウェアと時間制限のため、DeepSORTは全フレームの4分の1しか処理しないが、DeepSORT (42.9%) のモデルはリコールの点でFairMOT (71.4%) を上回っている。
両モデルはそれぞれ、2020年と2021年に韓国科学省とICTが主催した「AIグランドチャレンジ」で第2位と第3位にランクインした。
ソースコードはこれらのURLで公開されている(github.com/mlvlab/drone_ai_challenge, github.com/mlvlab/Drone_Task1, github.com/mlvlab/Rony2_task3, github.com/mlvlab/Drone_task4)。
関連論文リスト
- DroBoost: An Intelligent Score and Model Boosting Method for Drone Detection [1.2564343689544843]
ドローン検出は、画像の可視性や品質が好ましくないような、困難な物体検出タスクである。
私たちの仕事は、いくつかの改善を組み合わせることで、以前のアプローチを改善します。
提案された技術は、Drone vs. Bird Challengeで1位を獲得した。
論文 参考訳(メタデータ) (2024-06-30T20:49:56Z) - Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems [13.225654514930595]
Multi-Resolution Rescored Byte-Track (MR2-ByteTrack)は、超低消費電力組み込みプロセッサのための新しいビデオオブジェクト検出フレームワークである。
MR2-ByteTrackは、市販のDeep Neural Networkベースのオブジェクト検出器の平均計算負荷を最大2.25$times$に削減する。
GAP9マイクロコントローラでは,平均精度が2.16%,遅延が43%向上した。
論文 参考訳(メタデータ) (2024-04-17T15:45:49Z) - Single-Model and Any-Modality for Video Object Tracking [85.83753760853142]
任意のモダリティに対して単一のパラメータセットの統一トラッカーUn-Trackを導入する。
任意のモダリティを扱うために,低ランク因子化および再構成手法を用いて,それらの共通潜時空間を学習する。
我々のUn-Trackは、+6.6M(93M以上)のパラメータを持つ+2.14(21.50以上)のGFLOPを導入することで、DepthTrackデータセット上で、+8.1絶対Fスコアゲインを達成する。
論文 参考訳(メタデータ) (2023-11-27T14:17:41Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Improving CNN-based Person Re-identification using score Normalization [2.462953128215087]
本稿では,CNNに基づく特徴抽出手法とXQDA(Cross-view Quadratic Discriminant Analysis)を組み合わせたPRe-IDを提案する。
提案手法は、VIPeR、GRID、CUHK01、VIPeR、PRID450Sの4つの挑戦的データセットで検証される。
論文 参考訳(メタデータ) (2023-07-01T18:12:27Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - Improving Domain Generalization by Learning without Forgetting:
Application in Retail Checkout [0.0]
本稿では,2段階パイプラインを用いた手法を提案することにより,この問題に対処する。
第1段階はクラスに依存しない項目を検出し、第2段階は製品カテゴリの分類専用である。
この方法は2022年のAIシティチャレンジで評価されます -- トラック4で、テストAセットでF1のスコアを40%以上取得します。
論文 参考訳(メタデータ) (2022-07-12T09:35:28Z) - CoDeNet: Efficient Deployment of Input-Adaptive Object Detection on
Embedded FPGAs [41.43273142203345]
FPGAの柔軟性を利用して、変形可能な畳み込みを伴う新しいオブジェクト検出パイプラインを開発する。
高効率実装では、ソリューションは毎秒26.9フレームに達し、小さなモデルサイズは0.76MBである。
我々のモデルはPascal VOCで67.1 AP50に達し、パラメータは20.9倍小さいがTiny-YOLOより10%正確である。
論文 参考訳(メタデータ) (2020-06-12T17:56:47Z) - Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern
Object Detectors [47.64219291655723]
我々は、最先端のオブジェクト検出ベンチマークを2つ採用し、4つの大規模データセット上で15モデル以上を分析します。
モデルが空の領域に多くのボックスを生成し、そのコンテキストが大きな領域よりも小さなオブジェクトを検出するのに重要であることが分かりました。
論文 参考訳(メタデータ) (2020-04-05T06:19:43Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。