論文の概要: Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines
- arxiv url: http://arxiv.org/abs/2406.14482v1
- Date: Thu, 20 Jun 2024 16:43:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 12:43:03.175506
- Title: Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines
- Title(参考訳): Visible-Thermal Tiny Object Detection:ベンチマークデータセットとベースライン
- Authors: Xinyi Ying, Chao Xiao, Ruojing Li, Xu He, Boyang Li, Zhaoxu Li, Yingqian Wang, Mingyuan Hu, Qingyu Xu, Zaiping Lin, Miao Li, Shilin Zhou, Wei An, Weidong Sheng, Li Liu,
- Abstract要約: 我々は、可視光熱小物体検出(RGBT SOD)のための高多様性を持つ最初の大規模ベンチマークを構築した。
RGBT-Tinyは、多彩なターゲット(7種類)と高多様性シーン(8種類)を含む。
本研究では,小型・大型の目標に対して高いロバスト性を示すSAFit尺度を提案する。
- 参考スコア(独自算出の注目度): 39.20118685290086
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Small object detection (SOD) has been a longstanding yet challenging task for decades, with numerous datasets and algorithms being developed. However, they mainly focus on either visible or thermal modality, while visible-thermal (RGBT) bimodality is rarely explored. Although some RGBT datasets have been developed recently, the insufficient quantity, limited category, misaligned images and large target size cannot provide an impartial benchmark to evaluate multi-category visible-thermal small object detection (RGBT SOD) algorithms. In this paper, we build the first large-scale benchmark with high diversity for RGBT SOD (namely RGBT-Tiny), including 115 paired sequences, 93K frames and 1.2M manual annotations. RGBT-Tiny contains abundant targets (7 categories) and high-diversity scenes (8 types that cover different illumination and density variations). Note that, over 81% of targets are smaller than 16x16, and we provide paired bounding box annotations with tracking ID to offer an extremely challenging benchmark with wide-range applications, such as RGBT fusion, detection and tracking. In addition, we propose a scale adaptive fitness (SAFit) measure that exhibits high robustness on both small and large targets. The proposed SAFit can provide reasonable performance evaluation and promote detection performance. Based on the proposed RGBT-Tiny dataset and SAFit measure, extensive evaluations have been conducted, including 23 recent state-of-the-art algorithms that cover four different types (i.e., visible generic detection, visible SOD, thermal SOD and RGBT object detection). Project is available at https://github.com/XinyiYing24/RGBT-Tiny.
- Abstract(参考訳): 小型物体検出(SOD)は、何十年にもわたって難題であり、多くのデータセットやアルゴリズムが開発されてきた。
しかし、主に可視的または熱的モダリティに焦点をあてる一方で、可視熱水(RGBT)バイモーダリティは滅多に調査されない。
近年、いくつかのRGBTデータセットが開発されているが、不十分な量、限られたカテゴリ、不整合画像、大きなターゲットサイズは、マルチカテゴリ可視熱小物体検出(RGBT SOD)アルゴリズムを評価するための公平なベンチマークを提供することができない。
本稿では,RGBT SOD (いわゆるRGBT-Tiny) に対して,115組のペアシーケンス,93Kフレーム,1.2Mマニュアルアノテーションを含む,多様性の高い最初の大規模ベンチマークを構築した。
RGBT-Tinyには、多くのターゲット(7つのカテゴリ)と高多様性シーン(8種類の照明と密度の変化をカバーする)が含まれている。
ターゲットの81%以上が16x16よりも小さく、トラッキングIDを備えたペア境界ボックスアノテーションを提供し、RGBT融合や検出、トラッキングといった広範囲のアプリケーションで非常に難しいベンチマークを提供することに注意してください。
また,小型・大型の目標に対して高いロバスト性を示すSAFit尺度を提案する。
提案したSAFitは適切な性能評価と検出性能の促進を可能にする。
提案したRGBT-TinyデータセットとSAFit測定に基づいて、23の最新の最先端アルゴリズム(可視ジェネリック検出、可視SOD、サーマルSOD、RGBTオブジェクト検出)を含む広範な評価が行われた。
プロジェクトはhttps://github.com/XinyiYing24/RGBT-Tinyで入手できる。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale
SAR Object Detection [83.21028626585986]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Towards Large-Scale Small Object Detection: Survey and Benchmarks [48.961205652306695]
我々は2つの大規模小型物体検出装置(SODA)、SODA-DおよびSODA-Aを構築し、それぞれが運転シナリオと航空シナリオに焦点を当てている。
SODA-Aでは,高分解能空中画像2513点を抽出し,9クラスに872069点を注釈した。
提案されたデータセットは、徹底的な注釈付きインスタンスの膨大なコレクションを持つ大規模なベンチマークへの最初の試みである。
論文 参考訳(メタデータ) (2022-07-28T14:02:18Z) - Detecting tiny objects in aerial images: A normalized Wasserstein
distance and a new benchmark [45.10513110142015]
本稿では, 正規化ワッサースタイン距離 (NWD) と呼ばれる新しい評価基準と, 小型物体検出のためのRanKing-based Assigning (RKA) 戦略を提案する。
提案したNWD-RKA戦略は、標準のIoUしきい値に基づくものを置き換えるために、あらゆる種類のアンカーベースの検出器に容易に組み込むことができる。
4つのデータセットでテストされたNWD-RKAは、大きなマージンで小さなオブジェクト検出性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-06-28T13:33:06Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - LasHeR: A Large-scale High-diversity Benchmark for RGBT Tracking [27.00930976353204]
LasHeRは1224枚の可視・熱赤外ビデオ対と合計730Kフレーム対で構成されている。
LasHeRは、広範囲のオブジェクトカテゴリ、カメラ視点、シーンの複雑さ、環境要因から非常に多様である。
LasHeRデータセット上で12RGBT追跡アルゴリズムの包括的なパフォーマンス評価を行います。
論文 参考訳(メタデータ) (2021-04-27T14:04:23Z) - RGBT Salient Object Detection: A Large-scale Dataset and Benchmark [12.14043884641457]
RGBと熱赤外画像の利点を生かして、複雑な場面で顕著な物体を検出する新たな研究方向となる。
この研究はVT5000という名のRGBT画像データセットに寄与し、5000の空間的整列されたRGBT画像対と地上の真理アノテーションを含んでいる。
本稿では,各モードの多レベル特徴を抽出し,すべてのモードの特徴をアテンション機構で集約する,強力なベースラインアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-07T07:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。