論文の概要: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- arxiv url: http://arxiv.org/abs/2409.12977v1
- Date: Tue, 3 Sep 2024 04:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 12:36:59.667919
- Title: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- Title(参考訳): 一度だけ見る(YOLO)マルチスペクトル物体検出の進歩と応用と課題
- Authors: James E. Gallagher, Edward J. Oughton,
- Abstract要約: 本稿では,400件の論文を詳細にレビューし,マルチスペクトルイメージング技術,深層学習モデル,その応用の権威的メタレビューを提供する。
グラウンドベースの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計している。
最も一般的なセンサー融合は、赤緑色(RGB)とLWIR(Long-Wave Infrared)である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multispectral imaging and deep learning have emerged as powerful tools supporting diverse use cases from autonomous vehicles, to agriculture, infrastructure monitoring and environmental assessment. The combination of these technologies has led to significant advancements in object detection, classification, and segmentation tasks in the non-visible light spectrum. This paper considers 400 total papers, reviewing 200 in detail to provide an authoritative meta-review of multispectral imaging technologies, deep learning models, and their applications, considering the evolution and adaptation of You Only Look Once (YOLO) methods. Ground-based collection is the most prevalent approach, totaling 63% of the papers reviewed, although uncrewed aerial systems (UAS) for YOLO-multispectral applications have doubled since 2020. The most prevalent sensor fusion is Red-Green-Blue (RGB) with Long-Wave Infrared (LWIR), comprising 39% of the literature. YOLOv5 remains the most used variant for adaption to multispectral applications, consisting of 33% of all modified YOLO models reviewed. 58% of multispectral-YOLO research is being conducted in China, with broadly similar research quality to other countries (with a mean journal impact factor of 4.45 versus 4.36 for papers not originating from Chinese institutions). Future research needs to focus on (i) developing adaptive YOLO architectures capable of handling diverse spectral inputs that do not require extensive architectural modifications, (ii) exploring methods to generate large synthetic multispectral datasets, (iii) advancing multispectral YOLO transfer learning techniques to address dataset scarcity, and (iv) innovating fusion research with other sensor types beyond RGB and LWIR.
- Abstract(参考訳): マルチスペクトルイメージングとディープラーニングは、自動運転車から農業、インフラ監視、環境評価に至るまで、多様なユースケースをサポートする強力なツールとして登場した。
これらの技術の組み合わせにより、非可視光スペクトルにおける物体の検出、分類、セグメンテーションタスクが大幅に進歩した。
本稿では,多スペクトルイメージング技術,深層学習モデル,およびそれらの応用の権威的メタレビューを,You Only Look Once(YOLO)手法の進化と適応を考慮した400の論文を詳細に検討し,200の論文を概説する。
地上からの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計しているが、YOLOマルチスペクトルの無人航空システム(UAS)は2020年以来倍増している。
最も一般的なセンサー融合は、RGB(Red-Green-Blue)とLWIR(Long-Wave Infrared)であり、文献の39%を占めている。
YOLOv5は、修正された全てのYOLOモデルの33%からなる、マルチスペクトルアプリケーションへの適応に最もよく使われる変種である。
中国では、マルチスペクトル-YOLO研究の58%が実施されており、他国と大きく類似している(中国の機関から派生していない論文では、平均ジャーナルインパクト係数4.45対4.36対4.36)。
今後の研究課題
一 広範囲なアーキテクチャ変更を必要としない多様なスペクトル入力を処理できる適応型YOLOアーキテクチャを開発すること。
(II)大規模合成多スペクトルデータセットの作成方法
3 データセットの不足に対処する多スペクトルYOLO転送学習技術の進歩
(4)RGB及びLWIR以外のセンサとの融合研究の革新。
関連論文リスト
- Survey on AI-Generated Media Detection: From Non-MLLM to MLLM [51.91311158085973]
AI生成メディアを検出する方法は急速に進化してきた。
MLLMに基づく汎用検出器は、信頼性検証、説明可能性、ローカライゼーション機能を統合する。
倫理的・セキュリティ的な配慮が、重要な世界的な懸念として浮上している。
論文 参考訳(メタデータ) (2025-02-07T12:18:20Z) - YOLO-MST: Multiscale deep learning method for infrared small target detection based on super-resolution and YOLO [0.18641315013048293]
本稿では,画像超解像技術とマルチスケール観測を組み合わせた深層学習赤外線小目標検出手法を提案する。
この手法の2つの公開データセットであるSIRSTとIRISでのmAP@0.5検出率は、それぞれ96.4%と99.5%に達した。
論文 参考訳(メタデータ) (2024-12-27T18:43:56Z) - Visual Object Tracking across Diverse Data Modalities: A Review [33.006051781123595]
ビジュアルオブジェクト追跡(VOT)はコンピュータビジョンにおいて魅力的な重要な研究分野である。
まず, RGB, 熱赤外, 点雲追跡の3種類の主要な単一モードVOTについて検討した。
次に,RGB-Depth,RGB-Thermal,RGB-LiDAR,RGB-Languageの4種類のマルチモーダルVOTを要約する。
論文 参考訳(メタデータ) (2024-12-13T09:25:18Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - RGB-D And Thermal Sensor Fusion: A Systematic Literature Review [0.0]
これまでにRGB-Dと熱モダリティを融合させる体系的な評価は行われていない。
本稿では,RGB-Dとサーマルカメラデータの融合に使用される最新技術と従来手法の両面について概説する。
論文 参考訳(メタデータ) (2023-05-19T04:50:13Z) - YOLO-Drone:Airborne real-time detection of dense small objects from
high-altitude perspective [8.864582442699023]
リアルタイム物体検出アルゴリズム(YOLO-Drone)を提案し,2つの新しいUAVプラットフォームと特定の光源に適用した。
YOLO-Droneは53 FPSで、最大mAPは34.04%である。
特に、YOLO-Droneはシリコンベースの金のLEDの下で高性能で、mAPは87.71%である。
論文 参考訳(メタデータ) (2023-04-14T05:21:47Z) - YOLO v3: Visual and Real-Time Object Detection Model for Smart
Surveillance Systems(3s) [0.0]
本稿では,スマートサーベイランスシステム(Smart Surveillance Systems, 3s)と呼ばれるサイバー物理システムの物体検出モデルを提案する。
本研究は, 学習時間と計算資源を削減するため, 転送学習手法を実装した。
提案モデルの結果は, 監視映像中の物体の検出において極めて良好であった。
論文 参考訳(メタデータ) (2022-09-26T06:34:12Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Bifurcated backbone strategy for RGB-D salient object detection [168.19708737906618]
我々は、RGB-Dの高次物体検出に固有のマルチモーダル・マルチレベルの性質を活用して、新しいカスケードリファインメントネットワークを考案する。
アーキテクチャは Bifurcated Backbone Strategy Network (BBS-Net) と呼ばれ、シンプルで効率的でバックボーンに依存しない。
論文 参考訳(メタデータ) (2020-07-06T13:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。