論文の概要: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- arxiv url: http://arxiv.org/abs/2409.12977v1
- Date: Tue, 3 Sep 2024 04:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 12:36:59.667919
- Title: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- Title(参考訳): 一度だけ見る(YOLO)マルチスペクトル物体検出の進歩と応用と課題
- Authors: James E. Gallagher, Edward J. Oughton,
- Abstract要約: 本稿では,400件の論文を詳細にレビューし,マルチスペクトルイメージング技術,深層学習モデル,その応用の権威的メタレビューを提供する。
グラウンドベースの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計している。
最も一般的なセンサー融合は、赤緑色(RGB)とLWIR(Long-Wave Infrared)である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multispectral imaging and deep learning have emerged as powerful tools supporting diverse use cases from autonomous vehicles, to agriculture, infrastructure monitoring and environmental assessment. The combination of these technologies has led to significant advancements in object detection, classification, and segmentation tasks in the non-visible light spectrum. This paper considers 400 total papers, reviewing 200 in detail to provide an authoritative meta-review of multispectral imaging technologies, deep learning models, and their applications, considering the evolution and adaptation of You Only Look Once (YOLO) methods. Ground-based collection is the most prevalent approach, totaling 63% of the papers reviewed, although uncrewed aerial systems (UAS) for YOLO-multispectral applications have doubled since 2020. The most prevalent sensor fusion is Red-Green-Blue (RGB) with Long-Wave Infrared (LWIR), comprising 39% of the literature. YOLOv5 remains the most used variant for adaption to multispectral applications, consisting of 33% of all modified YOLO models reviewed. 58% of multispectral-YOLO research is being conducted in China, with broadly similar research quality to other countries (with a mean journal impact factor of 4.45 versus 4.36 for papers not originating from Chinese institutions). Future research needs to focus on (i) developing adaptive YOLO architectures capable of handling diverse spectral inputs that do not require extensive architectural modifications, (ii) exploring methods to generate large synthetic multispectral datasets, (iii) advancing multispectral YOLO transfer learning techniques to address dataset scarcity, and (iv) innovating fusion research with other sensor types beyond RGB and LWIR.
- Abstract(参考訳): マルチスペクトルイメージングとディープラーニングは、自動運転車から農業、インフラ監視、環境評価に至るまで、多様なユースケースをサポートする強力なツールとして登場した。
これらの技術の組み合わせにより、非可視光スペクトルにおける物体の検出、分類、セグメンテーションタスクが大幅に進歩した。
本稿では,多スペクトルイメージング技術,深層学習モデル,およびそれらの応用の権威的メタレビューを,You Only Look Once(YOLO)手法の進化と適応を考慮した400の論文を詳細に検討し,200の論文を概説する。
地上からの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計しているが、YOLOマルチスペクトルの無人航空システム(UAS)は2020年以来倍増している。
最も一般的なセンサー融合は、RGB(Red-Green-Blue)とLWIR(Long-Wave Infrared)であり、文献の39%を占めている。
YOLOv5は、修正された全てのYOLOモデルの33%からなる、マルチスペクトルアプリケーションへの適応に最もよく使われる変種である。
中国では、マルチスペクトル-YOLO研究の58%が実施されており、他国と大きく類似している(中国の機関から派生していない論文では、平均ジャーナルインパクト係数4.45対4.36対4.36)。
今後の研究課題
一 広範囲なアーキテクチャ変更を必要としない多様なスペクトル入力を処理できる適応型YOLOアーキテクチャを開発すること。
(II)大規模合成多スペクトルデータセットの作成方法
3 データセットの不足に対処する多スペクトルYOLO転送学習技術の進歩
(4)RGB及びLWIR以外のセンサとの融合研究の革新。
関連論文リスト
- MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
このデータセットには、スキーマ図、シミュレーション画像、マクロ/顕微鏡写真、実験的可視化などの図が含まれている。
我々は,6つのプロプライエタリモデルと10以上のオープンソースモデルを評価し,科学的フィギュアキャプションと複数選択質問のベンチマークを開発した。
データセットとベンチマークは、さらなる研究をサポートするためにリリースされる予定だ。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - A Comprehensive Survey on Applications of Transformers for Deep Learning
Tasks [60.38369406877899]
Transformerは、シーケンシャルデータ内のコンテキスト関係を理解するために自己認識メカニズムを使用するディープニューラルネットワークである。
Transformerモデルは、入力シーケンス要素間の長い依存関係を処理し、並列処理を可能にする。
我々の調査では、トランスフォーマーベースのモデルのためのトップ5のアプリケーションドメインを特定します。
論文 参考訳(メタデータ) (2023-06-11T23:13:51Z) - RGB-D And Thermal Sensor Fusion: A Systematic Literature Review [0.0]
これまでにRGB-Dと熱モダリティを融合させる体系的な評価は行われていない。
本稿では,RGB-Dとサーマルカメラデータの融合に使用される最新技術と従来手法の両面について概説する。
論文 参考訳(メタデータ) (2023-05-19T04:50:13Z) - YOLO-Drone:Airborne real-time detection of dense small objects from
high-altitude perspective [8.864582442699023]
リアルタイム物体検出アルゴリズム(YOLO-Drone)を提案し,2つの新しいUAVプラットフォームと特定の光源に適用した。
YOLO-Droneは53 FPSで、最大mAPは34.04%である。
特に、YOLO-Droneはシリコンベースの金のLEDの下で高性能で、mAPは87.71%である。
論文 参考訳(メタデータ) (2023-04-14T05:21:47Z) - YOLO v3: Visual and Real-Time Object Detection Model for Smart
Surveillance Systems(3s) [0.0]
本稿では,スマートサーベイランスシステム(Smart Surveillance Systems, 3s)と呼ばれるサイバー物理システムの物体検出モデルを提案する。
本研究は, 学習時間と計算資源を削減するため, 転送学習手法を実装した。
提案モデルの結果は, 監視映像中の物体の検出において極めて良好であった。
論文 参考訳(メタデータ) (2022-09-26T06:34:12Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Bifurcated backbone strategy for RGB-D salient object detection [168.19708737906618]
我々は、RGB-Dの高次物体検出に固有のマルチモーダル・マルチレベルの性質を活用して、新しいカスケードリファインメントネットワークを考案する。
アーキテクチャは Bifurcated Backbone Strategy Network (BBS-Net) と呼ばれ、シンプルで効率的でバックボーンに依存しない。
論文 参考訳(メタデータ) (2020-07-06T13:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。