論文の概要: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- arxiv url: http://arxiv.org/abs/2409.12977v1
- Date: Tue, 03 Sep 2024 04:10:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-09-30 06:31:47.480944
- Title: Surveying You Only Look Once (YOLO) Multispectral Object Detection Advancements, Applications And Challenges
- Title(参考訳): 一度だけ見る(YOLO)マルチスペクトル物体検出の進歩と応用と課題
- Authors: James E. Gallagher, Edward J. Oughton,
- Abstract要約: 本稿では,400件の論文を詳細にレビューし,マルチスペクトルイメージング技術,深層学習モデル,その応用の権威的メタレビューを提供する。
グラウンドベースの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計している。
最も一般的なセンサー融合は、赤緑色(RGB)とLWIR(Long-Wave Infrared)である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Multispectral imaging and deep learning have emerged as powerful tools supporting diverse use cases from autonomous vehicles, to agriculture, infrastructure monitoring and environmental assessment. The combination of these technologies has led to significant advancements in object detection, classification, and segmentation tasks in the non-visible light spectrum. This paper considers 400 total papers, reviewing 200 in detail to provide an authoritative meta-review of multispectral imaging technologies, deep learning models, and their applications, considering the evolution and adaptation of You Only Look Once (YOLO) methods. Ground-based collection is the most prevalent approach, totaling 63% of the papers reviewed, although uncrewed aerial systems (UAS) for YOLO-multispectral applications have doubled since 2020. The most prevalent sensor fusion is Red-Green-Blue (RGB) with Long-Wave Infrared (LWIR), comprising 39% of the literature. YOLOv5 remains the most used variant for adaption to multispectral applications, consisting of 33% of all modified YOLO models reviewed. 58% of multispectral-YOLO research is being conducted in China, with broadly similar research quality to other countries (with a mean journal impact factor of 4.45 versus 4.36 for papers not originating from Chinese institutions). Future research needs to focus on (i) developing adaptive YOLO architectures capable of handling diverse spectral inputs that do not require extensive architectural modifications, (ii) exploring methods to generate large synthetic multispectral datasets, (iii) advancing multispectral YOLO transfer learning techniques to address dataset scarcity, and (iv) innovating fusion research with other sensor types beyond RGB and LWIR.
- Abstract(参考訳): マルチスペクトルイメージングとディープラーニングは、自動運転車から農業、インフラ監視、環境評価に至るまで、多様なユースケースをサポートする強力なツールとして登場した。
これらの技術の組み合わせにより、非可視光スペクトルにおける物体の検出、分類、セグメンテーションタスクが大幅に進歩した。
本稿では,多スペクトルイメージング技術,深層学習モデル,およびそれらの応用の権威的メタレビューを,You Only Look Once(YOLO)手法の進化と適応を考慮した400の論文を詳細に検討し,200の論文を概説する。
地上からの収集は最も一般的なアプローチであり、レビューされた論文の63%を合計しているが、YOLOマルチスペクトルの無人航空システム(UAS)は2020年以来倍増している。
最も一般的なセンサー融合は、RGB(Red-Green-Blue)とLWIR(Long-Wave Infrared)であり、文献の39%を占めている。
YOLOv5は、修正された全てのYOLOモデルの33%からなる、マルチスペクトルアプリケーションへの適応に最もよく使われる変種である。
中国では、マルチスペクトル-YOLO研究の58%が実施されており、他国と大きく類似している(中国の機関から派生していない論文では、平均ジャーナルインパクト係数4.45対4.36対4.36)。
今後の研究課題
一 広範囲なアーキテクチャ変更を必要としない多様なスペクトル入力を処理できる適応型YOLOアーキテクチャを開発すること。
(II)大規模合成多スペクトルデータセットの作成方法
3 データセットの不足に対処する多スペクトルYOLO転送学習技術の進歩
(4)RGB及びLWIR以外のセンサとの融合研究の革新。
関連論文リスト
- Fault Detection for agents on power grid topology optimization: A Comprehensive analysis [1.0136215038345013]
我々は,電力グリッドシミュレーションの故障に着目し,パターンを特定し,事前に検出する。
クラスタ化によって、5つの異なるクラスタを検出し、一般的な障害タイプを特定します。
故障を事前に検出し、5種類の予測モデルを評価するためのマルチクラス予測手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T08:20:43Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - A Comprehensive Survey on Applications of Transformers for Deep Learning
Tasks [60.38369406877899]
Transformerは、シーケンシャルデータ内のコンテキスト関係を理解するために自己認識メカニズムを使用するディープニューラルネットワークである。
Transformerモデルは、入力シーケンス要素間の長い依存関係を処理し、並列処理を可能にする。
我々の調査では、トランスフォーマーベースのモデルのためのトップ5のアプリケーションドメインを特定します。
論文 参考訳(メタデータ) (2023-06-11T23:13:51Z) - RGB-D And Thermal Sensor Fusion: A Systematic Literature Review [0.0]
これまでにRGB-Dと熱モダリティを融合させる体系的な評価は行われていない。
本稿では,RGB-Dとサーマルカメラデータの融合に使用される最新技術と従来手法の両面について概説する。
論文 参考訳(メタデータ) (2023-05-19T04:50:13Z) - YOLO-Drone:Airborne real-time detection of dense small objects from
high-altitude perspective [8.864582442699023]
リアルタイム物体検出アルゴリズム(YOLO-Drone)を提案し,2つの新しいUAVプラットフォームと特定の光源に適用した。
YOLO-Droneは53 FPSで、最大mAPは34.04%である。
特に、YOLO-Droneはシリコンベースの金のLEDの下で高性能で、mAPは87.71%である。
論文 参考訳(メタデータ) (2023-04-14T05:21:47Z) - YOLO v3: Visual and Real-Time Object Detection Model for Smart
Surveillance Systems(3s) [0.0]
本稿では,スマートサーベイランスシステム(Smart Surveillance Systems, 3s)と呼ばれるサイバー物理システムの物体検出モデルを提案する。
本研究は, 学習時間と計算資源を削減するため, 転送学習手法を実装した。
提案モデルの結果は, 監視映像中の物体の検出において極めて良好であった。
論文 参考訳(メタデータ) (2022-09-26T06:34:12Z) - Inertial Hallucinations -- When Wearable Inertial Devices Start Seeing
Things [82.15959827765325]
環境支援型生活(AAL)のためのマルチモーダルセンサフュージョンの新しいアプローチを提案する。
我々は、標準マルチモーダルアプローチの2つの大きな欠点、限られた範囲のカバレッジ、信頼性の低下に対処する。
我々の新しいフレームワークは、三重項学習によるモダリティ幻覚の概念を融合させ、異なるモダリティを持つモデルを訓練し、推論時に欠落したセンサーに対処する。
論文 参考訳(メタデータ) (2022-07-14T10:04:18Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Bifurcated backbone strategy for RGB-D salient object detection [168.19708737906618]
我々は、RGB-Dの高次物体検出に固有のマルチモーダル・マルチレベルの性質を活用して、新しいカスケードリファインメントネットワークを考案する。
アーキテクチャは Bifurcated Backbone Strategy Network (BBS-Net) と呼ばれ、シンプルで効率的でバックボーンに依存しない。
論文 参考訳(メタデータ) (2020-07-06T13:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。