論文の概要: Multispectral Object Detection with Deep Learning
- arxiv url: http://arxiv.org/abs/2102.03115v1
- Date: Fri, 5 Feb 2021 11:39:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-08 14:40:45.650270
- Title: Multispectral Object Detection with Deep Learning
- Title(参考訳): 深層学習を用いたマルチスペクトル物体検出
- Authors: Md Osman Gani, Somenath Kuiry, Alaka Das, Mita Nasipuri, Nibaran Das
- Abstract要約: 本研究では,物体検出タスクにおいて,熱スペクトルとNIRスペクトルの両方を用いて撮像を行った。
我々は、マルチスペクトル画像から物体を検出するために、YOLO v3ネットワークをスクラッチからトレーニングする。
- 参考スコア(独自算出の注目度): 7.592218846348004
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Object detection in natural scenes can be a challenging task. In many
real-life situations, the visible spectrum is not suitable for traditional
computer vision tasks. Moving outside the visible spectrum range, such as the
thermal spectrum or the near-infrared (NIR) images, is much more beneficial in
low visibility conditions, NIR images are very helpful for understanding the
object's material quality. In this work, we have taken images with both the
Thermal and NIR spectrum for the object detection task. As multi-spectral data
with both Thermal and NIR is not available for the detection task, we needed to
collect data ourselves. Data collection is a time-consuming process, and we
faced many obstacles that we had to overcome. We train the YOLO v3 network from
scratch to detect an object from multi-spectral images. Also, to avoid
overfitting, we have done data augmentation and tune hyperparameters.
- Abstract(参考訳): 自然界における物体検出は難しい課題である。
多くの現実の状況では、可視スペクトルは従来のコンピュータビジョンのタスクには適さない。
熱スペクトルや近赤外(NIR)画像などの可視スペクトル範囲外の移動は、低視認性条件においてはるかに有益であり、NIR画像は物体の材料品質を理解するために非常に有用である。
本研究では,物体検出タスクのサーマルスペクトルとNIRスペクトルの両方を用いて画像撮影を行った。
検出タスクにはサーマルとNIRの両方のマルチスペクトルデータが利用できないため、自分でデータを収集する必要がありました。
データ収集は時間を要するプロセスであり、克服する必要のある多くの障害に直面しました。
YOLO v3ネットワークをゼロからトレーニングし、マルチスペクトル画像から物体を検出する。
また、過剰フィッティングを避けるために、データ拡張とハイパーパラメータのチューニングを行いました。
関連論文リスト
- BihoT: A Large-Scale Dataset and Benchmark for Hyperspectral Camouflaged Object Tracking [22.533682363532403]
我々は、ハイパースペクトルカモフラージュされた物体追跡(HCOT)と呼ばれる新しいタスクを提供する。
大規模HCOTデータセットであるBihoTは,49個のビデオシーケンスをカバーする41,912個のハイパースペクトル画像からなる。
スペクトルプロンプトベースインタラプタ・アウェアネットワーク(SPDAN)という,シンプルだが効果的なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-08-22T09:07:51Z) - Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection [20.12812979315803]
可視光(RGB)と熱赤外(IR)画像の両方を利用した物体検出が注目されている。
既存の多くのマルチモーダルオブジェクト検出手法は、RGBとIR画像をディープニューラルネットワークに直接入力する。
両モダリティから特徴を浄化・融合する新しい粗大な視点を提案する。
論文 参考訳(メタデータ) (2024-01-19T14:49:42Z) - Enhancing Low-Light Images Using Infrared-Encoded Images [81.8710581927427]
従来の芸術は、主にピクセルワイド・ロスを用いて可視光スペクトルで捉えた低照度画像に焦点を当てていた。
我々は,赤外線カットオフフィルタを除去することにより,低照度環境下で撮影された画像の可視性を高める新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T08:29:19Z) - Object Detection in Hyperspectral Image via Unified Spectral-Spatial
Feature Aggregation [55.9217962930169]
S2ADetは、高スペクトル画像に固有の豊富なスペクトル情報と空間補完情報を利用する物体検出器である。
S2ADetは既存の最先端メソッドを超え、堅牢で信頼性の高い結果を達成する。
論文 参考訳(メタデータ) (2023-06-14T09:01:50Z) - Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation [0.0]
リモートセンシングオブジェクト検出のための周波数対応特徴ピラミッドフレームワーク(FFPF)を提案する。
F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに差し込み、スペクトルコンテキスト情報を知覚するために提案される。
BSFPNは、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールの物体の特徴の関連をより良くモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-09-01T15:50:58Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Joint Learning of Salient Object Detection, Depth Estimation and Contour
Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。
具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。
実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-03-09T17:20:18Z) - NeRF-Supervision: Learning Dense Object Descriptors from Neural Radiance
Fields [54.27264716713327]
シーンのニューラル・ラジアンス・フィールド(NeRF)表現は,高密度物体記述子の訓練に利用できることを示す。
我々は、最適化されたNeRFを用いて、オブジェクトの複数のビュー間の密接な対応を抽出し、これらの対応を、オブジェクトのビュー不変表現を学習するためのトレーニングデータとして使用する。
また,本手法により教師されたディエンス対応モデルは,市販の学習ディスクリプタよりも106%優れていた。
論文 参考訳(メタデータ) (2022-03-03T18:49:57Z) - Drone Object Detection Using RGB/IR Fusion [1.5469452301122175]
本研究では,AIRSimシミュレーションエンジンとCycleGANを用いて合成赤外線画像を作成する手法を開発した。
我々は、地上での物体検出のためにRGBとIR画像の融合に照明対応の融合フレームワークを利用する。
我々のソリューションは、実際のドローン上で動作するNVIDIA Jetson Xavier上に実装されており、RGB/IRイメージペアあたり28ミリ秒の処理が必要になります。
論文 参考訳(メタデータ) (2022-01-11T05:15:59Z) - A Comparison of Deep Saliency Map Generators on Multispectral Data in
Object Detection [9.264502124445348]
本研究は, それらの地図が異なるスペクトル間でどのように異なるかについて, 3つのサリエンシマップ生成法について検討する。
現実的な問題として、我々は自律運転のための赤外線および視覚スペクトルにおける物体検出を選択した。
その結果,赤外線と視覚のアクティベーションマップの違いが判明した。
さらに、赤外線と視覚データの両方による高度なトレーニングは、ネットワークの出力を改善するだけでなく、唾液マップのより焦点を絞ったスポットにもつながります。
論文 参考訳(メタデータ) (2021-08-26T12:56:49Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。