論文の概要: Satellite Image Classification with Deep Learning
- arxiv url: http://arxiv.org/abs/2010.06497v1
- Date: Tue, 13 Oct 2020 15:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 23:13:37.241496
- Title: Satellite Image Classification with Deep Learning
- Title(参考訳): 深層学習による衛星画像の分類
- Authors: Mark Pritt and Gary Chern
- Abstract要約: IARPA関数マップ(FMoW)データセットから対象物や施設を63のクラスに分類する深層学習システムについて述べる。
このシステムは、畳み込みニューラルネットワークと、衛星メタデータと画像特徴を統合する追加のニューラルネットワークのアンサンブルで構成されている。
執筆時点では、このシステムはfMoW TopCoderコンペティションで2位だ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Satellite imagery is important for many applications including disaster
response, law enforcement, and environmental monitoring. These applications
require the manual identification of objects and facilities in the imagery.
Because the geographic expanses to be covered are great and the analysts
available to conduct the searches are few, automation is required. Yet
traditional object detection and classification algorithms are too inaccurate
and unreliable to solve the problem. Deep learning is a family of machine
learning algorithms that have shown promise for the automation of such tasks.
It has achieved success in image understanding by means of convolutional neural
networks. In this paper we apply them to the problem of object and facility
recognition in high-resolution, multi-spectral satellite imagery. We describe a
deep learning system for classifying objects and facilities from the IARPA
Functional Map of the World (fMoW) dataset into 63 different classes. The
system consists of an ensemble of convolutional neural networks and additional
neural networks that integrate satellite metadata with image features. It is
implemented in Python using the Keras and TensorFlow deep learning libraries
and runs on a Linux server with an NVIDIA Titan X graphics card. At the time of
writing the system is in 2nd place in the fMoW TopCoder competition. Its total
accuracy is 83%, the F1 score is 0.797, and it classifies 15 of the classes
with accuracies of 95% or better.
- Abstract(参考訳): 衛星画像は災害対応、法執行、環境モニタリングなど多くの用途において重要である。
これらの応用には画像中の物体や施設の手動識別が必要である。
カバーすべき地理的拡張は素晴らしいものであり、検索を行うアナリストは少ないため、自動化が必要である。
しかし、従来のオブジェクト検出と分類アルゴリズムは、その問題を解決するには不正確で信頼できない。
ディープラーニング(deep learning)は、このようなタスクの自動化が期待できる機械学習アルゴリズムのファミリーである。
畳み込みニューラルネットワークによって画像理解に成功している。
本稿では,高解像度マルチスペクトル衛星画像における物体認識と施設認識の問題に適用する。
本稿では,世界のiarpa機能マップ(fmow)から対象と施設を63の異なるクラスに分類する深層学習システムについて述べる。
このシステムは、畳み込みニューラルネットワークと、衛星メタデータと画像特徴を統合する追加のニューラルネットワークからなる。
KerasとTensorFlowのディープラーニングライブラリを使用してPythonで実装され、NVIDIA Titan Xグラフィックカードを備えたLinuxサーバ上で動作する。
執筆時点では、このシステムはfMoW TopCoderコンペティションで2位だ。
総精度は83%、F1スコアは0.797で、95%以上の格付けを持つ15のクラスに分類される。
関連論文リスト
- Why do CNNs excel at feature extraction? A mathematical explanation [53.807657273043446]
実世界のデータセットに似た画像を生成するのに使用できる特徴抽出に基づく画像分類の新しいモデルを提案する。
本研究では,特徴の存在を検知する一方向線形関数を構築し,畳み込みネットワークで実現可能であることを示す。
論文 参考訳(メタデータ) (2023-07-03T10:41:34Z) - Detection-segmentation convolutional neural network for autonomous
vehicle perception [0.0]
物体検出とセグメンテーションは、自動運転車の認識システムの2つの中核モジュールである。
現在最もよく使われているアルゴリズムはディープニューラルネットワークに基づいており、高い効率性を保証するが、高性能なコンピューティングプラットフォームを必要とする。
ネットワークの複雑さの低減は、適切なアーキテクチャ、表現、コンピューティングプラットフォームを使用することで達成できる。
論文 参考訳(メタデータ) (2023-06-30T08:54:52Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - Hybrid Optimized Deep Convolution Neural Network based Learning Model
for Object Detection [0.0]
物体の識別はコンピュータビジョンにおける最も基本的で難しい問題の1つである。
近年,ディープラーニングに基づく物体検出技術が大衆の関心を集めている。
本研究では,自律型物体検出システムを構築するために,独自のディープラーニング分類手法を用いる。
提案するフレームワークは検出精度0.9864であり、現在の技術よりも高い。
論文 参考訳(メタデータ) (2022-03-02T04:39:37Z) - Overhead-MNIST: Machine Learning Baselines for Image Classification [0.0]
23の機械学習アルゴリズムをトレーニングし、ベースライン比較メトリクスを確立する。
Overhead-MNISTデータセットは、ユビキタスなMNISTの手書き桁に似たスタイルの衛星画像の集合である。
本稿では,エッジの展開性および今後の性能向上のためのベースラインとして,全体的な性能向上アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-07-01T13:30:39Z) - A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning [0.0]
本論文は、リアルタイム性能の良い物体検出の高精度化を目指します。
バイナライズニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな視覚タスクで高いパフォーマンスを発揮しています。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
論文 参考訳(メタデータ) (2021-01-04T06:16:52Z) - MS-RANAS: Multi-Scale Resource-Aware Neural Architecture Search [94.80212602202518]
我々は,MS-RANAS(Multi-Scale Resource-Aware Neural Architecture Search)を提案する。
我々は,検索コストの削減を図るために,ワンショットのアーキテクチャ探索手法を採用した。
我々は精度-速度トレードオフの観点から最先端の結果を得る。
論文 参考訳(メタデータ) (2020-09-29T11:56:01Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。
ベースライン上での精度と学習収束性を一貫した改善を示す。
提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文 参考訳(メタデータ) (2020-04-10T11:09:50Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z) - Ensembles of Deep Neural Networks for Action Recognition in Still Images [3.7900158137749336]
本稿では,大量のラベル付き行動認識データセットの欠如に対処するための伝達学習手法を提案する。
フレームワークには8つのトレーニング済みのCNNも使用して、Stanford 40データセットのパフォーマンスを調査しています。
我々の手法の最良の設定は、スタンフォード40データセットで93.17$%の精度を達成することができる。
論文 参考訳(メタデータ) (2020-03-22T13:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。