論文の概要: Classification of Geographical Land Structure Using Convolution Neural Network and Transfer Learning
- arxiv url: http://arxiv.org/abs/2411.12415v1
- Date: Tue, 19 Nov 2024 11:01:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-20 13:36:35.724599
- Title: Classification of Geographical Land Structure Using Convolution Neural Network and Transfer Learning
- Title(参考訳): 畳み込みニューラルネットワークと伝達学習を用いた地理的土地構造の分類
- Authors: Mustafa M. Abd Zaid, Ahmed Abed Mohammed, Putra Sumari,
- Abstract要約: 本研究は, 都市計画・開発, 環境モニタリング, 災害管理など, 一連の応用を創出することができる。
本稿では、地理的な土地構造を分類するプロセスを自動化するための深層学習に基づくアプローチを開発した。
- 参考スコア(独自算出の注目度): 1.024113475677323
- License:
- Abstract: Satellite imagery has dramatically revolutionized the field of geography by giving academics, scientists, and policymakers unprecedented global access to spatial data. Manual methods typically require significant time and effort to detect the generic land structure in satellite images. This study can produce a set of applications such as urban planning and development, environmental monitoring, disaster management, etc. Therefore, the research presents a methodology to minimize human labor, reducing the expenses and duration needed to identify the land structure. This article developed a deep learning-based approach to automate the process of classifying geographical land structures. We used a satellite image dataset acquired from MLRSNet. The study compared the performance of three architectures, namely CNN, ResNet-50, and Inception-v3. We used three optimizers with any model: Adam, SGD, and RMSProp. We conduct the training process for a fixed number of epochs, specifically 100 epochs, with a batch size of 64. The ResNet-50 achieved an accuracy of 76.5% with the ADAM optimizer, the Inception-v3 with RMSProp achieved an accuracy of 93.8%, and the proposed approach, CNN with RMSProp optimizer, achieved the highest level of performance and an accuracy of 94.8%. Moreover, a thorough examination of the CNN model demonstrated its exceptional accuracy, recall, and F1 scores for all categories, confirming its resilience and dependability in precisely detecting various terrain formations. The results highlight the potential of deep learning models in scene understanding, as well as their significance in efficiently identifying and categorizing land structures from satellite imagery.
- Abstract(参考訳): 衛星画像は、学者、科学者、政策立案者たちに前例のないグローバルな空間データへのアクセスを提供することによって、地理的分野を劇的に革新させた。
手動の手法は通常、衛星画像の一般的な陸地構造を検出するのにかなりの時間と労力を要する。
本研究は, 都市計画・開発, 環境モニタリング, 災害管理など, 一連の応用を創出することができる。
そこで本研究では,人的労働力を最小化し,土地構造を特定するために必要な費用と期間を削減する手法を提案する。
本稿では、地理的な土地構造を分類するプロセスを自動化するための深層学習に基づくアプローチを開発した。
MLRSNetから取得した衛星画像データセットを用いた。
この研究は、CNN、ResNet-50、Inception-v3の3つのアーキテクチャのパフォーマンスを比較した。
我々はAdam、SGD、RMSPropの3つのオプティマイザを使った。
我々は,一定数のエポック,特に100エポックのバッチサイズ64。
ResNet-50はADAMオプティマイザで76.5%、RMSPropでInception-v3は93.8%、提案されたアプローチであるCNNは最高レベルの性能と94.8%の精度を達成した。
さらに,CNNモデルを徹底的に検討した結果,各カテゴリの高精度,リコール,F1スコアが得られた。
この結果は、シーン理解における深層学習モデルの可能性や、衛星画像から土地構造を効率的に識別・分類する上での意義を浮き彫りにした。
関連論文リスト
- Image-Based Geolocation Using Large Vision-Language Models [19.071551941682063]
画像に基づく位置情報の精度を大幅に向上する革新的なフレームワークであるToolを紹介した。
ツールは体系的なチェーン・オブ・シント(CoT)アプローチを採用し、人間のジオゲスティング戦略を模倣する。
GeoGuessrゲームの平均スコアは4550.5で85.37%で、高精度な位置情報予測を行う。
論文 参考訳(メタデータ) (2024-08-18T13:39:43Z) - Performance Analysis of Various EfficientNet Based U-Net++ Architecture
for Automatic Building Extraction from High Resolution Satellite Images [0.0]
ビルディング抽出は高解像度リモートセンシング画像のセマンティックセグメンテーションに大きく依存している。
本研究では,ネットワークバックボーンをベースとした様々なU-Net++を提案する。
実験結果によると,提案モデルは従来の最先端アプローチよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-09-05T18:14:14Z) - Deep-Learning Framework for Optimal Selection of Soil Sampling Sites [0.0]
この研究は、画像処理におけるディープラーニングの最近の進歩を活用して、フィールドの重要な特性を示す最適な位置を見つける。
本フレームワークは,自己保持機構をバックボーンとするエンコーダデコーダアーキテクチャで構築されている。
このモデルはテストデータセットにおいて、平均精度99.52%、IoU平均インターセクション57.35%、Dice Coefficient平均71.47%という驚くべき結果を得た。
論文 参考訳(メタデータ) (2023-09-02T16:19:21Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - Improving Visual Grounding by Encouraging Consistent Gradient-based
Explanations [58.442103936918805]
注意マスク整合性は,従来の方法よりも優れた視覚的グラウンドリング結果が得られることを示す。
AMCは効率的で実装が容易であり、どんな視覚言語モデルでも採用できるため一般的である。
論文 参考訳(メタデータ) (2022-06-30T17:55:12Z) - Contextualized Spatio-Temporal Contrastive Learning with
Self-Supervision [106.77639982059014]
時間的にきめ細かな表現を効果的に学習するためのConST-CLフレームワークを提案する。
まず、コンテキスト特徴によって導かれるインスタンス表現をあるビューから別のビューに変換することを学習するモデルを必要とする地域ベースの自己教師型タスクを設計する。
次に、全体的および局所的な表現の同時学習を効果的に調整するシンプルな設計を導入する。
論文 参考訳(メタデータ) (2021-12-09T19:13:41Z) - Improving Landslide Detection on SAR Data through Deep Learning [0.0]
深層学習畳み込みニューラルネットワーク(cnns)を用いて,光学画像上の地すべりマッピングと分類性能を評価する。
約8000の地震地すべりを発生させた地震前後の状況を分析した。
グラウンドレンジ検出(GRD)SARデータの組み合わせに基づくCNNは、全体の94%を超える精度に達した。
論文 参考訳(メタデータ) (2021-05-03T12:37:57Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - GANav: Group-wise Attention Network for Classifying Navigable Regions in
Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。
本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。
RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文 参考訳(メタデータ) (2021-03-07T02:16:24Z) - An Efficient Quantitative Approach for Optimizing Convolutional Neural
Networks [16.072287925319806]
本稿では,CNNアーキテクチャの品質を推定し,設計の探索プロセスを導く3D-Receptive Field (3DRF)を提案する。
我々のモデルは、MobileNetやResNetのような最先端のCNN構造と比較して、最大5.47%の精度向上と65.38%のパラメータを達成できる。
論文 参考訳(メタデータ) (2020-09-11T05:14:34Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。