論文の概要: Pre-processing training data improves accuracy and generalisability of
convolutional neural network based landscape semantic segmentation
- arxiv url: http://arxiv.org/abs/2304.14625v1
- Date: Fri, 28 Apr 2023 04:38:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 15:15:34.632710
- Title: Pre-processing training data improves accuracy and generalisability of
convolutional neural network based landscape semantic segmentation
- Title(参考訳): 畳み込みニューラルネットワークを用いたランドスケープセマンティクスセグメンテーションの精度と汎用性を向上させる前処理訓練データ
- Authors: Andrew Clark, Stuart Phinn, Peter Scarth
- Abstract要約: オーストラリア,クイーンズランド州ウェット・トロピクスとアザートン・テーブルランズ上空の航空写真における土地利用土地被覆(LULC)の特徴のセマンティックセグメンテーションとCNN訓練のための様々なデータ準備方法を試行した。
これは、さまざまなトレーニングパッチ選択サンプリング戦略、パッチとバッチサイズ、データ拡張とスケーリングの試行とランキングによって実施された。
我々は、2018年のトレーニング画像上で5つのモデルを訓練し、2015年の試験画像に適用し、出力LULC分類により平均ユーザ精度0.84、生産精度0.87を達成した。
- 参考スコア(独自算出の注目度): 2.8747398859585376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we trialled different methods of data preparation for
Convolutional Neural Network (CNN) training and semantic segmentation of land
use land cover (LULC) features within aerial photography over the Wet Tropics
and Atherton Tablelands, Queensland, Australia. This was conducted through
trialling and ranking various training patch selection sampling strategies,
patch and batch sizes and data augmentations and scaling. We also compared
model accuracy through producing the LULC classification using a single pass of
a grid of patches and averaging multiple grid passes and three rotated version
of each patch. Our results showed: a stratified random sampling approach for
producing training patches improved the accuracy of classes with a smaller area
while having minimal effect on larger classes; a smaller number of larger
patches compared to a larger number of smaller patches improves model accuracy;
applying data augmentations and scaling are imperative in creating a
generalised model able to accurately classify LULC features in imagery from a
different date and sensor; and producing the output classification by averaging
multiple grids of patches and three rotated versions of each patch produced and
more accurate and aesthetic result. Combining the findings from the trials, we
fully trained five models on the 2018 training image and applied the model to
the 2015 test image with the output LULC classifications achieving an average
kappa of 0.84 user accuracy of 0.81 and producer accuracy of 0.87. This study
has demonstrated the importance of data pre-processing for developing a
generalised deep-learning model for LULC classification which can be applied to
a different date and sensor. Future research using CNN and earth observation
data should implement the findings of this study to increase LULC model
accuracy and transferability.
- Abstract(参考訳): 本稿では,オーストラリア,クイーンズランド州ウェット・トロピクスおよびアザートン・テーブルランズ上空の航空写真における,畳み込みニューラルネットワーク(CNN)訓練と土地利用土地被覆(LULC)特徴のセマンティックセマンティックセグメンテーションのための様々なデータ準備方法を試行した。
これは、さまざまなトレーニングパッチ選択サンプリング戦略、パッチとバッチサイズ、データ拡張とスケーリングの試行とランキングによって実施された。
また,各パッチの1回のパスでlulc分類を行い,複数のグリッドパスを平均し,各パッチの3つの回転バージョンを平均化することにより,モデルの精度を比較した。
Our results showed: a stratified random sampling approach for producing training patches improved the accuracy of classes with a smaller area while having minimal effect on larger classes; a smaller number of larger patches compared to a larger number of smaller patches improves model accuracy; applying data augmentations and scaling are imperative in creating a generalised model able to accurately classify LULC features in imagery from a different date and sensor; and producing the output classification by averaging multiple grids of patches and three rotated versions of each patch produced and more accurate and aesthetic result.
実験の結果を組み合わせることで,2018年トレーニング画像の5モデルを完全にトレーニングし,2015年テスト画像に適用し,出力lulc分類を平均0.14ユーザ精度0.81,生成精度0.87とした。
本研究では,異なる日時センサに適用可能なlulc分類のための汎用的ディープラーニングモデルの開発において,データの事前処理の重要性を実証した。
CNNと地球観測データを用いた今後の研究は、LULCモデルの精度と転送性を高めるために、本研究の成果を実装すべきである。
関連論文リスト
- Test-time adaptation for geospatial point cloud semantic segmentation with distinct domain shifts [6.80671668491958]
テスト時間適応(TTA)は、ソースデータへのアクセスや追加のトレーニングなしに、推論段階でラベル付けされていないデータに事前訓練されたモデルの直接適応を可能にする。
本稿では,3つの領域シフトパラダイムを提案する。光グラムから空気中LiDAR,空気中LiDAR,合成-移動レーザー走査である。
実験の結果,分類精度は最大20%mIoUに向上し,他の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-08T15:40:28Z) - Geometric Data Augmentations to Mitigate Distribution Shifts in Pollen
Classification from Microscopic Images [4.545340728210854]
我々は、幾何学的特徴が正確な花粉の同定に非常に重要であるというドメイン知識を活用している。
本稿では,列車におけるモデル性能とテストデータセットとの精度ギャップを著しく狭めるために,新しい2つの幾何画像拡張手法を提案する。
論文 参考訳(メタデータ) (2023-11-18T10:35:18Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Neural Priming for Sample-Efficient Adaptation [92.14357804106787]
ニューラルプライミング(Neural Priming)は、大規模な事前学習されたモデルを分散シフトや下流タスクに適応させる手法である。
ニューラルプライミングは、LAION-2Bほどの大きさの事前訓練であっても、テスト時に行うことができる。
論文 参考訳(メタデータ) (2023-06-16T21:53:16Z) - Leveraging Angular Information Between Feature and Classifier for
Long-tailed Learning: A Prediction Reformulation Approach [90.77858044524544]
分類器の重みを再バランスすることなく、包含角度で認識確率を再構成する。
予測形式再構成の性能向上に着想を得て, この角度予測の異なる特性について検討する。
CIFAR10/100-LT と ImageNet-LT を事前学習することなく、ピアメソッド間で最高の性能を得ることができる。
論文 参考訳(メタデータ) (2022-12-03T07:52:48Z) - Scaling Laws for the Few-Shot Adaptation of Pre-trained Image
Classifiers [11.408339220607251]
ニューラルネットワークのスケーリング法則の実証科学は、機械学習の未来にとって重要な領域として急速に成長している。
我々の主な目的は、事前学習データの量が標準画像分類器の少数ショット一般化性能にどのように影響するかを検討することである。
論文 参考訳(メタデータ) (2021-10-13T19:07:01Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - Fast-Convergent Federated Learning [82.32029953209542]
フェデレーション学習は、モバイルデバイスの現代的なネットワークを介して機械学習タスクを分散するための、有望なソリューションである。
本稿では,FOLBと呼ばれる高速収束型フェデレーション学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-26T14:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。