論文の概要: Evaluating the Role of Training Data Origin for Country-Scale Cropland Mapping in Data-Scarce Regions: A Case Study of Nigeria
- arxiv url: http://arxiv.org/abs/2312.10872v2
- Date: Sun, 13 Jul 2025 08:05:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:20.85522
- Title: Evaluating the Role of Training Data Origin for Country-Scale Cropland Mapping in Data-Scarce Regions: A Case Study of Nigeria
- Title(参考訳): データスカース地域における農地地図作成における訓練データ源の役割評価 : ナイジェリアを事例として
- Authors: Joaquin Gajardo, Michele Volpi, Daniel Onwude, Thijs Defraeye,
- Abstract要約: 重要な課題は、トレーニングデータの量、品質、およびターゲット領域への近接がモデルの性能にどのように影響するかを理解することである。
ナイジェリアでは、全国をカバーする1,827のラベル付きサンプルとGeowikiデータセットのサブセットを用いて、これを評価した。
その結果,局所データにより精度が0.246 (RF) と0.178 (LSTM) に向上した。
- 参考スコア(独自算出の注目度): 0.6249768559720122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cropland maps are essential for remote sensing-based agricultural monitoring, providing timely insights without extensive field surveys. Machine learning enables large-scale mapping but depends on geo-referenced ground-truth data, which is costly to collect, motivating the use of global datasets in data-scarce regions. A key challenge is understanding how the quantity, quality, and proximity of the training data to the target region influences model performance. We evaluate this in Nigeria, using 1,827 manually labelled samples covering the whole country, and subsets of the Geowiki dataset: Nigeria-only, regional (Nigeria and neighbouring countries), and global. We extract pixel-wise multi-source time series arrays from Sentinel-1, Sentinel-2, ERA5 climate, and a digital elevation model using Google Earth Engine, comparing Random Forests with LSTMs, including a lightweight multi-headed LSTM variant. Results show local data significantly boosts performance, with accuracy gains up to 0.246 (RF) and 0.178 (LSTM). Nigeria-only or regional data outperformed global data despite the lower amount of labels, with the exception of the multi-headed LSTM, which benefited from global data when local samples were absent. Sentinel-1, climate, and topographic data are critical data sources, with their removal reducing F1-score by up to 0.593. Addressing class imbalance also improved LSTM accuracy by up to 0.071. Our top-performing model (Nigeria-only LSTM) achieved an F1-score of 0.814 and accuracy of 0.842, matching the best global land cover product while offering stronger recall, critical for food security. We release code, data, maps, and an interactive web app to support future work.
- Abstract(参考訳): 作物地図はリモートセンシングに基づく農業モニタリングに不可欠であり、広範囲のフィールドサーベイなしでタイムリーな洞察を提供する。
機械学習は大規模なマッピングを可能にするが、地理的に参照された地上データに依存している。
重要な課題は、トレーニングデータの量、品質、およびターゲット領域への近接がモデルの性能にどのように影響するかを理解することである。
ナイジェリアでは1,827個の手動ラベル付きサンプルとGeowikiデータセットのサブセット(ナイジェリアのみ、地域(ナイジェリアと近隣諸国)、グローバル)を用いてこれを評価した。
我々は,Sentinel-1,Sentinel-2,ERA5気候から画素単位のマルチソース時系列配列を抽出し,Google Earth Engineを用いてRandom ForestsとLSTMを比較した。
その結果,局所データの精度は0.246 (RF) と0.178 (LSTM) に向上した。
ナイジェリアのみのデータや地域データは、ラベル数が少ないにもかかわらず、グローバルデータよりも優れており、ローカルサンプルが欠落した際のグローバルデータから恩恵を受けたマルチヘッドLSTMは例外である。
センチネル-1、気候、地形データは重要なデータ源であり、その除去によりF1スコアは0.593まで減少する。
対応クラス不均衡はLSTMの精度を最大0.071まで改善した。
我々のトップパフォーマンスモデル(Nigeria-only LSTM)はF1スコア0.814、精度0.842を達成し、世界最高の土地被覆製品に匹敵する一方で、食品の安全性に重要なリコールを提供する。
コード、データ、マップ、そして将来の作業をサポートするインタラクティブなWebアプリをリリースします。
関連論文リスト
- WorldPM: Scaling Human Preference Modeling [130.23230492612214]
我々は、このスケーリングの可能性を強調するために、World Preference Modeling$ (WorldPM)を提案する。
多様なユーザコミュニティをカバーする公開フォーラムから選好データを収集する。
1.5Bから72Bパラメータの範囲で15Mスケールのデータを用いて広範囲なトレーニングを行う。
論文 参考訳(メタデータ) (2025-05-15T17:38:37Z) - EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - Local vs. Global: Local Land-Use and Land-Cover Models Deliver Higher Quality Maps [3.606726772030176]
2023年、アフリカの人口の58.0%が深刻な食料不安全を経験し、21.6%が深刻な食料不安全に直面した。
本研究では,多様なデータソースを用いて局所的な土地被覆地図を作成する教師学生モデル構成によるデータ中心型フレームワークを提案する。
我々のフレームワークは、F1スコアで0.14、Intersection-over-Unionで0.21の改善とともに、最高のグローバルモデルよりも高品質なマップを実現した。
論文 参考訳(メタデータ) (2024-12-01T11:48:58Z) - Contrasting local and global modeling with machine learning and satellite data: A case study estimating tree canopy height in African savannas [23.868986217962373]
ローカルに収集したデータだけで訓練された小さなモデルは、グローバルTCHマップよりも優れています。
局所モデリングパラダイムとグローバルモデリングパラダイムの対立点と相乗効果の特定を行う。
論文 参考訳(メタデータ) (2024-11-21T17:53:27Z) - Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation [12.039406240082515]
Fields of The World (FTW)は、農業分野のインスタンスセグメンテーションのための新しいベンチマークデータセットである。
FTWは70,462個のサンプルを持つ以前のデータセットよりも桁違いに大きい。
FTWで訓練されたモデルは、留保国において、ゼロショットと微調整性能が向上していることを示す。
論文 参考訳(メタデータ) (2024-09-24T17:20:58Z) - Regional biases in image geolocation estimation: a case study with the SenseCity Africa dataset [0.0]
我々は,アフリカ大陸(SCA100)から得られた画像のクラウドソースデータセットに対して,最先端の画像位置推定モデル(ISNs)を適用した。
欧米の高所得国では,ISNsモデルでは画像位置を過大に予測する傾向がみられた。
この結果から,IM2GPS3kを画像位置情報推定のトレーニングセットおよびベンチマークとして用いると,アフリカにおける潜在的な応用を見落としてしまうことが示唆された。
論文 参考訳(メタデータ) (2024-04-03T08:27:24Z) - Recognize Any Regions [55.76437190434433]
RegionSpotは、ローカライゼーション基盤モデルから位置認識ローカライゼーション知識と、ViLモデルからのセマンティック情報を統合する。
オープンワールドオブジェクト認識の実験では、私たちのRereaSpotは、以前の代替よりも大きなパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - HarvestNet: A Dataset for Detecting Smallholder Farming Activity Using
Harvest Piles and Remote Sensing [50.4506590177605]
HarvestNetは、2020-2023年のエチオピアのティグレイとアムハラの農場の存在をマッピングするためのデータセットである。
本研究は,多くの小作システムの特徴ある収穫杭の検出に基づく新しい手法を提案する。
本研究は, 農作物のリモートセンシングが, 食品の安全地帯において, よりタイムリーかつ正確な農地評価に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-08-23T11:03:28Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - The Canadian Cropland Dataset: A New Land Cover Dataset for
Multitemporal Deep Learning Classification in Agriculture [0.8602553195689513]
カナディアン・クロップ・インベントリー (Canadian Annual Crop Inventory) から回収されたラベルで濃縮されたカナダの作物の時間的パッチベースのデータセット。
このデータセットは、4年間にわたって収集された10種類の作物から,78,536個の高解像度空間像を手作業で検証した。
ベンチマークとして,単一画像(ResNet,DenseNet,EfficientNet)や画像列(LRCN,3D-CNN)を同一位置から予測可能なモデルとソースコードを提供する。
論文 参考訳(メタデータ) (2023-05-31T18:40:15Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - DYNAFED: Tackling Client Data Heterogeneity with Global Dynamics [60.60173139258481]
非イド分散データに対する局所訓練は、偏向局所最適化をもたらす。
自然な解決策は、サーバがデータ分散全体のグローバルなビューを持つように、すべてのクライアントデータをサーバに収集することです。
本稿では,データプライバシを損なうことなく,サーバ上でのグローバルな知識の収集と活用を図る。
論文 参考訳(メタデータ) (2022-11-20T06:13:06Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Strict baselines for Covid-19 forecasting and ML perspective for USA and
Russia [105.54048699217668]
Covid-19は、2年間にわたって蓄積されたデータセットを収集し、予測分析に使用できるようにする。
本研究は、米国とロシアの2カ国の地域データに基づいて、Covid-19の拡散のダイナミクスを予測するための様々な種類の方法に関する一貫した研究結果である。
論文 参考訳(メタデータ) (2022-07-15T18:21:36Z) - Using Machine Learning to generate an open-access cropland map from
satellite images time series in the Indian Himalayan Region [0.28675177318965034]
我々は,Sentinel-2衛星画像時系列に依存するMLパイプラインを開発した。
ヒマハル・プラデーシュの3つの地区で14,600 km2の農地マップを作成し、既存の公共地図の解像度と品質を改善した。
論文 参考訳(メタデータ) (2022-03-28T12:08:06Z) - Jalisco's multiclass land cover analysis and classification using a
novel lightweight convnet with real-world multispectral and relief data [51.715517570634994]
本稿では、LC分類と解析を行うために、新しい軽量(89kパラメータのみ)畳み込みニューラルネットワーク(ConvNet)を提案する。
本研究では,実世界のオープンデータソースを3つ組み合わせて13のチャネルを得る。
組込み分析は、いくつかのクラスにおいて限られたパフォーマンスを期待し、最も類似したクラスをグループ化する機会を与えてくれます。
論文 参考訳(メタデータ) (2022-01-26T14:58:51Z) - Continental-Scale Building Detection from High Resolution Satellite
Imagery [5.56205296867374]
アーキテクチャ,損失関数,正規化,事前学習,自己学習,後処理のバリエーションについて検討し,インスタンスセグメンテーション性能を向上する。
アフリカ全土の100万枚の衛星画像のデータセットを用いて、手動でラベル付けされた建築事例を含む実験が行われた。
本稿では,このモデルを用いた建物検出の性能向上のための新しい手法について報告する。
論文 参考訳(メタデータ) (2021-07-26T15:48:14Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。