論文の概要: YieldSAT: A Multimodal Benchmark Dataset for High-Resolution Crop Yield Prediction
- arxiv url: http://arxiv.org/abs/2604.00940v1
- Date: Wed, 01 Apr 2026 14:13:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.031189
- Title: YieldSAT: A Multimodal Benchmark Dataset for High-Resolution Crop Yield Prediction
- Title(参考訳): YieldSAT:高分解能作物収量予測のためのマルチモーダルベンチマークデータセット
- Authors: Miro Miranda, Deepak Pathak, Patrick Helber, Benjamin Bischke, Hiba Najjar, Francisco Mena, Cristhian Sanchez, Akshay Pai, Diego Arenas, Matias Valdenegro-Toro, Marcela Charfuelan, Marlon Nuske, Andreas Dengel,
- Abstract要約: 我々は,高解像度収量予測のための大規模,高品質,マルチモーダルなデータセットであるYieldSATをリリースする。
合計1220万以上の収量サンプルがあり、それぞれ空間分解能は10mである。
様々なディープラーニングモデルとデータ融合アーキテクチャを比較し,大規模かつ高解像度な収量予測を画素回帰タスクとして示す。
- 参考スコア(独自算出の注目度): 28.130996836618085
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Crop yield prediction requires substantial data to train scalable models. However, creating yield prediction datasets is constrained by high acquisition costs, heterogeneous data quality, and data privacy regulations. Consequently, existing datasets are scarce, low in quality, or limited to regional levels or single crop types, hindering the development of scalable data-driven solutions. In this work, we release YieldSAT, a large, high-quality, and multimodal dataset for high-resolution crop yield prediction. YieldSAT spans various climate zones across multiple countries, including Argentina, Brazil, Uruguay, and Germany, and includes major crop types, including corn, rapeseed, soybeans, and wheat, across 2,173 expert-curated fields. In total, over 12.2 million yield samples are available, each with a spatial resolution of 10 m. Each field is paired with multispectral satellite imagery, resulting in 113,555 labeled satellite images, complemented by auxiliary environmental data. We demonstrate the potential of large-scale and high-resolution crop yield prediction as a pixel regression task by comparing various deep learning models and data fusion architectures. Furthermore, we highlight open challenges arising from severe distribution shifts in the ground truth data under real-world conditions. To mitigate this, we explore a domain-informed Deep Ensemble approach that exhibits significant performance gains. The dataset is available at https://yieldsat.github.io/.
- Abstract(参考訳): 作物の収量予測は、スケーラブルなモデルをトレーニングするためにかなりのデータを必要とする。
しかし、収量予測データセットの作成は、高い取得コスト、不均一なデータ品質、データプライバシ規制によって制約される。
その結果、既存のデータセットは乏しく、品質が低く、あるいは地域レベルや単一の作物タイプに限定されており、スケーラブルなデータ駆動ソリューションの開発を妨げる。
本研究では,高分解能収量予測のための大規模,高品質,マルチモーダルなデータセットであるYieldSATをリリースする。
YieldSATはアルゼンチン、ブラジル、ウルグアイ、ドイツなど複数の国にまたがる様々な気候圏にまたがっており、トウモロコシ、ラピセド、大豆、小麦などの主要作物が2,173カ所の専門家によって栽培されている。
合計1220万以上の収量サンプルがあり、それぞれ空間分解能は10mである。
各フィールドはマルチスペクトル衛星画像と組み合わせられ、113,555個のラベル付き衛星画像が補助的な環境データによって補完される。
様々なディープラーニングモデルとデータ融合アーキテクチャを比較し,大規模かつ高解像度な収量予測を画素回帰タスクとして示す。
さらに,実環境下での地上真実データの分布変化によるオープンな課題も強調する。
これを軽減するために、ドメインインフォームのDeep Ensembleアプローチを検討し、大幅なパフォーマンス向上を示す。
データセットはhttps://yieldsat.github.io/で公開されている。
関連論文リスト
- FLAIR-HUB: Large-scale Multimodal Dataset for Land Cover and Crop Mapping [1.731185891042474]
FLAIR-HUBは、フランスの2528km2の高解像度(20cm)のアノテーションを持つ、最大のマルチセンサーの陸地カバーデータセットである。
航空写真、センチネル・1/2時系列、SPOT画像、地形データ、歴史的空中画像の6つの整列モードが組み合わさっている。
その結果、マルチモーダル核融合ときめ細かい分類の複雑さが示され、最も優れた土地被覆性能(精度78.2%、65.8% mIoU)がほぼ全てのモダリティを用いて達成された。
論文 参考訳(メタデータ) (2025-06-08T10:48:51Z) - OpenEarthMap-SAR: A Benchmark Synthetic Aperture Radar Dataset for Global High-Resolution Land Cover Mapping [16.387666608029882]
我々は,地球規模の高解像度土地被覆マッピングのためのベンチマークSARデータセットOpenEarthMap-SARを紹介する。
OpenEarthMap-SARは、5033の航空画像と衛星画像の150万部で構成され、サイズは1024$times$1024ピクセルで、日本、フランス、アメリカから35の地域をカバーしている。
セマンティックセグメンテーションのための最先端手法の性能評価と,さらなる技術開発に適した課題設定を提案する。
論文 参考訳(メタデータ) (2025-01-18T22:30:27Z) - EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - GeoPlant: Spatial Plant Species Prediction Dataset [4.817737198128259]
種分布モデル (SDM) は空間的特徴から空間を横断する種を予測する。
我々は空間分解能(10-50m)の高いSDMのための新しいヨーロッパ規模のデータセットを設計・開発してきた。
このデータセットは、5Mの不均一なPresence-Onlyレコードと90kの徹底的なPresence-Absenceサーベイレコードで構成されている。
論文 参考訳(メタデータ) (2024-08-25T20:09:46Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - Adaptive Fusion of Multi-view Remote Sensing data for Optimal Sub-field
Crop Yield Prediction [24.995959334158986]
本研究では,異なる作物(スギ,コムギ,ラプシード)と地域(アルジャンティナ,ウルグアイ,ドイツ)の収量を予測するための,新しい多視点学習手法を提案する。
我々の入力データには、センチネル2衛星からのマルチスペクトル光学画像と、土壌特性や地形情報などの静的特徴を補完して、作物の生育期における動的特徴として気象データが含まれている。
データを効果的に融合するために、専用ビューエンコーダとGated Unit (GU)モジュールからなるMulti-view Gated Fusion (MVGF)モデルを導入する。
MVGFモデルは10m分解能でサブフィールドレベルで訓練される
論文 参考訳(メタデータ) (2024-01-22T11:01:52Z) - Agave crop segmentation and maturity classification with deep learning
data-centric strategies using very high-resolution satellite imagery [101.18253437732933]
超高解像度衛星画像を用いたAgave tequilana Weber azul crop segmentation and mature classificationを提案する。
実世界の深層学習問題を,作物の選別という非常に具体的な文脈で解決する。
結果として得られた正確なモデルにより、大規模地域で生産予測を行うことができる。
論文 参考訳(メタデータ) (2023-03-21T03:15:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。