論文の概要: Adaptive Fusion of Multi-view Remote Sensing data for Optimal Sub-field
Crop Yield Prediction
- arxiv url: http://arxiv.org/abs/2401.11844v1
- Date: Mon, 22 Jan 2024 11:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 14:37:13.182412
- Title: Adaptive Fusion of Multi-view Remote Sensing data for Optimal Sub-field
Crop Yield Prediction
- Title(参考訳): 最適サブフィールド作物収量予測のための多視点リモートセンシングデータの適応融合
- Authors: Francisco Mena, Deepak Pathak, Hiba Najjar, Cristhian Sanchez, Patrick
Helber, Benjamin Bischke, Peter Habelitz, Miro Miranda, Jayanth Siddamsetty,
Marlon Nuske, Marcela Charfuelan, Diego Arenas, Michaela Vollmer, Andreas
Dengel
- Abstract要約: 本研究では,異なる作物(スギ,コムギ,ラプシード)と地域(アルジャンティナ,ウルグアイ,ドイツ)の収量を予測するための,新しい多視点学習手法を提案する。
我々の入力データには、センチネル2衛星からのマルチスペクトル光学画像と、土壌特性や地形情報などの静的特徴を補完して、作物の生育期における動的特徴として気象データが含まれている。
データを効果的に融合するために、専用ビューエンコーダとGated Unit (GU)モジュールからなるMulti-view Gated Fusion (MVGF)モデルを導入する。
MVGFモデルは10m分解能でサブフィールドレベルで訓練される
- 参考スコア(独自算出の注目度): 24.995959334158986
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate crop yield prediction is of utmost importance for informed
decision-making in agriculture, aiding farmers, and industry stakeholders.
However, this task is complex and depends on multiple factors, such as
environmental conditions, soil properties, and management practices. Combining
heterogeneous data views poses a fusion challenge, like identifying the
view-specific contribution to the predictive task. We present a novel
multi-view learning approach to predict crop yield for different crops
(soybean, wheat, rapeseed) and regions (Argentina, Uruguay, and Germany). Our
multi-view input data includes multi-spectral optical images from Sentinel-2
satellites and weather data as dynamic features during the crop growing season,
complemented by static features like soil properties and topographic
information. To effectively fuse the data, we introduce a Multi-view Gated
Fusion (MVGF) model, comprising dedicated view-encoders and a Gated Unit (GU)
module. The view-encoders handle the heterogeneity of data sources with varying
temporal resolutions by learning a view-specific representation. These
representations are adaptively fused via a weighted sum. The fusion weights are
computed for each sample by the GU using a concatenation of the
view-representations. The MVGF model is trained at sub-field level with 10 m
resolution pixels. Our evaluations show that the MVGF outperforms conventional
models on the same task, achieving the best results by incorporating all the
data sources, unlike the usual fusion results in the literature. For Argentina,
the MVGF model achieves an R2 value of 0.68 at sub-field yield prediction,
while at field level evaluation (comparing field averages), it reaches around
0.80 across different countries. The GU module learned different weights based
on the country and crop-type, aligning with the variable significance of each
data source to the prediction task.
- Abstract(参考訳): 正確な収穫予測は農業における情報的意思決定、農業支援、産業利害関係者にとって最も重要である。
しかし, この課題は複雑であり, 環境条件, 土壌特性, 管理実践など, 様々な要因に依存している。
不均一なデータビューを組み合わせることは、予測タスクに対するビュー固有の貢献を特定するなど、融合の課題となる。
本稿では,異なる作物(豆,小麦,ナマメ)と地域(アルジェンティーナ,ウルグアイ,ドイツ)の収量を予測するための,新しい多視点学習手法を提案する。
多視点入力データには,センチネル-2衛星からのマルチスペクトル光学画像と,土壌特性や地形情報などの静的特徴を補完する作物生育期における気象データが含まれている。
データを効果的に融合するために、専用ビューエンコーダとGated Unit (GU)モジュールからなるMulti-view Gated Fusion (MVGF)モデルを導入する。
ビューエンコーダは、ビュー固有の表現を学習することにより、時間分解能の異なるデータソースの不均一性を処理する。
これらの表現は重み付き和によって適応的に融合される。
融合重量は、ビュー表現の連結を用いてGUによって各サンプルに対して計算される。
MVGFモデルは10m解像度のサブフィールドレベルで訓練される。
評価の結果、MVGFは従来のモデルよりも優れており、文献における通常の融合結果と異なり、全てのデータソースを組み込むことで最良の結果が得られることがわかった。
アルゼンチンでは、MVGFモデルはサブフィールド収率予測において0.68のR2値を達成する一方、フィールドレベルの評価(フィールド平均)では、異なる国で約0.80に達する。
GUモジュールは、各データソースの変動的重要性と予測タスクとを一致させて、国と作物タイプに基づいて異なる重みを学習した。
関連論文リスト
- Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation [12.039406240082515]
Fields of The World (FTW)は、農業分野のインスタンスセグメンテーションのための新しいベンチマークデータセットである。
FTWは70,462個のサンプルを持つ以前のデータセットよりも桁違いに大きい。
FTWで訓練されたモデルは、留保国において、ゼロショットと微調整性能が向上していることを示す。
論文 参考訳(メタデータ) (2024-09-24T17:20:58Z) - FissionVAE: Federated Non-IID Image Generation with Latent Space and Decoder Decomposition [9.059664504170287]
フェデレートされた学習により、分散化されたクライアントは、すべてのトレーニングデータをローカルに保ちながら、共有モデルを共同で学習することができる。
本稿では、潜在空間を分解し、個々のクライアントグループに適したデコーダブランチを構成する新しいアプローチFissionVAEを紹介する。
アプローチを評価するために,MNISTとFashionMNISTを組み合わせた2つの複合データセットを作成した。
論文 参考訳(メタデータ) (2024-08-30T08:22:30Z) - A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Local Manifold Augmentation for Multiview Semantic Consistency [40.28906509638541]
本稿では、データセットから基礎となるデータバリエーションを抽出し、局所多様体拡張(LMA)と呼ばれる新しい拡張演算子を構築することを提案する。
LMAは、無限の数のデータビューを作成し、セマンティクスを保持し、オブジェクトのポーズ、視点、照明条件、背景などの複雑なバリエーションをシミュレートする能力を示している。
論文 参考訳(メタデータ) (2022-11-05T02:00:13Z) - MuRAG: Multimodal Retrieval-Augmented Generator for Open Question
Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。
MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。
以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10~20%精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-06T13:58:03Z) - Aggregated Multi-output Gaussian Processes with Knowledge Transfer
Across Domains [39.25639417233822]
本稿では,各粒度の集合データセットを用いて属性の関数を推論する多出力ガウス過程(MoGP)モデルを提案する。
実験により,提案手法は実世界のデータセットの粗粒度データを精錬する作業において優れていた。
論文 参考訳(メタデータ) (2022-06-24T08:07:20Z) - ViTAEv2: Vision Transformer Advanced by Exploring Inductive Bias for
Image Recognition and Beyond [76.35955924137986]
我々は、内在性IBを畳み込み、すなわちViTAEから探索するビジョントランスフォーマーを提案する。
ViTAEはいくつかの空間ピラミッド縮小モジュールを備えており、入力イメージをリッチなマルチスケールコンテキストでトークンに埋め込む。
我々は、ImageNet検証セット上で88.5%のTop-1分類精度と、ImageNet実検証セット上で最高の91.2%のTop-1分類精度を得る。
論文 参考訳(メタデータ) (2022-02-21T10:40:05Z) - Meta-Learning for Few-Shot Land Cover Classification [3.8529010979482123]
分類タスクとセグメンテーションタスクにおけるモデル非依存メタラーニング(MAML)アルゴリズムの評価を行った。
数発のモデル適応は,正規勾配降下による事前学習よりも優れていた。
これは、メタラーニングによるモデル最適化が地球科学におけるタスクの恩恵をもたらすことを示唆している。
論文 参考訳(メタデータ) (2020-04-28T09:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。