Fugu-MT 論文翻訳(概要): On the Generalizability of Foundation Models for Crop Type Mapping

論文の概要: On the Generalizability of Foundation Models for Crop Type Mapping

arxiv url: http://arxiv.org/abs/2409.09451v3
Date: Thu, 24 Apr 2025 02:55:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-25 21:09:46.378963
Title: On the Generalizability of Foundation Models for Crop Type Mapping
Title（参考訳）: 作物型マッピングのための基礎モデルの一般化可能性について
Authors: Yi-Chia Chang, Adam J. Stewart, Favyen Bastani, Piper Wolters, Shreya Kannan, George R. Huber, Jingtong Wang, Arindam Banerjee,
Abstract要約: 自己教師付き学習を用いて事前訓練された基礎モデルは、強力な伝達学習能力を示している。本研究は,農業領域におけるEOファンデーションモデルによる新しい地域への移転能力について考察する。
参考スコア（独自算出の注目度）: 8.346555291145767
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Foundation models pre-trained using self-supervised learning have shown powerful transfer learning capabilities on various downstream tasks, including language understanding, text generation, and image recognition. The Earth observation (EO) field has produced several foundation models pre-trained directly on multispectral satellite imagery for applications like precision agriculture, wildfire and drought monitoring, and natural disaster response. However, few studies have investigated the ability of these models to generalize to new geographic locations, and potential concerns of geospatial bias -- models trained on data-rich developed nations not transferring well to data-scarce developing nations -- remain. We investigate the ability of popular EO foundation models to transfer to new geographic regions in the agricultural domain, where differences in farming practices and class imbalance make transfer learning particularly challenging. We first select five crop classification datasets across five continents, normalizing for dataset size and harmonizing classes to focus on four major cereal grains: maize, soybean, rice, and wheat. We then compare three popular foundation models, pre-trained on SSL4EO-S12, SatlasPretrain, and ImageNet, using in-distribution (ID) and out-of-distribution (OOD) evaluation. Experiments show that pre-trained weights designed explicitly for Sentinel-2, such as SSL4EO-S12, outperform general pre-trained weights like ImageNet. Furthermore, while only 100 labeled images are sufficient for achieving high overall accuracy, 900 images are required to achieve high average accuracy due to class imbalance. All harmonized datasets and experimental code are open-source and available for download.
Abstract（参考訳）: 自己教師付き学習を用いて事前訓練された基礎モデルは、言語理解、テキスト生成、画像認識など、様々な下流タスクにおいて強力な伝達学習能力を示す。地球観測(EO)分野は、精密農業、山火事および干ばつモニタリング、自然災害対応などの用途のために、マルチスペクトル衛星画像に直接事前訓練されたいくつかの基礎モデルを作成している。しかし、これらのモデルが新しい地理的な場所に一般化する能力について研究する研究はほとんどなく、データ豊富な先進国で訓練されたモデルがデータに富む先進国にうまく移行しないという、地理空間バイアスの潜在的な懸念が残っている。本研究では,農業の実践と階級不均衡の違いが転校学習を特に困難にしている農業領域において,人気のあるEOファンデーションモデルが新たな地域への転校を行う能力について検討する。まず,5大陸にまたがる5つの作物分類データセットを選択し,大豆,大豆,米,小麦の4大穀物に焦点をあてた。次に、SSL4EO-S12、SatlasPretrain、ImageNetで事前トレーニングされた3つの一般的な基礎モデルを、In-distribution (ID) とout-of-distriion (OOD) 評価を用いて比較する。実験の結果、SSL4EO-S12のようなSentinel-2用に明示的に設計された事前訓練重量は、ImageNetのような一般的な事前訓練重量よりも優れていた。さらに,クラス不均衡による平均精度向上には,100個のラベル付き画像が十分であるのに対し,900個の画像が必須である。調和したデータセットと実験コードはすべてオープンソースで、ダウンロード可能である。

関連論文リスト

TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。 TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文参考訳（メタデータ） (2025-06-06T17:59:50Z)
Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。 EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文参考訳（メタデータ） (2025-04-09T15:13:26Z)
Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。 CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文参考訳（メタデータ） (2024-07-29T18:00:10Z)
Comparison of self-supervised in-domain and supervised out-domain transfer learning for bird species recognition [0.19183348587701113]
別のタスクを支援するために事前訓練されたモデルの重みを移すことは、現代のディープラーニングの重要な部分となっている。本実験は,鳥種認識のためのドメイン内モデルとデータセットの有用性を実証するものである。
論文参考訳（メタデータ） (2024-04-26T08:47:28Z)
Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-02-22T12:55:01Z)
Foundation Models for Generalist Geospatial Artificial Intelligence [3.7002058945990415]
本稿では,大規模データに基づく基礎モデルの事前学習と微調整を効果的に行うための第1種フレームワークを提案する。我々はこの枠組みを利用して、マルチスペクトル衛星画像の1TB以上を事前トレーニングしたトランスフォーマーベースの基礎モデルであるPrithviを開発した。
論文参考訳（メタデータ） (2023-10-28T10:19:55Z)
On the Connection between Pre-training Data Diversity and Fine-tuning Robustness [66.30369048726145]
下流の有効ロバスト性に影響を与える主な要因はデータ量である。各種自然および合成データソースから抽出した事前学習分布について,本研究の成果を示す。
論文参考訳（メタデータ） (2023-07-24T05:36:19Z)
CSP: Self-Supervised Contrastive Spatial Pre-Training for Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。 CSPは、様々なラベル付きトレーニングデータサンプリング比と10～34%の相対的な改善で、モデル性能を大幅に向上させる。
論文参考訳（メタデータ） (2023-05-01T23:11:18Z)
The effectiveness of MAE pre-pretraining for billion-scale pretraining [65.98338857597935]
モデルの初期化には自己教師付きMAE技術を用いる。画像分類, 映像認識, 物体検出, ローショット分類, ゼロショット認識にまたがる10種類の視覚的タスクに対して, 事前学習の有効性を評価する。
論文参考訳（メタデータ） (2023-03-23T17:56:12Z)
LiT Tuned Models for Efficient Species Detection [22.3395465641384]
本稿では,任意の微細な画像分類データセットを分散視覚言語事前学習に適用するための簡単な手法を提案する。 iNaturalist-2021データセットは、約270万のマクロ微生物の画像で構成されており、1万のクラスにまたがっている。我々のモデルは(ロック画像テキストチューニングと呼ばれる新しい手法を用いて訓練)、事前訓練された凍結された視覚表現を用いて、言語アライメントだけで強力な移動学習性能が得られることを証明している。
論文参考訳（メタデータ） (2023-02-12T20:36:55Z)
Sky-image-based solar forecasting using deep learning with multi-location data: training models locally, globally or via transfer learning? [0.0]
ディープラーニングモデルをトレーニングする上で最大の課題のひとつは、ラベル付きデータセットの可用性だ。近年、ますます多くの天空画像データセットがオープンソース化され、正確で信頼性の高い太陽予測手法の開発は、大きな成長の可能性を秘めている。
論文参考訳（メタデータ） (2022-11-03T19:25:28Z)
Learning crop type mapping from regional label proportions in large-scale SAR and optical imagery [9.303156731091532]
本研究は,作物ラベルの比率を事前に用いたオンラインディープクラスタリング手法を提案し,サンプルレベル分類器を学習する。ブラジルの2つの異なる農業地域から得られた2つの大きなデータセットを用いて,本手法の評価を行った。
論文参考訳（メタデータ） (2022-08-24T15:23:26Z)
Facilitated machine learning for image-based fruit quality assessment in developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。事前学習型視覚変換器(ViT)に基づく代替手法を提案する。標準的なデバイス上で限られたリソースで簡単に実装できる。
論文参考訳（メタデータ） (2022-07-10T19:52:20Z)
Embedding Earth: Self-supervised contrastive pre-training for dense land cover classification [61.44538721707377]
本研究では,衛星画像の高可用性を活用するための自己監督型コントラスト事前学習法として,エンベディングアースを提案する。提案手法による事前学習では, 25%の絶対mIoUが得られた。学習した特徴は、異なる領域間で一般化され、提案した事前学習スキームの可能性を開放する。
論文参考訳（メタデータ） (2022-03-11T16:14:14Z)
Vision Models Are More Robust And Fair When Pretrained On Uncurated Images Without Supervision [38.22842778742829]
差別的な自己教師型学習は、インターネット画像の任意のランダムなグループでのトレーニングモデルを可能にする。データ前処理や事前の仮定なしで、何十億ものランダムなイメージでモデルをトレーニングします。フェアネス、分布シフト、地理的多様性、微粒化認識、画像コピー検出、および多くの画像分類データセットを含む50以上のベンチマークにおいて、我々のモデル性能を広範囲に研究し、検証した。
論文参考訳（メタデータ） (2022-02-16T22:26:47Z)
Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-08-02T07:50:50Z)
A Systematic Evaluation of Domain Adaptation in Facial Expression Recognition [0.0]
本稿では,表情認識における領域適応の体系的評価について述べる。我々は、最先端のトランスファー学習技術と、6つの一般的な顔表情データセットを使用する。その結果,移動学習の精度は高くなく,目的のデータセットと慣用的に異なることがわかった。
論文参考訳（メタデータ） (2021-06-29T14:41:19Z)
Learning Transferable Visual Models From Natural Language Supervision [13.866297967166089]
画像に関する生のテキストから直接学ぶことは、有望な代替手段だ。本研究では,どのキャプションがどの画像で動くかを予測する単純な事前学習タスクが,効率よく,スケーラブルな学習方法であることを実証する。 SOTA画像表現は、インターネットから収集された4億(画像、テキスト)のデータセットから学習される。
論文参考訳（メタデータ） (2021-02-26T19:04:58Z)
PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文参考訳（メタデータ） (2020-11-25T11:03:11Z)
Dataset Cartography: Mapping and Diagnosing Datasets with Training Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文参考訳（メタデータ） (2020-09-22T20:19:41Z)
Meta-Learning for Few-Shot Land Cover Classification [3.8529010979482123]
分類タスクとセグメンテーションタスクにおけるモデル非依存メタラーニング(MAML)アルゴリズムの評価を行った。数発のモデル適応は,正規勾配降下による事前学習よりも優れていた。これは、メタラーニングによるモデル最適化が地球科学におけるタスクの恩恵をもたらすことを示唆している。
論文参考訳（メタデータ） (2020-04-28T09:42:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。