論文の概要: Using Global Land Cover Product as Prompt for Cropland Mapping via
Visual Foundation Model
- arxiv url: http://arxiv.org/abs/2310.10219v1
- Date: Mon, 16 Oct 2023 09:29:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 15:16:50.565486
- Title: Using Global Land Cover Product as Prompt for Cropland Mapping via
Visual Foundation Model
- Title(参考訳): グローバルランドカバー製品を用いたビジュアルファウンデーションモデルによる作物マッピング
- Authors: Chao Tao, Aoran Hu, Rong Xiao, Haifeng Li, and Yuze Wang
- Abstract要約: 本研究では,農地の景観を解釈する上での"Pretrain+Prompting"パラダイムを導入し,グローバルな土地被覆製品に基づく自動プロンプティング(APT)手法を設計する。
追加のラベルコストを導入することなく、一般的なシーンから特定の作物のシーンへの微粒な適応プロセスを実現することができる。
中国南部と北部の2つの亜メートルの農地データセットを用いて実験したところ、視覚基盤モデルによる提案手法は、リモートセンシングの分野で従来の教師あり学習法や微調整法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 6.35948253619752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven deep learning methods have shown great potential in cropland
mapping. However, due to multiple factors such as attributes of cropland
(topography, climate, crop type) and imaging conditions (viewing angle,
illumination, scale), croplands under different scenes demonstrate a great
domain gap. This makes it difficult for models trained in the specific scenes
to directly generalize to other scenes. A common way to handle this problem is
through the "Pretrain+Fine-tuning" paradigm. Unfortunately, considering the
variety of features of cropland that are affected by multiple factors, it is
hardly to handle the complex domain gap between pre-trained data and target
data using only sparse fine-tuned samples as general constraints. Moreover, as
the number of model parameters grows, fine-tuning is no longer an easy and
low-cost task. With the emergence of prompt learning via visual foundation
models, the "Pretrain+Prompting" paradigm redesigns the optimization target by
introducing individual prompts for each single sample. This simplifies the
domain adaption from generic to specific scenes during model reasoning
processes. Therefore, we introduce the "Pretrain+Prompting" paradigm to
interpreting cropland scenes and design the auto-prompting (APT) method based
on freely available global land cover product. It can achieve a fine-grained
adaptation process from generic scenes to specialized cropland scenes without
introducing additional label costs. To our best knowledge, this work pioneers
the exploration of the domain adaption problems for cropland mapping under
prompt learning perspectives. Our experiments using two sub-meter cropland
datasets from southern and northern China demonstrated that the proposed method
via visual foundation models outperforms traditional supervised learning and
fine-tuning approaches in the field of remote sensing.
- Abstract(参考訳): データ駆動型ディープラーニング手法は、農地マッピングに大きな可能性を示している。
しかし、土地特性(地形、気候、作物の種類)や画像条件(視野角、照明、スケール)など多彩な要因により、異なる場面の耕作地は大きな領域間隙を示す。
これにより、特定のシーンで訓練されたモデルが他のシーンに直接一般化することが困難になる。
この問題に対処する一般的な方法は、"Pretrain+Fine-tuning"パラダイムである。
残念なことに、複数の要因によって影響を受ける農地の多様な特徴を考慮すると、事前訓練されたデータとターゲットデータの間の複雑なドメイン間ギャップを一般的な制約としてスパース微調整されたサンプルのみを使用して処理することはほとんどない。
さらに、モデルパラメータの数が増えるにつれて、微調整はもはや簡単で低コストなタスクではない。
視覚基礎モデルによるプロンプト学習の出現に伴い、"Pretrain+Prompting"パラダイムは、各サンプルに対して個別のプロンプトを導入することで最適化対象を再設計する。
これにより、モデル推論プロセス中のジェネリックから特定のシーンへのドメイン適応が簡単になる。
そこで我々は,農地の景観を解釈する「プレトレイン+プロンプティング(Pretrain+Prompting)」パラダイムを導入し,自由なグローバルな土地被覆製品に基づく自動プロンプティング(APT)手法を設計する。
追加のラベルコストを導入することなく、ジェネリックなシーンから特別な作物のシーンへの細かな適応プロセスを実現することができる。
我々の知る限り、この研究は素早い学習視点の下での農地マッピングのための領域適応問題の探索の先駆けとなった。
中国南部と北部の2つの亜メートルの農地データセットを用いた実験では、視覚基盤モデルによる提案手法が、リモートセンシングの分野で従来の教師付き学習や微調整アプローチよりも優れていることを示した。
関連論文リスト
- Semi-Self-Supervised Domain Adaptation: Developing Deep Learning Models with Limited Annotated Data for Wheat Head Segmentation [0.10923877073891444]
本稿では,確率的拡散過程を持つ深層畳み込みニューラルネットワークに基づく半自己制御型ドメイン適応手法を提案する。
合成画像-マスク対と無注釈画像の両方を利用する2分岐畳み込みエンコーダ・デコーダモデルアーキテクチャを開発した。
提案されたモデルは、内部テストデータセットで80.7%のDiceスコア、外部テストセットで64.8%のDiceスコアを達成した。
論文 参考訳(メタデータ) (2024-05-12T04:35:49Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Terrain Diffusion Network: Climatic-Aware Terrain Generation with
Geological Sketch Guidance [16.29267504093274]
スケッチベースの地形生成は、コンピュータゲーム、アニメーション、バーチャルリアリティーなどの様々なアプリケーションにおいて、仮想環境のための現実的な風景を作成しようとしている。
本稿では,制御性向上のためのユーザガイダンスを積極的に取り入れた,新しい拡散に基づく地形拡散ネットワーク(TDN)を提案する。
3つの地形合成装置は、構造的、中間的、きめ細やかなレベル認知のために設計されており、それぞれの合成装置は異なる地形の側面に集中することができる。
論文 参考訳(メタデータ) (2023-08-31T13:41:34Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Spatial Steerability of GANs via Self-Supervision from Discriminator [123.27117057804732]
本稿では,GANの空間的ステアビリティを向上させるための自己教師型アプローチを提案する。
具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。
推論中、ユーザは直感的に空間のヒートマップと対話し、シーンのレイアウトを調整したり、移動したり、オブジェクトを削除したりすることで、出力画像を編集することができる。
論文 参考訳(メタデータ) (2023-01-20T07:36:29Z) - Vision Transformers: From Semantic Segmentation to Dense Prediction [139.15562023284187]
視覚的予測のための視覚変換器(ViT)のグローバルな文脈学習の可能性について検討する。
我々のモチベーションは、グローバルコンテキストを全受容界層で学習することで、ViTがより強力な長距離依存性情報を取得することである。
階層型ローカル・グローバル・トランスフォーマー (HLG) のファミリを定式化し, 窓内部の局所的な注意と, ピラミッド建築における窓全体のグローバルアテンションを特徴とする。
論文 参考訳(メタデータ) (2022-07-19T15:49:35Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Embedding Earth: Self-supervised contrastive pre-training for dense land
cover classification [61.44538721707377]
本研究では,衛星画像の高可用性を活用するための自己監督型コントラスト事前学習法として,エンベディングアースを提案する。
提案手法による事前学習では, 25%の絶対mIoUが得られた。
学習した特徴は、異なる領域間で一般化され、提案した事前学習スキームの可能性を開放する。
論文 参考訳(メタデータ) (2022-03-11T16:14:14Z) - Segmentation of VHR EO Images using Unsupervised Learning [19.00071868539993]
単一のラベルのないシーンでトレーニングできる教師なしセマンティックセマンティックセマンティクス手法を提案する。
提案手法は、この特性を利用して、より大きなシーンから小さなパッチをサンプリングする。
対象画像/シーンの教師なしトレーニングの後、モデルはシーンに存在する主要なクラスを自動的に分離し、セグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2021-07-09T11:42:48Z) - An Efficient Method for the Classification of Croplands in Scarce-Label
Regions [0.0]
衛星時系列画像による農地分類の主な課題は、地表面データ不足と、未開発地域における高品質のハイパースペクトル画像の到達不能である。
ラベルなしの中解像度衛星画像は豊富だが、その恩恵を受けるにはオープンな問題だ。
自監督タスクを用いた作物分類におけるその可能性の活用方法を示す。
論文 参考訳(メタデータ) (2021-03-17T12:10:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。