論文の概要: A large-scale image-text dataset benchmark for farmland segmentation
- arxiv url: http://arxiv.org/abs/2503.23106v1
- Date: Sat, 29 Mar 2025 14:55:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:39:08.103964
- Title: A large-scale image-text dataset benchmark for farmland segmentation
- Title(参考訳): 農地分割のための大規模画像テキストデータセットベンチマーク
- Authors: Chao Tao, Dandan Zhong, Weiliang Mu, Zhuofei Du, Haiyang Wu,
- Abstract要約: 本稿では、農地の言語による記述について紹介し、農地区分用に設計された最初の微細テキスト画像テキストデータセットであるFarmSeg-VLについて述べる。
時間次元では、全4シーズンをカバーしている。
また、空間的次元の面では、中国の8つの典型的な農業地域をカバーしている。
- 参考スコア(独自算出の注目度): 2.3412548557474797
- License:
- Abstract: The traditional deep learning paradigm that solely relies on labeled data has limitations in representing the spatial relationships between farmland elements and the surrounding environment.It struggles to effectively model the dynamic temporal evolution and spatial heterogeneity of farmland. Language,as a structured knowledge carrier,can explicitly express the spatiotemporal characteristics of farmland, such as its shape, distribution,and surrounding environmental information.Therefore,a language-driven learning paradigm can effectively alleviate the challenges posed by the spatiotemporal heterogeneity of farmland.However,in the field of remote sensing imagery of farmland,there is currently no comprehensive benchmark dataset to support this research direction.To fill this gap,we introduced language based descriptions of farmland and developed FarmSeg-VL dataset,the first fine-grained image-text dataset designed for spatiotemporal farmland segmentation.Firstly, this article proposed a semi-automatic annotation method that can accurately assign caption to each image, ensuring high data quality and semantic richness while improving the efficiency of dataset construction.Secondly,the FarmSeg-VL exhibits significant spatiotemporal characteristics.In terms of the temporal dimension,it covers all four seasons.In terms of the spatial dimension,it covers eight typical agricultural regions across China.In addition, in terms of captions,FarmSeg-VL covers rich spatiotemporal characteristics of farmland,including its inherent properties,phenological characteristics, spatial distribution,topographic and geomorphic features,and the distribution of surrounding environments.Finally,we present a performance analysis of VLMs and the deep learning models that rely solely on labels trained on the FarmSeg-VL,demonstrating its potential as a standard benchmark for farmland segmentation.
- Abstract(参考訳): ラベル付きデータにのみ依存する従来のディープラーニングパラダイムは、農地要素と周辺の環境の間の空間的関係を表現するのに限界があり、農地の動的時間的進化と空間的不均一性を効果的にモデル化するのに苦労している。
言語は、構造的知識担体として、農地の時空間的特徴、例えば、その形状、分布、環境情報等の時空間的特徴を明確に表現することができるが、前述した言語駆動学習パラダイムは、農地の時空間的均質性によって生じる課題を効果的に緩和することができる。しかし、現在、農地のリモートセンシング画像の分野では、この研究方向性を支えるための包括的なベンチマークデータセットは存在しない。このギャップを埋めるために、我々は、農地の言語ベースの記述を導入し、時空間的分節化用に設計された最初の微細な画像テキストデータセットであるファームセグゼグゼグゼグゼグゼグゼグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネグネメント:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Hen:Fen:Fen:Fen:Fen :Fen:Fen:Cen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Cen:Fen:Cen:Cen:Cen :Cen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Fen:Senten:Fen:Fen:Fen:Cen:Fen:Fen:Fen:Fen:Fen:Cen:Cen:Cen:Cen:Cen: Cen:Cen:Cen:Cen:Cen:Cen:The
関連論文リスト
- Weakly Supervised Framework Considering Multi-temporal Information for Large-scale Cropland Mapping with Satellite Imagery [11.157693752084214]
本研究では,大規模農地マッピングのための多時期情報を考慮した弱教師付き枠組みを提案する。
我々は,グローバルランドカバー(GLC)製品間の整合性に応じて高品質なラベルを抽出し,教師付き学習信号を構築する。
提案手法は大規模農地マッピングにおいて,3つの研究領域にまたがる適応性について実験的に検証されている。
論文 参考訳(メタデータ) (2024-11-27T16:11:52Z) - Enhancing Ecological Monitoring with Multi-Objective Optimization: A Novel Dataset and Methodology for Segmentation Algorithms [17.802456388479616]
オーストラリア, ニューサウスウェールズ州ベガバレーで, 外来種および外来種を捉えた6,096個の高分解能空中画像のユニークなセマンティックセマンティックセマンティクスデータセットを導入した。
このデータセットは、草種の重複と分布のため、困難な課題を示す。
データセットとコードは公開され、コンピュータビジョン、機械学習、生態学の研究を促進することを目的としている。
論文 参考訳(メタデータ) (2024-07-25T18:27:27Z) - SpatialRGPT: Grounded Spatial Reasoning in Vision Language Models [68.13636352687257]
VLMの空間知覚と推論能力を高めるために空間領域GPT(SpatialRGPT)を導入する。
推測中、ユーザが指定した領域の提案が提供されると、SpatialRGPTは相対的な方向と距離を正確に知覚できる。
本研究では,空間的推論タスクにおける局所的プロンプトと非局所的プロンプトの双方において,空間的RGPTにより性能が著しく向上することを示す。
論文 参考訳(メタデータ) (2024-06-03T17:59:06Z) - StrideNET: Swin Transformer for Terrain Recognition with Dynamic Roughness Extraction [0.0]
本稿では、地形認識と暗黙的特性推定のために設計された新しいデュアルブランチアーキテクチャであるStrideNETを提案する。
この研究の意味は、環境モニタリング、土地利用、土地被覆分類(LULC)、災害対応、精密農業など、様々な応用にまで及んでいる。
論文 参考訳(メタデータ) (2024-04-20T04:51:59Z) - Biological Valuation Map of Flanders: A Sentinel-2 Imagery Analysis [12.025312586542318]
我々は、センチネル2衛星画像と組み合わせたフランダースの高密度なラベル付き地上真理マップを提示する。
提案手法は,地形図のレイアウトである「Kaartbladversnijdingen」と,詳細なセマンティックセグメンテーションモデルトレーニングパイプラインを利用する,形式化されたデータセット分割とサンプリング手法を含む。
論文 参考訳(メタデータ) (2024-01-26T22:21:39Z) - PhenoBench -- A Large Dataset and Benchmarks for Semantic Image Interpretation in the Agricultural Domain [29.395926321984565]
本稿では,実際の農業分野の意味論的解釈のための注釈付きデータセットとベンチマークを提案する。
UAVで記録したデータセットは、作物や雑草の高品質でピクセル単位のアノテーションを提供するだけでなく、作物の葉のインスタンスも同時に提供する。
異なるフィールドで構成された隠れテストセット上で、さまざまなタスクのベンチマークを提供する。
論文 参考訳(メタデータ) (2023-06-07T16:04:08Z) - Concept Drift and Long-Tailed Distribution in Fine-Grained Visual Categorization: Benchmark and Method [84.68818879525568]
コンセプションドリフトとLong-Tailed Distributionデータセットを提案する。
インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
本稿ではCDLTに関連する学習課題に対処する機能組換えフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-04T12:42:45Z) - SIRI: Spatial Relation Induced Network For Spatial Description
Resolution [64.38872296406211]
言語誘導型ローカライゼーションのための新しい関係誘導型ネットワーク(SIRI)を提案する。
提案手法は,80ピクセルの半径で測定した精度で,最先端手法よりも約24%優れていた。
提案手法は,Touchdownと同じ設定で収集した拡張データセットをうまく一般化する。
論文 参考訳(メタデータ) (2020-10-27T14:04:05Z) - Semi-Supervised Semantic Segmentation in Earth Observation: The
MiniFrance Suite, Dataset Analysis and Multi-task Network Study [82.02173199363571]
我々は,地球観測における半教師付きセマンティックセマンティックセグメンテーションのための新しい大規模データセット,MiniFranceスイートを紹介した。
MiniFranceにはいくつかの前例のない特性があり、2000以上の超高解像度の空中画像を含み、200億枚以上のサンプル(ピクセル)を処理している。
外観の類似性やMiniFranceデータの徹底的な研究からデータ代表性分析のためのツールを提案し,半教師付き環境での学習や一般化に適していることを示す。
論文 参考訳(メタデータ) (2020-10-15T15:36:58Z) - Farmland Parcel Delineation Using Spatio-temporal Convolutional Networks [77.63950365605845]
ファームパーセル・デライン化は、気候変動政策の開発と管理において重要なカダストラルデータを提供する。
このデータは、極端な気象災害に伴う損害後の補償を評価するための農業保険セクターにも有用である。
衛星画像の利用は、農場の区画整理作業を行うためのスケーラブルで費用対効果の高い方法である。
論文 参考訳(メタデータ) (2020-04-11T19:49:09Z) - Grounded Situation Recognition [56.18102368133022]
画像の構造的要約を生成することを必要とする課題であるグラウンドドコンディション認識(GSR)を導入する。
GSRはセマンティック・サリエンシの識別、大規模で多様なエンティティの分類とローカライズという重要な技術的課題を提示している。
我々は,条件付きクエリ,視覚連鎖,接地型セマンティック・アウェアネス・イメージ検索の3つのモデルによって実現される3つの将来方向について,最初の知見を示す。
論文 参考訳(メタデータ) (2020-03-26T17:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。