論文の概要: Spatial Context Improves the Integration of Text with Remote Sensing for Mapping Environmental Variables
- arxiv url: http://arxiv.org/abs/2601.08750v1
- Date: Tue, 13 Jan 2026 17:27:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.309493
- Title: Spatial Context Improves the Integration of Text with Remote Sensing for Mapping Environmental Variables
- Title(参考訳): 環境変数のマッピングのためのリモートセンシングによるテキスト統合の空間文脈改善
- Authors: Valerie Zermatten, Chiara Vanalli, Gencer Sumbul, Diego Marcos, Devis Tuia,
- Abstract要約: 本研究では,空間近傍における航空画像と位置対応テキストを組み合わせたアテンションベースアプローチを提案する。
本モデルは,SWECO25データキューブから環境変数103を推定するタスクに基づいて評価する。
- 参考スコア(独自算出の注目度): 19.670023742796136
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent developments in natural language processing highlight text as an emerging data source for ecology. Textual resources carry unique information that can be used in complementarity with geospatial data sources, thus providing insights at the local scale into environmental conditions and properties hidden from more traditional data sources. Leveraging textual information in a spatial context presents several challenges. First, the contribution of textual data remains poorly defined in an ecological context, and it is unclear for which tasks it should be incorporated. Unlike ubiquitous satellite imagery or environmental covariates, the availability of textual data is sparse and irregular; its integration with geospatial data is not straightforward. In response to these challenges, this work proposes an attention-based approach that combines aerial imagery and geolocated text within a spatial neighbourhood, i.e. integrating contributions from several nearby observations. Our approach combines vision and text representations with a geolocation encoding, with an attention-based module that dynamically selects spatial neighbours that are useful for predictive tasks.The proposed approach is applied to the EcoWikiRS dataset, which combines high-resolution aerial imagery with sentences extracted from Wikipedia describing local environmental conditions across Switzerland. Our model is evaluated on the task of predicting 103 environmental variables from the SWECO25 data cube. Our approach consistently outperforms single-location or unimodal, i.e. image-only or text-only, baselines. When analysing variables by thematic groups, results show a significant improvement in performance for climatic, edaphic, population and land use/land cover variables, underscoring the benefit of including the spatial context when combining text and image data.
- Abstract(参考訳): 自然言語処理の最近の進歩は、テキストを生態学の新たなデータソースとして強調している。
テクスチャリソースは地理空間データソースと相補的に使用できるユニークな情報を持ち、より伝統的なデータソースから隠された環境条件や特性へのローカルスケールでの洞察を提供する。
空間的文脈におけるテキスト情報の活用にはいくつかの課題がある。
第一に、テキストデータの貢献は、生態学的文脈では未定義のままであり、どのタスクを組み込むべきかは定かではない。
ユビキタス衛星画像や環境共変衛星とは異なり、テキストデータの入手は容易で不規則であり、地理空間データとの統合は容易ではない。
これらの課題に対応するために,本研究では,空間近傍の空間画像と位置対応テキストを組み合わせたアテンションベースのアプローチを提案する。
提案手法は,高解像度の空中画像と,スイスの環境条件を記述したウィキペディアから抽出した文を組み合わせたEcoWikiRSデータセットに適用した。
本モデルは,SWECO25データキューブから環境変数103を推定するタスクに基づいて評価する。
私たちのアプローチは、イメージのみまたはテキストのみのベースラインであるシングルロケーションやユニモーダルを一貫して上回ります。
テーマ群による変数分析では, 気候, エダフ, 人口, 土地利用/土地利用/土地被覆変数のパフォーマンスが著しく向上し, テキストと画像データを組み合わせる際に, 空間的コンテキストを含めることの利点が強調された。
関連論文リスト
- Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction [10.646376827353551]
環境モニタリングや天然資源管理といった分野において,マルチソース空間データ予測が重要である。
この領域の既存のモデルはドメイン固有の性質のためにしばしば不足し、様々な情報源からの情報を統合する戦略が欠如している。
我々は,地中真理ラベルを頼らずに,様々な情報源からの情報を順に整列する,革新的なマルチソース空間点データ予測フレームワークを導入する。
論文 参考訳(メタデータ) (2024-06-30T16:13:13Z) - Into the Unknown: Generating Geospatial Descriptions for New Environments [18.736071151303726]
レンデブー課題は、同心空間関係の推論を必要とする。
座標と組み合わせたオープンソース記述(例えばウィキペディア)を使用することで、トレーニングデータを提供するが、空間指向の限られたテキストに悩まされる。
新しい環境のための高品質な合成データを生成するための大規模拡張手法を提案する。
論文 参考訳(メタデータ) (2024-06-28T14:56:21Z) - Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatial Relation Matching [60.645802236700035]
自然言語コマンドを通じてドローンをナビゲートすることは、アクセス可能なマルチモーダルデータセットが不足しているため、依然として難しい。
我々は新しい自然言語誘導ジオローカライゼーションベンチマークGeoText-1652を紹介する。
このデータセットは、インタラクティブなヒューマンコンピュータプロセスを通じて体系的に構築される。
論文 参考訳(メタデータ) (2023-11-21T17:52:30Z) - SIRI: Spatial Relation Induced Network For Spatial Description
Resolution [64.38872296406211]
言語誘導型ローカライゼーションのための新しい関係誘導型ネットワーク(SIRI)を提案する。
提案手法は,80ピクセルの半径で測定した精度で,最先端手法よりも約24%優れていた。
提案手法は,Touchdownと同じ設定で収集した拡張データセットをうまく一般化する。
論文 参考訳(メタデータ) (2020-10-27T14:04:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。