論文の概要: GeoPlant: Spatial Plant Species Prediction Dataset
- arxiv url: http://arxiv.org/abs/2408.13928v2
- Date: Wed, 11 Dec 2024 15:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 13:59:11.808801
- Title: GeoPlant: Spatial Plant Species Prediction Dataset
- Title(参考訳): GeoPlant: 空間植物種予測データセット
- Authors: Lukas Picek, Christophe Botella, Maximilien Servajean, César Leblanc, Rémi Palard, Théo Larcher, Benjamin Deneu, Diego Marcos, Pierre Bonnet, Alexis Joly,
- Abstract要約: 種分布モデル (SDM) は空間的特徴から空間を横断する種を予測する。
我々は空間分解能(10-50m)の高いSDMのための新しいヨーロッパ規模のデータセットを設計・開発してきた。
このデータセットは、5Mの不均一なPresence-Onlyレコードと90kの徹底的なPresence-Absenceサーベイレコードで構成されている。
- 参考スコア(独自算出の注目度): 4.817737198128259
- License:
- Abstract: The difficulty of monitoring biodiversity at fine scales and over large areas limits ecological knowledge and conservation efforts. To fill this gap, Species Distribution Models (SDMs) predict species across space from spatially explicit features. Yet, they face the challenge of integrating the rich but heterogeneous data made available over the past decade, notably millions of opportunistic species observations and standardized surveys, as well as multimodal remote sensing data. In light of that, we have designed and developed a new European-scale dataset for SDMs at high spatial resolution (10--50m), including more than 10k species (i.e., most of the European flora). The dataset comprises 5M heterogeneous Presence-Only records and 90k exhaustive Presence-Absence survey records, all accompanied by diverse environmental rasters (e.g., elevation, human footprint, and soil) traditionally used in SDMs. In addition, it provides Sentinel-2 RGB and NIR satellite images with 10 m resolution, a 20-year time series of climatic variables, and satellite time series from the Landsat program. In addition to the data, we provide an openly accessible SDM benchmark (hosted on Kaggle), which has already attracted an active community and a set of strong baselines for single predictor/modality and multimodal approaches. All resources, e.g., the dataset, pre-trained models, and baseline methods (in the form of notebooks), are available on Kaggle, allowing one to start with our dataset literally with two mouse clicks.
- Abstract(参考訳): 大規模・大規模での生物多様性のモニタリングの困難さは、生態学的な知識と保全の努力を制限している。
このギャップを埋めるために、種々分布モデル(SDM)は空間的に明示的な特徴から、空間を横断して種を予測する。
しかし、彼らは過去10年間に入手できた豊かだが異質なデータを統合するという課題に直面している。
それを踏まえて、我々は10k種以上の種を含む高空間分解能(10-50m)でSDMのための新しいヨーロッパ規模のデータセットを設計、開発しました。
このデータセットは、5Mの異質なPresence-Onlyレコードと90kの徹底的なPresence-Absenceサーベイレコードからなり、それぞれに従来のSDMで使用される多様な環境ラスタ(例えば、標高、人足跡、土壌)を伴っている。
さらに10m解像度のSentinel-2 RGBとNIR衛星画像、20年連続の気候変数、ランドサット計画からの衛星時系列も提供する。
データに加えて、オープンアクセス可能なSDMベンチマーク(Kaggleにホストされている)も提供しています。これは、すでにアクティブなコミュニティと、単一の予測/モダリティとマルチモーダルアプローチのための強力なベースラインのセットを惹きつけています。
データセット、トレーニング済みモデル、ベースラインメソッド(ノートブックの形式で)など、すべてのリソースがKaggleで利用可能です。
関連論文リスト
- Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Bird Distribution Modelling using Remote Sensing and Citizen Science
data [31.375576105932442]
気候変動は生物多様性の喪失の主要な要因である。
種の分布には大きな知識ギャップがある。
本稿では,コンピュータビジョンを利用した種分散モデルの改良手法を提案する。
論文 参考訳(メタデータ) (2023-05-01T20:27:11Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z) - The GeoLifeCLEF 2020 Dataset [13.274586385114622]
我々は、高解像度のリモートセンシング画像、土地被覆データ、高度と組み合わせた190万種の観測結果からなるGeoLifeCLEF 2020データセットを提示する。
我々はまた、GeoLifeCLEF 2020コンペティションについても論じる。
論文 参考訳(メタデータ) (2020-04-08T18:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。