論文の概要: Combining Observational Data and Language for Species Range Estimation
- arxiv url: http://arxiv.org/abs/2410.10931v1
- Date: Mon, 14 Oct 2024 17:22:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 14:00:48.034662
- Title: Combining Observational Data and Language for Species Range Estimation
- Title(参考訳): 種数推定のための観測データと言語の組み合わせ
- Authors: Max Hamilton, Christian Lange, Elijah Cole, Alexander Shepard, Samuel Heinrich, Oisin Mac Aodha, Grant Van Horn, Subhransu Maji,
- Abstract要約: 我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
- 参考スコア(独自算出の注目度): 63.65684199946094
- License:
- Abstract: Species range maps (SRMs) are essential tools for research and policy-making in ecology, conservation, and environmental management. However, traditional SRMs rely on the availability of environmental covariates and high-quality species location observation data, both of which can be challenging to obtain due to geographic inaccessibility and resource constraints. We propose a novel approach combining millions of citizen science species observations with textual descriptions from Wikipedia, covering habitat preferences and range descriptions for tens of thousands of species. Our framework maps locations, species, and text descriptions into a common space, facilitating the learning of rich spatial covariates at a global scale and enabling zero-shot range estimation from textual descriptions. Evaluated on held-out species, our zero-shot SRMs significantly outperform baselines and match the performance of SRMs obtained using tens of observations. Our approach also acts as a strong prior when combined with observational data, resulting in more accurate range estimation with less data. We present extensive quantitative and qualitative analyses of the learned representations in the context of range estimation and other spatial tasks, demonstrating the effectiveness of our approach.
- Abstract(参考訳): 種範囲マップ(SRM)は、生態学、保全、環境管理における研究と政策決定に不可欠なツールである。
しかし、従来のSRMは環境共変量と高品質な種の位置観測データに頼っており、どちらも地理的に到達できないことと資源の制約のため入手が困難である。
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案し,生息環境の嗜好と数万の種に対する範囲記述をカバーした。
我々のフレームワークは、位置、種、テキスト記述を共通空間にマッピングし、リッチな空間的共変体を世界規模で学習し、テキスト記述からゼロショット範囲の推定を可能にする。
ホールドアウト種で評価したところ, ゼロショットSRMはベースラインを著しく上回り, 数十回の観測で得られたSRMの性能に匹敵することがわかった。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
本研究では,範囲推定や他の空間的タスクの文脈における学習表現の定量的・定性的な分析を行い,その効果を実証する。
関連論文リスト
- GeoPlant: Spatial Plant Species Prediction Dataset [4.817737198128259]
種分布モデル (SDM) は空間的特徴から空間を横断する種を予測する。
我々は、空間分解能(10-50m)の高いSDMのための新しいヨーロッパ規模のデータセットを設計、開発してきた。
このデータセットは、5Mの不均一なPresence-Onlyレコードと90kの徹底的なPresence-Absenceサーベイレコードで構成されている。
論文 参考訳(メタデータ) (2024-08-25T20:09:46Z) - Enhancing Ecological Monitoring with Multi-Objective Optimization: A Novel Dataset and Methodology for Segmentation Algorithms [17.802456388479616]
オーストラリア, ニューサウスウェールズ州ベガバレーで, 外来種および外来種を捉えた6,096個の高分解能空中画像のユニークなセマンティックセマンティックセマンティクスデータセットを導入した。
このデータセットは、草種の重複と分布のため、困難な課題を示す。
データセットとコードは公開され、コンピュータビジョン、機械学習、生態学の研究を促進することを目的としている。
論文 参考訳(メタデータ) (2024-07-25T18:27:27Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - LD-SDM: Language-Driven Hierarchical Species Distribution Modeling [9.620416509546471]
我々は,世界規模の存在のみのデータを用いた種分布モデリングの問題に焦点をあてる。
種間の強い暗黙の関係を捉えるため,大きな言語モデルを用いて,種の分類学的階層を符号化した。
そこで本研究では,種分布モデルの評価が可能な近接認識評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-13T18:11:37Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - StatEcoNet: Statistical Ecology Neural Networks for Species Distribution
Modeling [8.534315844706367]
本稿では、計算持続可能性と統計生態学におけるコアタスクである種分布モデリング(SDM)に焦点を当てる。
SDMでは、景観上の種の発生パターンは、一連の場所における観察に基づいて環境特性によって予測される。
本稿では,SDMのユニークな課題を解決するため,StatEcoNetというフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-17T02:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。