論文の概要: DivShift: Exploring Domain-Specific Distribution Shift in Volunteer-Collected Biodiversity Datasets
- arxiv url: http://arxiv.org/abs/2410.19816v2
- Date: Sun, 22 Dec 2024 00:09:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 19:21:19.039364
- Title: DivShift: Exploring Domain-Specific Distribution Shift in Volunteer-Collected Biodiversity Datasets
- Title(参考訳): DivShift: ボランティア収集生物多様性データセットにおけるドメイン特化分布シフトの探索
- Authors: Elena Sierra, Lauren E. Gillespie, Salim Soltani, Moises Exposito-Alonso, Teja Kattenborn,
- Abstract要約: 約800万のiNaturalist植物画像のキュレートされたデータセットであるDivShift-NAWC(DivShift-NAWC)を紹介した。
モデル性能を既知の4つのバイアスで比較し、それらが実際にモデル性能を損なうことを観察する。
我々は、気候変動が世界の生物多様性に与える影響を監視するために、データセットをキュレートしてディープラーニングモデルを訓練する実践的戦略を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Climate change is negatively impacting the world's biodiversity. To build automated systems to monitor these negative biodiversity impacts, large-scale, volunteer-collected datasets like iNaturalist are built from community-identified, natural imagery. However, such volunteer-based data are opportunistic and lack a structured sampling strategy, resulting in geographic, temporal, observation quality, and socioeconomic, biases that stymie uptake of these models for downstream biodiversity monitoring tasks. Here we introduce DivShift North American West Coast (DivShift-NAWC), a curated dataset of almost 8 million iNaturalist plant images across the western coast of North America, for exploring the effects of these biases on deep learning model performance. We compare model performance across four known biases and observe that they indeed confound model performance. We suggest practical strategies for curating datasets to train deep learning models for monitoring climate change's impacts on the world's biodiversity.
- Abstract(参考訳): 気候変動は世界の生物多様性に悪影響を及ぼしている。
これらの負の生物多様性への影響を監視する自動化システムを構築するために、iNaturalistのような大規模でボランティアが収集したデータセットは、コミュニティが特定した自然画像から構築されている。
しかし、そのようなボランティアベースのデータは機会論的であり、構造化されたサンプリング戦略が欠如しており、結果として地理的、時間的、観察品質、社会経済的な偏りが生じ、下流の生物多様性モニタリングタスクにこれらのモデルの取り込みを妨げている。
ここでは,北米西海岸における約800万のiNaturalist植物画像の収集したデータセットであるDivShift North American West Coast(DivShift-NAWC)を紹介し,これらのバイアスがディープラーニングモデルのパフォーマンスに与える影響について検討する。
モデル性能を既知の4つのバイアスで比較し、モデル性能が実際に相反していることを確認する。
我々は、気候変動が世界の生物多様性に与える影響を監視するために、データセットをキュレートしてディープラーニングモデルを訓練する実践的戦略を提案する。
関連論文リスト
- Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - Causal Representation Learning in Temporal Data via Single-Parent Decoding [66.34294989334728]
科学的研究はしばしば、システム内の高レベル変数の根底にある因果構造を理解しようとする。
科学者は通常、地理的に分布した温度測定などの低レベルの測定を収集する。
そこで本研究では,単一親の復号化による因果発見法を提案し,その上で下位の潜伏者と因果グラフを同時に学習する。
論文 参考訳(メタデータ) (2024-10-09T15:57:50Z) - A Deep Learning-Based Approach for Mangrove Monitoring [0.0]
本研究は,マングローブセグメンテーションの課題における最近のディープラーニングモデルの包括的評価を提供する。
我々はまず,Global Mangrove WatchのmangroveアノテーションとSentinel-2の衛星画像を組み合わせた,オープンソースの新しいデータセットMagSet-2を紹介し,公開する。
次に、生成されたデータセットを使用して、3つのアーキテクチャグループ、すなわち畳み込み、トランスフォーマー、mambaモデルをベンチマークします。
論文 参考訳(メタデータ) (2024-10-07T19:22:08Z) - Fine-tuning of Geospatial Foundation Models for Aboveground Biomass Estimation [2.3429628556845405]
地上バイオマスを推定するための地理空間基盤モデルの微調整は、スクラッチから訓練されたU-Netに匹敵する性能を有する。
また、ブラジルの異なるエコリージョンのスパースラベルを用いた衛星画像の微調整により、モデルの伝達学習能力についても検討する。
論文 参考訳(メタデータ) (2024-06-28T12:54:10Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Bird Distribution Modelling using Remote Sensing and Citizen Science
data [31.375576105932442]
気候変動は生物多様性の喪失の主要な要因である。
種の分布には大きな知識ギャップがある。
本稿では,コンピュータビジョンを利用した種分散モデルの改良手法を提案する。
論文 参考訳(メタデータ) (2023-05-01T20:27:11Z) - A Comparative Study on Generative Models for High Resolution Solar
Observation Imaging [59.372588316558826]
本研究は、観測された太陽活動状態の背後にあるデータ分布を正確に捉えるために、現在の最先端生成モデルの能力について検討する。
スーパーコンピュータ上での分散トレーニングを用いて、人間の専門家が区別できない高品質なサンプルを生成する、最大1024x1024解像度の生成モデルを訓練することができる。
論文 参考訳(メタデータ) (2023-04-14T14:40:32Z) - Neuroevolution-based Classifiers for Deforestation Detection in Tropical
Forests [62.997667081978825]
森林破壊や荒廃により、毎年何百万ヘクタールもの熱帯林が失われる。
監視・森林破壊検知プログラムは、犯罪者の予防・処罰のための公共政策に加えて、使用されている。
本稿では,熱帯林の森林破壊検出作業におけるニューロ進化技術(NEAT)に基づくパターン分類器の利用を提案する。
論文 参考訳(メタデータ) (2022-08-23T16:04:12Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - Jalisco's multiclass land cover analysis and classification using a
novel lightweight convnet with real-world multispectral and relief data [51.715517570634994]
本稿では、LC分類と解析を行うために、新しい軽量(89kパラメータのみ)畳み込みニューラルネットワーク(ConvNet)を提案する。
本研究では,実世界のオープンデータソースを3つ組み合わせて13のチャネルを得る。
組込み分析は、いくつかのクラスにおいて限られたパフォーマンスを期待し、最も類似したクラスをグループ化する機会を与えてくれます。
論文 参考訳(メタデータ) (2022-01-26T14:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。