論文の概要: FrogDeepSDM: Improving Frog Counting and Occurrence Prediction Using Multimodal Data and Pseudo-Absence Imputation
- arxiv url: http://arxiv.org/abs/2510.19305v1
- Date: Wed, 22 Oct 2025 07:09:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.234631
- Title: FrogDeepSDM: Improving Frog Counting and Occurrence Prediction Using Multimodal Data and Pseudo-Absence Imputation
- Title(参考訳): FrogDeepSDM:マルチモーダルデータと擬似乱数計算によるフロッグカウントと発生予測の改善
- Authors: Chirag Padubidri, Pranesh Velmurugan, Andreas Lanitis, Andreas Kamilaris,
- Abstract要約: 種分布モデル (SDM) は、広範囲にわたる種の存在を予測するのに役立つ。
本研究では,深層学習とデータ計算技術を適用して,カエル(Anura)のSDM精度を向上させる。
実験の結果、データバランスはモデル性能を大幅に改善し、カエルカウントタスクにおいて平均絶対誤差(MAE)が189から29に削減された。
- 参考スコア(独自算出の注目度): 0.9537146822132906
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monitoring species distribution is vital for conservation efforts, enabling the assessment of environmental impacts and the development of effective preservation strategies. Traditional data collection methods, including citizen science, offer valuable insights but remain limited in coverage and completeness. Species Distribution Modelling (SDM) helps address these gaps by using occurrence data and environmental variables to predict species presence across large regions. In this study, we enhance SDM accuracy for frogs (Anura) by applying deep learning and data imputation techniques using data from the "EY - 2022 Biodiversity Challenge." Our experiments show that data balancing significantly improved model performance, reducing the Mean Absolute Error (MAE) from 189 to 29 in frog counting tasks. Feature selection identified key environmental factors influencing occurrence, optimizing inputs while maintaining predictive accuracy. The multimodal ensemble model, integrating land cover, NDVI, and other environmental inputs, outperformed individual models and showed robust generalization across unseen regions. The fusion of image and tabular data improved both frog counting and habitat classification, achieving 84.9% accuracy with an AUC of 0.90. This study highlights the potential of multimodal learning and data preprocessing techniques such as balancing and imputation to improve predictive ecological modeling when data are sparse or incomplete, contributing to more precise and scalable biodiversity monitoring.
- Abstract(参考訳): 種の分布をモニタリングすることは、環境影響の評価と効果的な保全戦略の開発を可能にするため、保全活動に不可欠である。
市民科学を含む伝統的なデータ収集手法は、貴重な洞察を提供するが、カバレッジと完全性には制限がある。
種分布モデル (SDM) は、大地域にわたる種の存在を予測するために、発生データと環境変数を用いてこれらのギャップに対処する。
本研究では,「EY-2022生物多様性チャレンジ」のデータを用いて,深層学習とデータ計算技術を適用し,カエル(アヌラ)のSDM精度を向上させる。
実験の結果, カエルカウント作業において, 平均絶対誤差(MAE)を189から29に低減し, モデル性能を有意に向上した。
特徴選択は、予測精度を維持しつつ入力を最適化し、発生に影響を与える重要な環境要因を特定した。
土地被覆, NDVI, その他の環境入力を統合したマルチモーダルアンサンブルモデルでは, 個々のモデルよりも優れ, 目に見えない領域にまたがるロバストな一般化が見られた。
画像と表データの融合により、カエルの数え方と生息地の分類が改善し、AUCの0.90で84.9%の精度が得られた。
本研究は,データ不足や不完全な場合の予測生態モデルを改善するために,バランスや計算などのマルチモーダル学習やデータ前処理技術の可能性を強調し,より正確でスケーラブルな生物多様性モニタリングに寄与する。
関連論文リスト
- BATIS: Bayesian Approaches for Targeted Improvement of Species Distribution Models [15.029163153558533]
種分布モデル(SDM)は,環境変数に基づいて種の発生を予測することを目的としている。
SDMの最近の深層学習の進歩は、複雑で不均一なデータセットでうまく機能することが示されている。
本稿では,限られた観測データを用いて事前予測を反復的に更新する,新規で実用的なフレームワークであるBATISを紹介する。
論文 参考訳(メタデータ) (2025-10-22T16:42:46Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - MaskSDM with Shapley values to improve flexibility, robustness, and explainability in species distribution modeling [3.428447509258587]
種分布モデル(SDM)は生物多様性の研究、保全計画、生態ニッチモデリングにおいて重要な役割を担っている。
マスク付きトレーニング戦略を用いてフレキシブルな予測器選択を可能にする,新しいディープラーニングベースのSDMであるMaskSDMを紹介する。
我々はグローバルなsPlotOpenデータセット上でMaskSDMを評価し,12,738種の分布をモデル化した。
論文 参考訳(メタデータ) (2025-03-17T11:02:28Z) - Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - Beyond Tides and Time: Machine Learning Triumph in Water Quality [0.0]
この研究は、データサイエンスの専門家とドメイン固有の知識を持たない人々の両方にとって、堅牢な予測パイプラインを確立することを目的としている。
我々の研究は、データサイエンスの専門家とドメイン固有の知識を持たない人々の両方にとって、堅牢な予測パイプラインを確立することを目的としています。
論文 参考訳(メタデータ) (2023-09-29T03:33:53Z) - B-Learner: Quasi-Oracle Bounds on Heterogeneous Causal Effects Under
Hidden Confounding [51.74479522965712]
本稿では,B-Learnerと呼ばれるメタラーナーを提案する。
我々は、その推定が有効で、鋭く、効率的であることを証明し、既存の方法よりも一般的な条件下で構成推定器に対して準オーラル特性を持つことを示した。
論文 参考訳(メタデータ) (2023-04-20T18:07:19Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。