論文の概要: On the selection and effectiveness of pseudo-absences for species
distribution modeling with deep learning
- arxiv url: http://arxiv.org/abs/2401.02989v1
- Date: Wed, 3 Jan 2024 16:06:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 09:36:20.886803
- Title: On the selection and effectiveness of pseudo-absences for species
distribution modeling with deep learning
- Title(参考訳): 深層学習を用いた種分布モデルにおける擬似存在の選択と有効性について
- Authors: Robin Zbinden, Nina van Tiel, Benjamin Kellenberger, Lloyd Hughes,
Devis Tuia
- Abstract要約: 種分布モデリングは、環境条件と種の発生との関係を理解するための汎用的なツールである。
この制限を克服するため、一般的なアプローチは、負のサンプルとして指定された特定の地理的位置である擬似存在を用いることである。
本稿では,これらの課題を多種ニューラルネットワークのトレーニングに擬似存在を統合することで効果的に対処できることを実証する。
- 参考スコア(独自算出の注目度): 3.8974747170521287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Species distribution modeling is a highly versatile tool for understanding
the intricate relationship between environmental conditions and species
occurrences. However, the available data often lacks information on confirmed
species absence and is limited to opportunistically sampled, presence-only
observations. To overcome this limitation, a common approach is to employ
pseudo-absences, which are specific geographic locations designated as negative
samples. While pseudo-absences are well-established for single-species
distribution models, their application in the context of multi-species neural
networks remains underexplored. Notably, the significant class imbalance
between species presences and pseudo-absences is often left unaddressed.
Moreover, the existence of different types of pseudo-absences (e.g., random and
target-group background points) adds complexity to the selection process.
Determining the optimal combination of pseudo-absences types is difficult and
depends on the characteristics of the data, particularly considering that
certain types of pseudo-absences can be used to mitigate geographic biases. In
this paper, we demonstrate that these challenges can be effectively tackled by
integrating pseudo-absences in the training of multi-species neural networks
through modifications to the loss function. This adjustment involves assigning
different weights to the distinct terms of the loss function, thereby
addressing both the class imbalance and the choice of pseudo-absence types.
Additionally, we propose a strategy to set these loss weights using spatial
block cross-validation with presence-only data. We evaluate our approach using
a benchmark dataset containing independent presence-absence data from six
different regions and report improved results when compared to competing
approaches.
- Abstract(参考訳): 種分布モデリングは、環境条件と種発生の複雑な関係を理解するための非常に汎用的なツールである。
しかし、利用可能なデータは、確認された種の欠如に関する情報を欠くことが多く、機会にサンプリングされた存在のみの観測に限られる。
この制限を克服するため、一般的なアプローチは、負のサンプルとして指定された特定の地理的位置である擬似存在を用いることである。
擬似存在は単一種分布モデルに対して十分に確立されているが、多種ニューラルネットワークの文脈におけるそれらの応用はいまだ未解明である。
特に、種の存在と擬似存在の間の重要な階級不均衡は、しばしば未適応のまま残されている。
さらに、異なるタイプの疑似抽象(例えばランダムとターゲットグループの背景点)の存在は、選択プロセスに複雑さをもたらす。
疑似抽象型の最適な組み合わせを決定することは困難であり、特に特定のタイプの疑似抽象が地理的バイアスを緩和するために使用できることを考慮し、データの特性に依存する。
本稿では、損失関数の修正を通じて、多種ニューラルネットワークのトレーニングに擬似存在を組み込むことにより、これらの課題に効果的に取り組むことができることを示す。
この調整は、損失関数の異なる項に異なる重みを割り当てることによって、クラス不均衡と擬似存在型の選択の両方に対処する。
さらに,このような損失重みを空間ブロッククロスバリデーションと存在限定データを用いて設定する手法を提案する。
提案手法は,6つの地域から独立した存在感データを含むベンチマークデータセットを用いて評価し,競合するアプローチと比較して改善した結果を報告する。
関連論文リスト
- Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Deep Variational Lesion-Deficit Mapping [0.3914676152740142]
本稿では,病変欠損モデル比較のための包括的枠組みを提案する。
また,本モデルでは,すべてのシミュレーションシナリオにおいて,確立された手法よりもかなり優れていることを示す。
我々の分析は、このアプローチの広く採用されていることを正当化する。
論文 参考訳(メタデータ) (2023-05-27T13:49:35Z) - The Decaying Missing-at-Random Framework: Doubly Robust Causal Inference
with Partially Labeled Data [10.021381302215062]
現実のシナリオでは、データ収集の制限によって部分的にラベル付けされたデータセットが生成されることが多く、信頼性の高い因果推論の描画が困難になる。
半パラメトリック(SS)や欠落したデータ文学における従来のアプローチは、これらの複雑さを適切に扱えないため、偏りのある見積もりにつながる可能性がある。
このフレームワークは、高次元設定における欠落した結果に対処し、選択バイアスを考慮に入れます。
論文 参考訳(メタデータ) (2023-05-22T07:37:12Z) - Leveraging Relational Information for Learning Weakly Disentangled
Representations [11.460692362624533]
絡み合いは神経表現を強制するのは難しい性質である。
我々は、(弱々しい)非絡み合い表現の学習に関する別の見解を示す。
論文 参考訳(メタデータ) (2022-05-20T09:58:51Z) - Analyzing the Effects of Handling Data Imbalance on Learned Features
from Medical Images by Looking Into the Models [50.537859423741644]
不均衡なデータセットでモデルをトレーニングすることは、学習問題にユニークな課題をもたらす可能性がある。
ニューラルネットワークの内部ユニットを深く調べて、データの不均衡処理が学習した機能にどのように影響するかを観察します。
論文 参考訳(メタデータ) (2022-04-04T09:38:38Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Training on Test Data with Bayesian Adaptation for Covariate Shift [96.3250517412545]
ディープニューラルネットワークは、信頼できない不確実性推定で不正確な予測を行うことが多い。
分布シフトの下でのラベルなし入力とモデルパラメータとの明確に定義された関係を提供するベイズモデルを導出する。
本手法は精度と不確実性の両方を向上することを示す。
論文 参考訳(メタデータ) (2021-09-27T01:09:08Z) - Investigate the Essence of Long-Tailed Recognition from a Unified
Perspective [11.080317683184363]
深層認識モデルは、カテゴリ間の重い不均衡なサンプル数のために、長い尾のデータ分布に悩まされることが多い。
本研究では,長い尾の認識が標本数とカテゴリの類似性の両方に悩まされていることを示す。
論文 参考訳(メタデータ) (2021-07-08T11:08:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。