論文の概要: On pseudo-absence generation and machine learning for locust breeding
ground prediction in Africa
- arxiv url: http://arxiv.org/abs/2111.03904v1
- Date: Sat, 6 Nov 2021 15:29:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 11:36:36.942968
- Title: On pseudo-absence generation and machine learning for locust breeding
ground prediction in Africa
- Title(参考訳): アフリカにおけるロカスト繁殖地予測のための疑似吸収生成と機械学習について
- Authors: Ibrahim Salihu Yusuf, Kale-ab Tessera, Thomas Tumiel, Sella Nevo, Arnu
Pretorius
- Abstract要約: 機械学習(ML)はロカスト分布モデリングの効果的なアプローチとして実証されてきた。
一般に公開されているロカストのラベル付きデータは存在のみのデータであり、ロカストの目撃のみが記録されている。
MLを用いた以前の研究は、この問題を回避する手段として擬似存在生成手法に頼っていた。
- 参考スコア(独自算出の注目度): 3.589700400208312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Desert locust outbreaks threaten the food security of a large part of Africa
and have affected the livelihoods of millions of people over the years. Machine
learning (ML) has been demonstrated as an effective approach to locust
distribution modelling which could assist in early warning. ML requires a
significant amount of labelled data to train. Most publicly available labelled
data on locusts are presence-only data, where only the sightings of locusts
being present at a location are recorded. Therefore, prior work using ML have
resorted to pseudo-absence generation methods as a way to circumvent this
issue. The most commonly used approach is to randomly sample points in a region
of interest while ensuring that these sampled pseudo-absence points are at
least a specific distance away from true presence points. In this paper, we
compare this random sampling approach to more advanced pseudo-absence
generation methods, such as environmental profiling and optimal background
extent limitation, specifically for predicting desert locust breeding grounds
in Africa. Interestingly, we find that for the algorithms we tested, namely
logistic regression, gradient boosting, random forests and maximum entropy, all
popular in prior work, the logistic model performed significantly better than
the more sophisticated ensemble methods, both in terms of prediction accuracy
and F1 score. Although background extent limitation combined with random
sampling boosted performance for ensemble methods, for LR this was not the
case, and instead, a significant improvement was obtained when using
environmental profiling. In light of this, we conclude that a simpler ML
approach such as logistic regression combined with more advanced pseudo-absence
generation, specifically environmental profiling, can be a sensible and
effective approach to predicting locust breeding grounds across Africa.
- Abstract(参考訳): 砂漠で発生したロカストはアフリカの大部分の食料安全保障を脅かし、長年にわたって何百万人もの人々の生活に影響を与えてきた。
機械学習(ML)は、早期警告に役立つロカスト分布モデリングの効果的なアプローチとして実証されている。
MLはトレーニングに大量のラベル付きデータを必要とする。
ロカストに関する公に入手可能なラベル付きデータは存在のみのデータであり、場所に存在するロカストの目撃のみを記録する。
そのため、MLを用いた先行研究では、この問題を回避する手段として擬似存在生成方式が採用されている。
最も一般的に用いられるアプローチは、興味のある領域内の点をランダムにサンプリングし、これらのサンプルされた擬似抽象点が、真の存在点から少なくとも特定の距離にあることを保証することである。
本稿では,このランダムサンプリング手法を環境プロファイリングや最適背景範囲制限などのより高度な擬似吸収生成手法と比較し,特にアフリカにおける砂漠のロカスト繁殖地の推定について述べる。
興味深いことに、ロジスティック回帰、勾配上昇、ランダム森林、最大エントロピーといったアルゴリズムを検証したところ、ロジスティックモデルは予測精度とF1スコアの両面で、より洗練されたアンサンブル法よりもはるかに優れていることがわかった。
ランダムサンプリングと組み合わせた背景範囲制限によりアンサンブル法の性能は向上したが, LRではそうではなく, 環境プロファイリングでは顕著な改善が得られた。
これを踏まえて,ロジスティック回帰(ロジスティック回帰)やより高度な擬似吸収生成(特に環境プロファイリング)といったより単純なmlアプローチは,アフリカ全域におけるロジスティック育種グラウンドの予測に合理的かつ効果的なアプローチとなると結論づける。
関連論文リスト
- Unrolled denoising networks provably learn optimal Bayesian inference [54.79172096306631]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。
圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文 参考訳(メタデータ) (2024-09-19T17:56:16Z) - Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0]
本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。
擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。
その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文 参考訳(メタデータ) (2024-09-03T08:01:01Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Distribution-Free Conformal Joint Prediction Regions for Neural Marked Temporal Point Processes [4.324839843326325]
我々は、共形予測の枠組みを用いて、ニューラルTPPモデルにおける不確実性に対するより信頼性の高い手法を開発した。
主な目的は、イベントの到着時刻とマークに対する分布自由な共同予測領域を生成し、有限サンプルの限界カバレッジを保証することである。
論文 参考訳(メタデータ) (2024-01-09T15:28:29Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Prediction in the presence of response-dependent missing labels [28.932172873182115]
センサー技術の限界は ワイルドファイアデータに ラベルの欠落をもたらします
新しい手法と非ラベルアルゴリズムP(ositive) U(ccurrence) M(agnitude) M(ixture)を開発し、陽性サンプルの発生と検出の可能性を共同で推定します。
論文 参考訳(メタデータ) (2021-03-25T01:43:33Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。