論文の概要: On pseudo-absence generation and machine learning for locust breeding
ground prediction in Africa
- arxiv url: http://arxiv.org/abs/2111.03904v1
- Date: Sat, 6 Nov 2021 15:29:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 11:36:36.942968
- Title: On pseudo-absence generation and machine learning for locust breeding
ground prediction in Africa
- Title(参考訳): アフリカにおけるロカスト繁殖地予測のための疑似吸収生成と機械学習について
- Authors: Ibrahim Salihu Yusuf, Kale-ab Tessera, Thomas Tumiel, Sella Nevo, Arnu
Pretorius
- Abstract要約: 機械学習(ML)はロカスト分布モデリングの効果的なアプローチとして実証されてきた。
一般に公開されているロカストのラベル付きデータは存在のみのデータであり、ロカストの目撃のみが記録されている。
MLを用いた以前の研究は、この問題を回避する手段として擬似存在生成手法に頼っていた。
- 参考スコア(独自算出の注目度): 3.589700400208312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Desert locust outbreaks threaten the food security of a large part of Africa
and have affected the livelihoods of millions of people over the years. Machine
learning (ML) has been demonstrated as an effective approach to locust
distribution modelling which could assist in early warning. ML requires a
significant amount of labelled data to train. Most publicly available labelled
data on locusts are presence-only data, where only the sightings of locusts
being present at a location are recorded. Therefore, prior work using ML have
resorted to pseudo-absence generation methods as a way to circumvent this
issue. The most commonly used approach is to randomly sample points in a region
of interest while ensuring that these sampled pseudo-absence points are at
least a specific distance away from true presence points. In this paper, we
compare this random sampling approach to more advanced pseudo-absence
generation methods, such as environmental profiling and optimal background
extent limitation, specifically for predicting desert locust breeding grounds
in Africa. Interestingly, we find that for the algorithms we tested, namely
logistic regression, gradient boosting, random forests and maximum entropy, all
popular in prior work, the logistic model performed significantly better than
the more sophisticated ensemble methods, both in terms of prediction accuracy
and F1 score. Although background extent limitation combined with random
sampling boosted performance for ensemble methods, for LR this was not the
case, and instead, a significant improvement was obtained when using
environmental profiling. In light of this, we conclude that a simpler ML
approach such as logistic regression combined with more advanced pseudo-absence
generation, specifically environmental profiling, can be a sensible and
effective approach to predicting locust breeding grounds across Africa.
- Abstract(参考訳): 砂漠で発生したロカストはアフリカの大部分の食料安全保障を脅かし、長年にわたって何百万人もの人々の生活に影響を与えてきた。
機械学習(ML)は、早期警告に役立つロカスト分布モデリングの効果的なアプローチとして実証されている。
MLはトレーニングに大量のラベル付きデータを必要とする。
ロカストに関する公に入手可能なラベル付きデータは存在のみのデータであり、場所に存在するロカストの目撃のみを記録する。
そのため、MLを用いた先行研究では、この問題を回避する手段として擬似存在生成方式が採用されている。
最も一般的に用いられるアプローチは、興味のある領域内の点をランダムにサンプリングし、これらのサンプルされた擬似抽象点が、真の存在点から少なくとも特定の距離にあることを保証することである。
本稿では,このランダムサンプリング手法を環境プロファイリングや最適背景範囲制限などのより高度な擬似吸収生成手法と比較し,特にアフリカにおける砂漠のロカスト繁殖地の推定について述べる。
興味深いことに、ロジスティック回帰、勾配上昇、ランダム森林、最大エントロピーといったアルゴリズムを検証したところ、ロジスティックモデルは予測精度とF1スコアの両面で、より洗練されたアンサンブル法よりもはるかに優れていることがわかった。
ランダムサンプリングと組み合わせた背景範囲制限によりアンサンブル法の性能は向上したが, LRではそうではなく, 環境プロファイリングでは顕著な改善が得られた。
これを踏まえて,ロジスティック回帰(ロジスティック回帰)やより高度な擬似吸収生成(特に環境プロファイリング)といったより単純なmlアプローチは,アフリカ全域におけるロジスティック育種グラウンドの予測に合理的かつ効果的なアプローチとなると結論づける。
関連論文リスト
- Robust Unsupervised Crowd Counting and Localization with Adaptive
Resolution SAM [61.10712338956455]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Distribution-Free Conformal Joint Prediction Regions for Neural Marked
Temporal Point Processes [4.724576834458051]
我々は、共形予測の枠組みを用いて、ニューラルTPPモデルにおける不確実性に対するより信頼性の高い手法を開発した。
主な目的は、有限サンプルの限界被覆を保証するとともに、到着時刻とマークのための分布自由な共同予測領域を生成することである。
論文 参考訳(メタデータ) (2024-01-09T15:28:29Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Random Forest Weighted Local Fr\'echet Regression with Random Objects [52.25304029942005]
本稿では,新しいランダム森林重み付き局所Fr'echet回帰パラダイムを提案する。
最初の方法は,これらの重みを局所平均として利用し,条件付きFr'echet平均を解く。
第二の手法は局所線形Fr'echet回帰を行い、どちらも既存のFr'echet回帰法を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-10T09:10:59Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Prediction in the presence of response-dependent missing labels [28.932172873182115]
センサー技術の限界は ワイルドファイアデータに ラベルの欠落をもたらします
新しい手法と非ラベルアルゴリズムP(ositive) U(ccurrence) M(agnitude) M(ixture)を開発し、陽性サンプルの発生と検出の可能性を共同で推定します。
論文 参考訳(メタデータ) (2021-03-25T01:43:33Z) - Gaussian Process Nowcasting: Application to COVID-19 Mortality Reporting [2.8712862578745018]
計測過程の遅延による信号の観測の更新は、信号処理において一般的な問題である。
本稿では,報告時間遅延面に存在する自己相関構造の変化を記述可能な潜在ガウス過程を用いた柔軟なアプローチを提案する。
このアプローチは、現在予測されている死者数に対する不確実性の堅牢な推定も生み出す。
論文 参考訳(メタデータ) (2021-02-22T18:32:44Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。