Fugu-MT 論文翻訳(概要): On pseudo-absence generation and machine learning for locust breeding ground prediction in Africa

論文の概要: On pseudo-absence generation and machine learning for locust breeding ground prediction in Africa

arxiv url: http://arxiv.org/abs/2111.03904v1
Date: Sat, 6 Nov 2021 15:29:16 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-10 11:36:36.942968
Title: On pseudo-absence generation and machine learning for locust breeding ground prediction in Africa
Title（参考訳）: アフリカにおけるロカスト繁殖地予測のための疑似吸収生成と機械学習について
Authors: Ibrahim Salihu Yusuf, Kale-ab Tessera, Thomas Tumiel, Sella Nevo, Arnu Pretorius
Abstract要約: 機械学習(ML)はロカスト分布モデリングの効果的なアプローチとして実証されてきた。一般に公開されているロカストのラベル付きデータは存在のみのデータであり、ロカストの目撃のみが記録されている。 MLを用いた以前の研究は、この問題を回避する手段として擬似存在生成手法に頼っていた。
参考スコア（独自算出の注目度）: 3.589700400208312
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Desert locust outbreaks threaten the food security of a large part of Africa and have affected the livelihoods of millions of people over the years. Machine learning (ML) has been demonstrated as an effective approach to locust distribution modelling which could assist in early warning. ML requires a significant amount of labelled data to train. Most publicly available labelled data on locusts are presence-only data, where only the sightings of locusts being present at a location are recorded. Therefore, prior work using ML have resorted to pseudo-absence generation methods as a way to circumvent this issue. The most commonly used approach is to randomly sample points in a region of interest while ensuring that these sampled pseudo-absence points are at least a specific distance away from true presence points. In this paper, we compare this random sampling approach to more advanced pseudo-absence generation methods, such as environmental profiling and optimal background extent limitation, specifically for predicting desert locust breeding grounds in Africa. Interestingly, we find that for the algorithms we tested, namely logistic regression, gradient boosting, random forests and maximum entropy, all popular in prior work, the logistic model performed significantly better than the more sophisticated ensemble methods, both in terms of prediction accuracy and F1 score. Although background extent limitation combined with random sampling boosted performance for ensemble methods, for LR this was not the case, and instead, a significant improvement was obtained when using environmental profiling. In light of this, we conclude that a simpler ML approach such as logistic regression combined with more advanced pseudo-absence generation, specifically environmental profiling, can be a sensible and effective approach to predicting locust breeding grounds across Africa.
Abstract（参考訳）: 砂漠で発生したロカストはアフリカの大部分の食料安全保障を脅かし、長年にわたって何百万人もの人々の生活に影響を与えてきた。機械学習(ML)は、早期警告に役立つロカスト分布モデリングの効果的なアプローチとして実証されている。 MLはトレーニングに大量のラベル付きデータを必要とする。ロカストに関する公に入手可能なラベル付きデータは存在のみのデータであり、場所に存在するロカストの目撃のみを記録する。そのため、MLを用いた先行研究では、この問題を回避する手段として擬似存在生成方式が採用されている。最も一般的に用いられるアプローチは、興味のある領域内の点をランダムにサンプリングし、これらのサンプルされた擬似抽象点が、真の存在点から少なくとも特定の距離にあることを保証することである。本稿では,このランダムサンプリング手法を環境プロファイリングや最適背景範囲制限などのより高度な擬似吸収生成手法と比較し,特にアフリカにおける砂漠のロカスト繁殖地の推定について述べる。興味深いことに、ロジスティック回帰、勾配上昇、ランダム森林、最大エントロピーといったアルゴリズムを検証したところ、ロジスティックモデルは予測精度とF1スコアの両面で、より洗練されたアンサンブル法よりもはるかに優れていることがわかった。ランダムサンプリングと組み合わせた背景範囲制限によりアンサンブル法の性能は向上したが, LRではそうではなく, 環境プロファイリングでは顕著な改善が得られた。これを踏まえて,ロジスティック回帰(ロジスティック回帰)やより高度な擬似吸収生成(特に環境プロファイリング)といったより単純なmlアプローチは,アフリカ全域におけるロジスティック育種グラウンドの予測に合理的かつ効果的なアプローチとなると結論づける。

関連論文リスト

Gap-K%: Measuring Top-1 Prediction Gap for Detecting Pretraining Data [6.612630497074871]
Gap-K%はLarge Language Models (LLMs) の最適化力学に基づく新しい事前学習データ検出法であるこれを受けてGap-K%は、トップ-1予測トークンとターゲットトークンのログ確率ギャップを利用して、局所相関とトークンレベルの変動を捉えるスライディングウィンドウ戦略を取り入れた。 WikiMIAとMIMIRベンチマークの実験は、Gap-K%が最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2026-01-16T07:29:36Z)
Inverse Reinforcement Learning for Minimum-Exposure Paths in Spatiotemporally Varying Scalar Fields [49.1574468325115]
このようなパスのトレーニングデータセットに類似した最小露出パスのデータセットを合成する問題を考える。本論文の主な貢献は、この問題を解決するための逆強化学習(IRL)モデルである。提案したIRLモデルは,トレーニングデータセットにない初期条件から経路を合成する際の優れた性能を提供する。
論文参考訳（メタデータ） (2025-03-09T13:30:11Z)
Unrolled denoising networks provably learn optimal Bayesian inference [54.79172096306631]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文参考訳（メタデータ） (2024-09-19T17:56:16Z)
Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文参考訳（メタデータ） (2024-09-10T07:34:19Z)
A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0]
本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文参考訳（メタデータ） (2024-09-03T08:01:01Z)
Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文参考訳（メタデータ） (2024-02-27T13:55:17Z)
Distribution-Free Conformal Joint Prediction Regions for Neural Marked Temporal Point Processes [4.324839843326325]
我々は、共形予測の枠組みを用いて、ニューラルTPPモデルにおける不確実性に対するより信頼性の高い手法を開発した。主な目的は、イベントの到着時刻とマークに対する分布自由な共同予測領域を生成し、有限サンプルの限界カバレッジを保証することである。
論文参考訳（メタデータ） (2024-01-09T15:28:29Z)
Generative models-based data labeling for deep networks regression: application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文参考訳（メタデータ） (2022-08-09T09:06:51Z)
Noise-Resistant Deep Metric Learning with Probabilistic Instance Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。 DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。 PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文参考訳（メタデータ） (2021-08-03T12:15:25Z)
Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文参考訳（メタデータ） (2021-07-05T12:44:39Z)
Prediction in the presence of response-dependent missing labels [28.932172873182115]
センサー技術の限界はワイルドファイアデータにラベルの欠落をもたらします新しい手法と非ラベルアルゴリズムP(ositive) U(ccurrence) M(agnitude) M(ixture)を開発し、陽性サンプルの発生と検出の可能性を共同で推定します。
論文参考訳（メタデータ） (2021-03-25T01:43:33Z)
Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。原理的に部分観測可能なベイズ的枠組みを提案する。
論文参考訳（メタデータ） (2020-09-12T20:37:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。