論文の概要: A Machine Learning Framework for Handling Unreliable Absence Label and Class Imbalance for Marine Stinger Beaching Prediction
- arxiv url: http://arxiv.org/abs/2501.11293v1
- Date: Mon, 20 Jan 2025 06:28:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:26:36.021521
- Title: A Machine Learning Framework for Handling Unreliable Absence Label and Class Imbalance for Marine Stinger Beaching Prediction
- Title(参考訳): マリンスティンガービーチ予測のための信頼性の低いラベルとクラス不均衡を扱う機械学習フレームワーク
- Authors: Amuche Ibenegbu, Amandine Schaeffer, Pierre Lafaye de Micheaux, Rohitash Chandra,
- Abstract要約: ブルーボトル(英: Bluebottles、textitPhysalia spp.)は、オーストラリアの海岸に生息するクラゲに似た海産の刺し傷である。
オーストラリア・シドニー東部の海浜から得られたブルーボトル海洋スティンガーの存在/存在データを用いて機械学習モデルを比較し,その存在に影響を与える要因を同定する。
- 参考スコア(独自算出の注目度): 0.15833270109954137
- License:
- Abstract: Bluebottles (\textit{Physalia} spp.) are marine stingers resembling jellyfish, whose presence on Australian beaches poses a significant public risk due to their venomous nature. Understanding the environmental factors driving bluebottles ashore is crucial for mitigating their impact, and machine learning tools are to date relatively unexplored. We use bluebottle marine stinger presence/absence data from beaches in Eastern Sydney, Australia, and compare machine learning models (Multilayer Perceptron, Random Forest, and XGBoost) to identify factors influencing their presence. We address challenges such as class imbalance, class overlap, and unreliable absence data by employing data augmentation techniques, including the Synthetic Minority Oversampling Technique (SMOTE), Random Undersampling, and Synthetic Negative Approach that excludes the negative class. Our results show that SMOTE failed to resolve class overlap, but the presence-focused approach effectively handled imbalance, class overlap, and ambiguous absence data. The data attributes such as the wind direction, which is a circular variable, emerged as a key factor influencing bluebottle presence, confirming previous inference studies. However, in the absence of population dynamics, biological behaviours, and life cycles, the best predictive model appears to be Random Forests combined with Synthetic Negative Approach. This research contributes to mitigating the risks posed by bluebottles to beachgoers and provides insights into handling class overlap and unreliable negative class in environmental modelling.
- Abstract(参考訳): Bluebottles (\textit{Physalia} spp。
) オーストラリアの海岸に生息するクラゲに類似した海産刺殺虫類で, 毒素の性質上, 公衆のリスクが高い。
ブルーボトルを岸で駆動する環境要因を理解することは、その影響を緩和するために不可欠であり、機械学習ツールは現在、比較的未調査である。
オーストラリア・シドニー東部の海浜におけるブルーボトル海産スティンガーの存在/存在データを用いて機械学習モデル(Multilayer Perceptron, Random Forest, XGBoost)を比較し,その存在に影響を及ぼす要因を同定した。
本稿では,SMOTE(Synthetic Minority Oversampling Technique)やRandom Undersampling(Random Undersampling),Synthetic Negative Approach(Synthetic Negative Approach)などのデータ拡張手法を用いて,クラス不均衡やクラス重複,信頼できない不在データといった課題に対処する。
以上の結果から,SMOTEはクラス重複の解消に失敗したが,非バランス,クラス重複,不明瞭な不在データを効果的に処理した。
風向などのデータ特性は, ブルーボトルの存在に影響を及ぼす重要な要因として出現し, 過去の推測研究を裏付けた。
しかし、人口動態、生物学的行動、ライフサイクルの欠如により、最良の予測モデルは、合成否定的アプローチと組み合わせたランダムフォレストである。
本研究は, ブルーボトルによるリスクの軽減に寄与し, 環境モデリングにおけるクラス重複と信頼できない負のクラスを扱うための洞察を提供する。
関連論文リスト
- Probabilistic Classification of Near-Surface Shallow-Water Sediments using A Portable Free-Fall Penetrometer [0.0]
本稿では,PFFP(ポータブルフリーフォールペネトロメータ)データに基づく土砂挙動分類システムを構築するために,機械学習アルゴリズムを用いた革新的な手法を提案する。
提案モデルでは,セキム湾(ワシントン),ポトマック川,ヨーク川(ヴァージニア)などの地点から得られたPFFP測定を利用した。
論文 参考訳(メタデータ) (2024-09-30T20:51:59Z) - Synthetic Tabular Data Generation for Class Imbalance and Fairness: A Comparative Study [4.420073761023326]
データ駆動性のため、機械学習(ML)モデルは、データから受け継がれたバイアスの影響を受けやすい。
クラス不均衡(分類対象)とグループ不均衡(性や人種のような保護された属性)はMLの有用性と公平性を損なう可能性がある。
本稿では、最先端モデルを用いて、クラスとグループの不均衡に対処する比較分析を行う。
論文 参考訳(メタデータ) (2024-09-08T20:08:09Z) - Fair Overlap Number of Balls (Fair-ONB): A Data-Morphology-based Undersampling Method for Bias Reduction [8.691440960669649]
信頼できる人工知能における分類問題に関する重要な問題の1つは、異なるクラスの予測において公平性を保証することである。
トレーニングデータのバイアスが機械学習に反映され、人間の生活に影響を与え、現在の規制に従わないため、これらのケースではデータ品質が重要になります。
本研究は,各データ群のデータ形態を利用したアンダーサンプリング手法であるフェアオーバーラップボール数(Fair-ONB)を提案する。
論文 参考訳(メタデータ) (2024-07-19T11:16:02Z) - Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Harmful algal bloom forecasting. A comparison between stream and batch
learning [0.7067443325368975]
有害なアルガルブルーム(HAB)は公衆衛生と貝類産業にリスクをもたらす。
本研究では,有毒なジノフラゲレートの細胞数を予測する機械学習ワークフローを開発した。
モデルDoMEは最も効果的で解釈可能な予測器として登場し、他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-02-20T15:01:11Z) - Learning with Imbalanced Noisy Data by Preventing Bias in Sample
Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。
不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T10:34:53Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Defending Black-box Skeleton-based Human Activity Classifiers [38.95979614080714]
本稿では,人骨をベースとした人間行動認識について検討する。これは時系列データの重要なタイプであるが,攻撃に対する防御には不十分である。
BEATは単純だがエレガントで、脆弱なブラックボックス分類器を精度を犠牲にすることなく堅牢なものにします。
論文 参考訳(メタデータ) (2022-03-09T13:46:10Z) - Harnessing Perceptual Adversarial Patches for Crowd Counting [92.79051296850405]
群衆のカウントは、物理的な世界の敵の例に弱い。
本稿では,モデル間での知覚的特徴の共有を学習するためのPAP(Perceptual Adrial Patch)生成フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-16T13:51:39Z) - Adversarial Self-Supervised Contrastive Learning [62.17538130778111]
既存の対数学習アプローチは、主にクラスラベルを使用して、誤った予測につながる対数サンプルを生成する。
本稿では,未ラベルデータに対する新たな逆攻撃を提案する。これにより,モデルが摂動データサンプルのインスタンスレベルのアイデンティティを混乱させる。
ラベル付きデータなしで頑健なニューラルネットワークを逆さまにトレーニングするための,自己教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-13T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。