論文の概要: Coastal water quality prediction based on machine learning with feature
interpretation and spatio-temporal analysis
- arxiv url: http://arxiv.org/abs/2107.03230v1
- Date: Wed, 7 Jul 2021 14:00:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-08 14:10:47.724514
- Title: Coastal water quality prediction based on machine learning with feature
interpretation and spatio-temporal analysis
- Title(参考訳): 特徴解釈と時空間解析を用いた機械学習に基づく沿岸水質予測
- Authors: Luka Grb\v{c}i\'c, Sini\v{s}a Dru\v{z}eta, Goran Mau\v{s}a, Tomislav
Lipi\'c, Darija Vuki\'c Lu\v{s}i\'c, Marta Alvir, Ivana Lu\v{c}in, Ante
Sikirica, Davor Davidovi\'c, Vanja Trava\v{s}, Daniela Kalafatovi\'c,
Kristina Pikelj, Hana Fajkovi\'c and Lado Kranj\v{c}evi\'c
- Abstract要約: 沿岸の水質が低ければ、人間の健康にとって危険な病原体を収容できる。
クロアチアのリェカにある15の公共ビーチにまたがる、Escherichia Coli$とEnterococciのルーチンモニタリングデータを使用して、機械学習モデルを構築した。
Catboostアルゴリズムは、E. Coli$とEnterococciを予測するために、R$2$の0.71と0.68で最善を尽くした。
- 参考スコア(独自算出の注目度): 1.1373985359658554
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Coastal water quality management is a public health concern, as poor coastal
water quality can harbor pathogens that are dangerous to human health.
Tourism-oriented countries need to actively monitor the condition of coastal
water at tourist popular sites during the summer season. In this study, routine
monitoring data of $Escherichia\ Coli$ and enterococci across 15 public beaches
in the city of Rijeka, Croatia, were used to build machine learning models for
predicting their levels based on environmental parameters as well as to
investigate their relationships with environmental stressors. Gradient Boosting
(Catboost, Xgboost), Random Forests, Support Vector Regression and Artificial
Neural Networks were trained with measurements from all sampling sites and used
to predict $E.\ Coli$ and enterococci values based on environmental features.
The evaluation of stability and generalizability with 10-fold cross validation
analysis of the machine learning models, showed that the Catboost algorithm
performed best with R$^2$ values of 0.71 and 0.68 for predicting $E.\ Coli$ and
enterococci, respectively, compared to other evaluated ML algorithms including
Xgboost, Random Forests, Support Vector Regression and Artificial Neural
Networks. We also use the SHapley Additive exPlanations technique to identify
and interpret which features have the most predictive power. The results show
that site salinity measured is the most important feature for forecasting both
$E.\ Coli$ and enterococci levels. Finally, the spatial and temporal accuracy
of both ML models were examined at sites with the lowest coastal water quality.
The spatial $E. Coli$ and enterococci models achieved strong R$^2$ values of
0.85 and 0.83, while the temporal models achieved R$^2$ values of 0.74 and
0.67. The temporal model also achieved moderate R$^2$ values of 0.44 and 0.46
at a site with high coastal water quality.
- Abstract(参考訳): 沿岸水質管理は公衆衛生上の問題であり、沿岸水質の悪化は人の健康に危険である病原体を収容することができる。
観光志向の国は、夏季の観光名所で沿岸水の状態を積極的に監視する必要がある。
本研究では,クロアチアのリイェカ市にある15か所の公衆ビーチを対象に,escherichia\ coli$とenterococciの定期的モニタリングデータを用いて,環境パラメータに基づいてレベルを予測する機械学習モデルを構築し,環境ストレスとの関連性について検討した。
勾配ブースティング (catboost, xgboost) , ランダム林, サポートベクター回帰, 人工ニューラルネットを全てのサンプリングサイトから測定し, 環境特性に基づくe.\ coli$およびenterococci値の予測に用いた。
機械学習モデルの10倍クロスバリデーション解析による安定性と一般化性の評価は,xgboost,ランダムフォレスト,サポートベクター回帰,ニューラルネットワークなど他の評価mlアルゴリズムと比較して,それぞれ0.71,0.68のr$^2$値で最高性能を示した。
また、SHapley Additive exPlanations技術を用いて、最も予測力のある特徴を特定し、解釈する。
その結果, 塩分濃度はE.\ Coli$ と enterococci の両方を推定する上で最も重要な特徴であることがわかった。
最後に, 沿岸水質の低い地点において, 両方のMLモデルの空間的および時間的精度について検討した。
スペースは$e。
Coli$およびEnterococciモデルは0.85および0.83の強いR$^2$値、時間モデルは0.74および0.67のR$^2$値を得た。
また, 沿岸水質の高い地点では, 適度なR$^2$値0.44および0.46を達成した。
関連論文リスト
- WaterQualityNeT: Prediction of Seasonal Water Quality of Nepal Using Hybrid Deep Learning Models [0.0]
本稿では,ネパールの季節的な水質を予測するためのハイブリッド深層学習モデルを提案する。
このモデルは、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)を統合し、データの時間的および空間的パターンを活用する。
論文 参考訳(メタデータ) (2024-09-17T05:26:59Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Residual Corrective Diffusion Modeling for Km-scale Atmospheric Downscaling [58.456404022536425]
気象・気候からの物理的危険予知技術の現状には、粗い解像度のグローバルな入力によって駆動される高価なkmスケールの数値シミュレーションが必要である。
ここでは、コスト効率のよい機械学習代替手段として、このようなグローバルな入力をkmスケールにダウンスケールするために、生成拡散アーキテクチャを探索する。
このモデルは、台湾上空の地域気象モデルから2kmのデータを予測するために訓練され、世界25kmの再解析に基づいている。
論文 参考訳(メタデータ) (2023-09-24T19:57:22Z) - Short-term prediction of stream turbidity using surrogate data and a
meta-model approach [0.0]
本研究では,動的回帰(ARIMA),長期記憶ニューラルネット(LSTM),一般化付加モデル(GAM)を構築・比較し,ストリームの濁度を予測する。
我々は,異なる時間点における各モデルの強みを生かし,その長所を生かしたメタモデルを構築した。
以上の結果から,例えば水中照度などの温度および光関連変数は,費用対効果の高い濁度サロゲートとして期待できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-10-11T23:05:32Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Test-time Batch Statistics Calibration for Covariate Shift [66.7044675981449]
我々は,推論中に深層モデルを新しい環境に適応させることを提案する。
バッチ統計の校正に$alpha$-BNの一般的な定式化を提案する。
また、統合テスト時間適応フレームワークCoreを形成するための新しい損失関数も提示する。
論文 参考訳(メタデータ) (2021-10-06T08:45:03Z) - Artificial Intelligence Hybrid Deep Learning Model for Groundwater Level
Prediction Using MLP-ADAM [0.0]
本稿では,多層パーセプトロンを用いて地下水位をシミュレーションする。
この問題には適応モーメント推定アルゴリズムも用いられる。
その結果,ディープラーニングアルゴリズムは高精度な予測が可能であることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T10:11:45Z) - Instance Segmentation of Microscopic Foraminifera [0.0629976670819788]
本稿では, 深層学習に基づくインスタンス分割モデルを用いて, 微視的フォアミニフェラの分類, 検出, セグメンテーションを行う。
本モデルは,COCO検出データセットから得られたモデル重みパラメータを用いて,Mask R-CNNアーキテクチャに基づく。
論文 参考訳(メタデータ) (2021-05-15T10:46:22Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z) - Statistical Downscaling of Temperature Distributions from the Synoptic
Scale to the Mesoscale Using Deep Convolutional Neural Networks [0.0]
有望な応用の1つは、低分解能ダイナミックモデルの出力画像を高分解能画像に変換する統計的代理モデルを開発することである。
本研究では,6時間毎に合成温度場をメソスケール温度場にダウンスケールする代理モデルについて検討した。
代理モデルが短時間で実施されれば、高解像度の天気予報ガイダンスや環境緊急警報を低コストで提供する。
論文 参考訳(メタデータ) (2020-07-20T06:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。