論文の概要: Coastal water quality prediction based on machine learning with feature
interpretation and spatio-temporal analysis
- arxiv url: http://arxiv.org/abs/2107.03230v1
- Date: Wed, 7 Jul 2021 14:00:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-08 14:10:47.724514
- Title: Coastal water quality prediction based on machine learning with feature
interpretation and spatio-temporal analysis
- Title(参考訳): 特徴解釈と時空間解析を用いた機械学習に基づく沿岸水質予測
- Authors: Luka Grb\v{c}i\'c, Sini\v{s}a Dru\v{z}eta, Goran Mau\v{s}a, Tomislav
Lipi\'c, Darija Vuki\'c Lu\v{s}i\'c, Marta Alvir, Ivana Lu\v{c}in, Ante
Sikirica, Davor Davidovi\'c, Vanja Trava\v{s}, Daniela Kalafatovi\'c,
Kristina Pikelj, Hana Fajkovi\'c and Lado Kranj\v{c}evi\'c
- Abstract要約: 沿岸の水質が低ければ、人間の健康にとって危険な病原体を収容できる。
クロアチアのリェカにある15の公共ビーチにまたがる、Escherichia Coli$とEnterococciのルーチンモニタリングデータを使用して、機械学習モデルを構築した。
Catboostアルゴリズムは、E. Coli$とEnterococciを予測するために、R$2$の0.71と0.68で最善を尽くした。
- 参考スコア(独自算出の注目度): 1.1373985359658554
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Coastal water quality management is a public health concern, as poor coastal
water quality can harbor pathogens that are dangerous to human health.
Tourism-oriented countries need to actively monitor the condition of coastal
water at tourist popular sites during the summer season. In this study, routine
monitoring data of $Escherichia\ Coli$ and enterococci across 15 public beaches
in the city of Rijeka, Croatia, were used to build machine learning models for
predicting their levels based on environmental parameters as well as to
investigate their relationships with environmental stressors. Gradient Boosting
(Catboost, Xgboost), Random Forests, Support Vector Regression and Artificial
Neural Networks were trained with measurements from all sampling sites and used
to predict $E.\ Coli$ and enterococci values based on environmental features.
The evaluation of stability and generalizability with 10-fold cross validation
analysis of the machine learning models, showed that the Catboost algorithm
performed best with R$^2$ values of 0.71 and 0.68 for predicting $E.\ Coli$ and
enterococci, respectively, compared to other evaluated ML algorithms including
Xgboost, Random Forests, Support Vector Regression and Artificial Neural
Networks. We also use the SHapley Additive exPlanations technique to identify
and interpret which features have the most predictive power. The results show
that site salinity measured is the most important feature for forecasting both
$E.\ Coli$ and enterococci levels. Finally, the spatial and temporal accuracy
of both ML models were examined at sites with the lowest coastal water quality.
The spatial $E. Coli$ and enterococci models achieved strong R$^2$ values of
0.85 and 0.83, while the temporal models achieved R$^2$ values of 0.74 and
0.67. The temporal model also achieved moderate R$^2$ values of 0.44 and 0.46
at a site with high coastal water quality.
- Abstract(参考訳): 沿岸水質管理は公衆衛生上の問題であり、沿岸水質の悪化は人の健康に危険である病原体を収容することができる。
観光志向の国は、夏季の観光名所で沿岸水の状態を積極的に監視する必要がある。
本研究では,クロアチアのリイェカ市にある15か所の公衆ビーチを対象に,escherichia\ coli$とenterococciの定期的モニタリングデータを用いて,環境パラメータに基づいてレベルを予測する機械学習モデルを構築し,環境ストレスとの関連性について検討した。
勾配ブースティング (catboost, xgboost) , ランダム林, サポートベクター回帰, 人工ニューラルネットを全てのサンプリングサイトから測定し, 環境特性に基づくe.\ coli$およびenterococci値の予測に用いた。
機械学習モデルの10倍クロスバリデーション解析による安定性と一般化性の評価は,xgboost,ランダムフォレスト,サポートベクター回帰,ニューラルネットワークなど他の評価mlアルゴリズムと比較して,それぞれ0.71,0.68のr$^2$値で最高性能を示した。
また、SHapley Additive exPlanations技術を用いて、最も予測力のある特徴を特定し、解釈する。
その結果, 塩分濃度はE.\ Coli$ と enterococci の両方を推定する上で最も重要な特徴であることがわかった。
最後に, 沿岸水質の低い地点において, 両方のMLモデルの空間的および時間的精度について検討した。
スペースは$e。
Coli$およびEnterococciモデルは0.85および0.83の強いR$^2$値、時間モデルは0.74および0.67のR$^2$値を得た。
また, 沿岸水質の高い地点では, 適度なR$^2$値0.44および0.46を達成した。
関連論文リスト
- Long-term drought prediction using deep neural networks based on
geospatial weather data [78.63225885697149]
農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
多様な時間的ニューラルネットワークモデルを用いたエンドツーエンドアプローチを導入することで、干ばつデータに対処する。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文 参考訳(メタデータ) (2023-09-12T13:28:06Z) - Learning Regionalization within a Differentiable High-Resolution
Hydrological Model using Accurate Spatial Cost Gradients [0.0]
未タグ漁獲物における空間分布水文パラメータの推定は, 地域化の問題を引き起こす。
本稿では,HDA-PR(Hybrid Data Assimilation and Regionalization)アプローチを提案する。
フランスの南方に位置する2つのフラッシュフロード・プロン地域の高分解能、時間、およびキロメートルの地域モデルで試験されている。
論文 参考訳(メタデータ) (2023-08-02T07:23:50Z) - Short-term prediction of stream turbidity using surrogate data and a
meta-model approach [0.0]
本研究では,動的回帰(ARIMA),長期記憶ニューラルネット(LSTM),一般化付加モデル(GAM)を構築・比較し,ストリームの濁度を予測する。
我々は,異なる時間点における各モデルの強みを生かし,その長所を生かしたメタモデルを構築した。
以上の結果から,例えば水中照度などの温度および光関連変数は,費用対効果の高い濁度サロゲートとして期待できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-10-11T23:05:32Z) - Physics-informed machine learning with differentiable programming for
heterogeneous underground reservoir pressure management [64.17887333976593]
地下貯水池の過圧化を避けることは、CO2の沈殿や排水の注入といった用途に欠かせない。
地中における複雑な不均一性のため, 噴射・抽出制御による圧力管理は困難である。
過圧化防止のための流体抽出速度を決定するために、フル物理モデルと機械学習を用いた微分可能プログラミングを用いる。
論文 参考訳(メタデータ) (2022-06-21T20:38:13Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Test-time Batch Statistics Calibration for Covariate Shift [66.7044675981449]
我々は,推論中に深層モデルを新しい環境に適応させることを提案する。
バッチ統計の校正に$alpha$-BNの一般的な定式化を提案する。
また、統合テスト時間適応フレームワークCoreを形成するための新しい損失関数も提示する。
論文 参考訳(メタデータ) (2021-10-06T08:45:03Z) - Artificial Intelligence Hybrid Deep Learning Model for Groundwater Level
Prediction Using MLP-ADAM [0.0]
本稿では,多層パーセプトロンを用いて地下水位をシミュレーションする。
この問題には適応モーメント推定アルゴリズムも用いられる。
その結果,ディープラーニングアルゴリズムは高精度な予測が可能であることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T10:11:45Z) - Instance Segmentation of Microscopic Foraminifera [0.0629976670819788]
本稿では, 深層学習に基づくインスタンス分割モデルを用いて, 微視的フォアミニフェラの分類, 検出, セグメンテーションを行う。
本モデルは,COCO検出データセットから得られたモデル重みパラメータを用いて,Mask R-CNNアーキテクチャに基づく。
論文 参考訳(メタデータ) (2021-05-15T10:46:22Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z) - Statistical Downscaling of Temperature Distributions from the Synoptic
Scale to the Mesoscale Using Deep Convolutional Neural Networks [0.0]
有望な応用の1つは、低分解能ダイナミックモデルの出力画像を高分解能画像に変換する統計的代理モデルを開発することである。
本研究では,6時間毎に合成温度場をメソスケール温度場にダウンスケールする代理モデルについて検討した。
代理モデルが短時間で実施されれば、高解像度の天気予報ガイダンスや環境緊急警報を低コストで提供する。
論文 参考訳(メタデータ) (2020-07-20T06:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。