論文の概要: Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor
- arxiv url: http://arxiv.org/abs/2412.14030v1
- Date: Wed, 18 Dec 2024 16:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 13:23:35.348685
- Title: Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor
- Title(参考訳): 廃水処理における機械学習--パイロット脱窒炉のモデル化から
- Authors: Eivind Bøhn, Sølve Eidnes, Kjell Rune Jonassen,
- Abstract要約: ノルウェーのヴェアス処理施設にあるパイロット・リアクターのデータを用いて、生物学的硝酸塩の最適化に機械学習をどのように利用できるかを探る。
予測精度にのみ焦点をあてるのではなく、本手法は効果的なデータ駆動モデリングのための基礎的要件を理解することを優先する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Wastewater treatment plants are increasingly recognized as promising candidates for machine learning applications, due to their societal importance and high availability of data. However, their varied designs, operational conditions, and influent characteristics hinder straightforward automation. In this study, we use data from a pilot reactor at the Veas treatment facility in Norway to explore how machine learning can be used to optimize biological nitrate ($\mathrm{NO_3^-}$) reduction to molecular nitrogen ($\mathrm{N_2}$) in the biogeochemical process known as \textit{denitrification}. Rather than focusing solely on predictive accuracy, our approach prioritizes understanding the foundational requirements for effective data-driven modelling of wastewater treatment. Specifically, we aim to identify which process parameters are most critical, the necessary data quantity and quality, how to structure data effectively, and what properties are required by the models. We find that nonlinear models perform best on the training and validation data sets, indicating nonlinear relationships to be learned, but linear models transfer better to the unseen test data, which comes later in time. The variable measuring the water temperature has a particularly detrimental effect on the models, owing to a significant change in distributions between training and test data. We therefore conclude that multiple years of data is necessary to learn robust machine learning models. By addressing foundational elements, particularly in the context of the climatic variability faced by northern regions, this work lays the groundwork for a more structured and tailored approach to machine learning for wastewater treatment. We share publicly both the data and code used to produce the results in the paper.
- Abstract(参考訳): 排水処理プラントは、社会的重要性とデータの高可用性のため、機械学習応用の有望な候補としてますます認識されている。
しかし、それらの様々な設計、運用条件、流動的な特徴は、簡単な自動化を妨げた。
本研究では,ノルウェーのヴェアス処理施設の試験炉から得られたデータを用いて,生物的な硝酸塩 (\mathrm{NO_3^-}$) を分子性窒素 (\mathrm{N_2}$) に還元する方法を探索する。
本研究は, 予測精度にのみ焦点をあてるのではなく, 排水処理の効率的なデータ駆動モデル構築のための基礎的要件の理解を優先する。
具体的には、どのプロセスパラメータが最も重要か、必要なデータ量と品質、効率的なデータ構成方法、モデルで要求される特性を識別することを目的としている。
非線形モデルは、学習すべき非線形関係を示すトレーニングデータセットと検証データセットで最善を尽くすが、線形モデルは未確認の試験データによく移行する。
水温を測定する変数は、トレーニングデータとテストデータの間の分布に大きな変化があるため、モデルに特に有害な影響を及ぼす。
したがって、堅牢な機械学習モデルを学ぶためには、何年にもわたってのデータが必要であると結論付けている。
基礎的要素、特に北部地域で直面している気候変動の文脈において、この研究は、排水処理のための機械学習へのより構造化された調整されたアプローチの土台となる。
論文で結果を生成するために使用されるデータとコードの両方を公開しています。
関連論文リスト
- Machine learning surrogates for efficient hydrologic modeling: Insights from stochastic simulations of managed aquifer recharge [0.0]
機械学習シュロゲートモデルが10%未満の絶対パーセンテージ誤差を達成可能であることを示す。
このワークフローを,将来的な管理帯水層帯水層における飽和地下水流動のシミュレーションに応用する。
MLサロゲートモデルは10%の平均的な絶対パーセンテージエラーと、高次実行時の保存を達成できる。
論文 参考訳(メタデータ) (2024-07-30T15:24:27Z) - A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.57464542357693]
実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。
Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。
データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文 参考訳(メタデータ) (2024-07-02T09:54:39Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - A Hybrid Approach of Transfer Learning and Physics-Informed Modeling:
Improving Dissolved Oxygen Concentration Prediction in an Industrial
Wastewater Treatment Plant [0.0]
目的は, 産業排水処理プラントの予測性能を, (i) プロセスの基盤となる物理を捉えたオープンソースのシミュレーションモデル, (ii) ノイズと限られたデータで特徴づけられるが, 同一の精製所にある別の産業プラント, (iii) の知識を伝達することによって向上することである。
その結果,テスト性能は27%,検証性能は59%に向上した。
論文 参考訳(メタデータ) (2024-01-20T11:53:08Z) - On the choice of training data for machine learning of geostrophic
mesoscale turbulence [0.34376560669160383]
データ」は、データ駆動手法において中心的な役割を果たすが、機械学習アルゴリズムの研究に焦点をあてることはあまりない。
横境界の存在下での回転成層乱流における渦-平均相互作用について考察する。
論文 参考訳(メタデータ) (2023-07-03T03:43:21Z) - Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation [96.92250565207017]
本研究では,データセット蒸留作業におけるデータ効率と選択について検討する。
蒸留の力学を再現することにより、実際のデータセットに固有の冗長性についての洞察を提供する。
蒸留における因果関係から最も寄与した試料を見出した。
論文 参考訳(メタデータ) (2023-05-28T06:53:41Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Size doesn't matter: predicting physico- or biochemical properties based
on dozens of molecules [0.0]
本論文は,データ不足を伴う対象特性のモデルの性能を著しく改善したことを示す。
また,データセット構成がモデル品質および結果モデルの適用性領域に及ぼす影響についても検討した。
論文 参考訳(メタデータ) (2021-07-22T18:57:24Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。