論文の概要: Optimal control towards sustainable wastewater treatment plants based on
multi-agent reinforcement learning
- arxiv url: http://arxiv.org/abs/2008.10417v3
- Date: Wed, 14 Apr 2021 08:04:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 12:36:46.723077
- Title: Optimal control towards sustainable wastewater treatment plants based on
multi-agent reinforcement learning
- Title(参考訳): マルチエージェント強化学習に基づく持続的排水処理プラントの最適制御
- Authors: Kehua Chen, Hongcheng Wang, Borja Valverde-Perezc, Siyuan Zhai, Luca
Vezzaro, Aijie Wang
- Abstract要約: 本研究は,WWTPにおける溶存酸素量と化学物質量を最適化するために,多エージェント深部強化学習という新しい手法を用いた。
その結果,LCAに基づく最適化は,ベースラインのシナリオに比べて環境への影響が低いことがわかった。
コスト指向制御戦略はLCA駆動戦略に匹敵する全体的な性能を示す。
- 参考スコア(独自算出の注目度): 1.0765359420035392
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Wastewater treatment plants are designed to eliminate pollutants and
alleviate environmental pollution. However, the construction and operation of
WWTPs consume resources, emit greenhouse gases (GHGs) and produce residual
sludge, thus require further optimization. WWTPs are complex to control and
optimize because of high nonlinearity and variation. This study used a novel
technique, multi-agent deep reinforcement learning, to simultaneously optimize
dissolved oxygen and chemical dosage in a WWTP. The reward function was
specially designed from life cycle perspective to achieve sustainable
optimization. Five scenarios were considered: baseline, three different
effluent quality and cost-oriented scenarios. The result shows that
optimization based on LCA has lower environmental impacts compared to baseline
scenario, as cost, energy consumption and greenhouse gas emissions reduce to
0.890 CNY/m3-ww, 0.530 kWh/m3-ww, 2.491 kg CO2-eq/m3-ww respectively. The
cost-oriented control strategy exhibits comparable overall performance to the
LCA driven strategy since it sacrifices environmental bene ts but has lower
cost as 0.873 CNY/m3-ww. It is worth mentioning that the retrofitting of WWTPs
based on resources should be implemented with the consideration of impact
transfer. Specifically, LCA SW scenario decreases 10 kg PO4-eq in
eutrophication potential compared to the baseline within 10 days, while
significantly increases other indicators. The major contributors of each
indicator are identified for future study and improvement. Last, the author
discussed that novel dynamic control strategies required advanced sensors or a
large amount of data, so the selection of control strategies should also
consider economic and ecological conditions.
- Abstract(参考訳): 排水処理プラントは汚染物質を除去し、環境汚染を軽減するように設計されている。
しかしながら、WWTPの建設と運用は資源を消費し、温室効果ガス(GHG)を放出し、残留汚泥を発生させるため、さらなる最適化が必要である。
WWTPは、高い非線形性と変動のために制御と最適化が複雑である。
本研究は,WWTPにおける溶存酸素量と化学量とを同時に最適化するために,多エージェント深部強化学習という新しい手法を用いた。
報酬関数は、持続的最適化を達成するためにライフサイクルの観点から特別に設計された。
5つのシナリオが考慮された。ベースライン、3つの異なる高品質とコスト指向のシナリオだ。
その結果,LCAによる最適化は,コスト,エネルギー消費,温室効果ガス排出量がそれぞれ0.890 CNY/m3-w,0.530 kWh/m3-w,2.491 kg CO2-eq/m3-wに減少するなど,基本シナリオに比べて環境への影響が低いことがわかった。
コスト指向制御戦略は環境ベネtsを犠牲にするが、0.873 cny/m3-wwよりも低価格であるため、lca駆動戦略に匹敵する全体的な性能を示す。
資源に基づくWWTPの再構成は, 影響伝達を考慮した実装が重要であることに留意すべきである。
特に、LCA SWシナリオは、10日以内にベースラインと比較して富栄養化電位の10kgPO4-eqを減少させ、他の指標を著しく増加させる。
各指標の主な貢献者は将来の研究と改善のために特定される。
最後に,新しい動的制御戦略では高度なセンサや大量のデータが必要であり,制御戦略の選択は経済的・生態的条件も考慮すべきである。
関連論文リスト
- Towards Optimal Environmental Policies: Policy Learning under Arbitrary Bipartite Network Interference [0.0]
石炭火力発電所への排出削減介入は、汚染に関連する健康負荷を減らすための効果があるがコストがかかる戦略であることが証明されている。
任意のネットワーク干渉(BNI)の下で最適ポリシーを決定するための新しい学習手法を提案する。
年間IHD入院率は1万人あたり20.66-44.51から、異なるコスト制約下での最適政策により減少する可能性がある。
論文 参考訳(メタデータ) (2024-10-10T20:39:53Z) - Impact of ML Optimization Tactics on Greener Pre-Trained ML Models [46.78148962732881]
本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。
画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。
動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
論文 参考訳(メタデータ) (2024-09-19T16:23:03Z) - EcoFollower: An Environment-Friendly Car Following Model Considering Fuel Consumption [9.42048156323799]
本研究では,自動車追従シナリオにおける燃料消費を最適化するために強化学習(RL)を用いて開発された新しいエコカー追従モデルであるEcoFollowerを紹介する。
このモデルは燃料消費を大幅に削減し、実際の運転シナリオと比較して10.42%削減した。
論文 参考訳(メタデータ) (2024-07-22T16:48:37Z) - Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages [56.98243487769916]
ニューラルネットワークが新しいデータで進化する能力である塑性は、高性能でサンプル効率のよい視覚強化学習に不可欠である。
本稿では,批評家の可塑性レベルに基づいてリプレイ率を動的に調整するAdaptive RRを提案する。
論文 参考訳(メタデータ) (2023-10-11T12:05:34Z) - Towards Green AI in Fine-tuning Large Language Models via Adaptive
Backpropagation [58.550710456745726]
ファインチューニングは、トレーニング済みの大規模言語モデル(LLM)を下流アプリケーションに適用する最も効果的な方法である。
既存の高速微調整技術は, FLOPの低減に限界がある。
本稿では,異なるテンソルのバックプロパゲーションコストを適応的に評価する新しい手法であるGreenTrainerについて述べる。
論文 参考訳(メタデータ) (2023-09-22T21:55:18Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - PLASTIC: Improving Input and Label Plasticity for Sample Efficient
Reinforcement Learning [54.409634256153154]
強化学習(RL)では, サンプル効率の向上が重要である。
原則として、非政治的なRLアルゴリズムは、環境相互作用毎に複数の更新を可能にすることで、サンプル効率を向上させることができる。
本研究は, この現象の原因を, 塑性を2つの側面に分けて検討した。
論文 参考訳(メタデータ) (2023-06-19T06:14:51Z) - Automated deep reinforcement learning for real-time scheduling strategy
of multi-energy system integrated with post-carbon and direct-air carbon
captured system [4.721325160754968]
CDRTの採用は、現在の炭素価格で経済的に不可能である。
提案したDRLエージェントは、プロシューマーの多エネルギー需要を満たすことができ、CDRTエネルギー需要を経済的にスケジュールすることができる。
PCCSと固体吸着DACSの構成が最も適していると考えられている。
論文 参考訳(メタデータ) (2023-01-18T20:22:44Z) - Federated Reinforcement Learning for Real-Time Electric Vehicle Charging
and Discharging Control [42.17503767317918]
本稿では、動的環境下で異なるEVユーザに対して最適なEV充電/放電制御戦略を開発する。
多様なユーザの行動や動的環境に適合する水平連合強化学習法(HFRL)を提案する。
シミュレーションの結果,提案したリアルタイムEV充電/放電制御戦略は,様々な要因において良好に機能することが示された。
論文 参考訳(メタデータ) (2022-10-04T08:22:46Z) - A deep reinforcement learning model for predictive maintenance planning
of road assets: Integrating LCA and LCCA [0.0]
本研究では,M&R実践のタイプとタイミングを決定するために,強化学習(RL)を用いたフレームワークを提案する。
その結果,道路条件が良好な条件域に留まる20年間のM&R計画が提案された。
意思決定者や交通機関は、このスキームを利用して、予算の無駄を防ぎ、環境への影響を最小限に抑える、より良いメンテナンスの実践を行うことができる。
論文 参考訳(メタデータ) (2021-12-20T13:46:39Z) - Estimating air quality co-benefits of energy transition using machine
learning [5.758035706324685]
大気質の改善から化石燃料の使用を減らすという健康上の利点を推定することは、二酸化炭素排出量の削減に重要な根拠となる。
本研究では, 高精度かつ堅牢な平均粒径(PM2.5)濃度推定が可能な, 高精度かつ簡潔な機械学習フレームワークを開発した。
本研究は, 炭素中性エネルギーシステムへの移行における費用対効果を最大化するために, 慎重な政策設計を促すものである。
論文 参考訳(メタデータ) (2021-05-29T14:52:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。