論文の概要: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- arxiv url: http://arxiv.org/abs/2307.12594v1
- Date: Mon, 24 Jul 2023 08:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 15:12:46.146232
- Title: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- Title(参考訳): 機械学習による太陽熱脱塩研究のための最適データ収集と解析プロセス
- Authors: Guilong Peng, Senshan Sun, Yangjun Qin, Zhenwei Xu, Juxin Du, Swellam
W. sharshir, A.W. Kandel, A.E. Kabeel, Nuo Yang
- Abstract要約: 本研究は, 機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスの開発である。
提案手法では,1000以上のデータセットを収集し,従来の研究のデータセットの平均の10倍のデータを収集する。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An effective interdisciplinary study between machine learning and
solar-thermal desalination requires a sufficiently large and well-analyzed
experimental datasets. This study develops a modified dataset collection and
analysis process for studying solar-thermal desalination by machine learning.
Based on the optimized water condensation and collection process, the proposed
experimental method collects over one thousand datasets, which is ten times
more than the average number of datasets in previous works, by accelerating
data collection and reducing the time by 83.3%. On the other hand, the effects
of dataset features are investigated by using three different algorithms,
including artificial neural networks, multiple linear regressions, and random
forests. The investigation focuses on the effects of dataset size and range on
prediction accuracy, factor importance ranking, and the model's generalization
ability. The results demonstrate that a larger dataset can significantly
improve prediction accuracy when using artificial neural networks and random
forests. Additionally, the study highlights the significant impact of dataset
size and range on ranking the importance of influence factors. Furthermore, the
study reveals that the extrapolation data range significantly affects the
extrapolation accuracy of artificial neural networks. Based on the results,
massive dataset collection and analysis of dataset feature effects are
important steps in an effective and consistent machine learning process flow
for solar-thermal desalination, which can promote machine learning as a more
general tool in the field of solar-thermal desalination.
- Abstract(参考訳): 機械学習と太陽熱脱塩の効果的な学際研究には、十分に大きくよく分析された実験データセットが必要である。
本研究は,機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスを開発する。
最適化された集水・集水プロセスに基づいて,提案手法は,データ収集を高速化し,83.3%の時間を短縮することにより,従来の研究における平均データセットの10倍のデータセットを収集する。
一方, ニューラルネットワーク, 複数の線形回帰, ランダムフォレストを含む3つの異なるアルゴリズムを用いて, データセットの特徴の影響について検討した。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
その結果,ニューラルネットワークやランダムフォレストを用いた場合,データセットが大きくなると予測精度が大幅に向上することが示された。
さらに、この研究はデータセットのサイズと範囲が影響要因の重要性のランキングに与える影響を強調している。
さらに,外挿データ範囲がニューラルネットワークの外挿精度に大きく影響することを明らかにした。
これらの結果に基づき、太陽熱淡水化の分野で機械学習をより一般的なツールとして促進することのできる、太陽熱淡水化のための効果的で一貫した機械学習プロセスフローにおいて、データセットの収集とデータセット特徴効果の分析が重要なステップである。
関連論文リスト
- Diffusion-based Neural Network Weights Generation [85.6725307453325]
データセット条件付き事前学習重み抽出による効率よく適応的な伝達学習手法を提案する。
具体的には、ニューラルネットワークの重みを再構築できる変分オートエンコーダを備えた潜時拡散モデルを用いる。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - Simulation-Enhanced Data Augmentation for Machine Learning Pathloss
Prediction [9.664420734674088]
本稿では,機械学習パスロス予測のための新しいシミュレーション強化データ拡張手法を提案する。
本手法は,細胞被覆シミュレータから生成した合成データと,独立して収集した実世界のデータセットを統合する。
合成データの統合は、異なる環境におけるモデルの一般化可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-02-03T00:38:08Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - D3A-TS: Denoising-Driven Data Augmentation in Time Series [0.0]
本研究は,分類と回帰問題に対する時系列におけるデータ拡張のための異なる手法の研究と分析に焦点をあてる。
提案手法は拡散確率モデルを用いており、近年画像処理の分野で成功している。
その結果、この手法が、分類と回帰モデルを訓練するための合成データを作成する上で、高い有用性を示している。
論文 参考訳(メタデータ) (2023-12-09T11:37:07Z) - Enhancing Petrophysical Studies with Machine Learning: A Field Case
Study on Permeability Prediction in Heterogeneous Reservoirs [0.0]
この研究では、ニューラルネットワーク(ANN)、ランダムフォレスト(RFC)、サポートベクトルマシン(SVM)の3つの機械学習アルゴリズムが採用された。
本研究の主な目的は,透過性予測における3つの機械学習アルゴリズムの有効性を比較し,最適予測法を決定することである。
この発見は貯水池のシミュレーションを改善し、より正確に将来の井戸を見つけるために使われる。
論文 参考訳(メタデータ) (2023-05-11T21:23:37Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文 参考訳(メタデータ) (2022-10-07T18:00:09Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Improving Classifier Training Efficiency for Automatic Cyberbullying
Detection with Feature Density [58.64907136562178]
言語支援の異なる特徴前処理手法を用いて特徴密度(FD)の有効性を検討した。
データセットの複雑さを推定することで、必要な実験の数を削減できると仮定する。
データセットの言語的複雑さの違いにより、言語的に支援された単語前処理の有効性を議論することが可能になる。
論文 参考訳(メタデータ) (2021-11-02T15:48:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。