論文の概要: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- arxiv url: http://arxiv.org/abs/2307.12594v1
- Date: Mon, 24 Jul 2023 08:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 15:12:46.146232
- Title: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- Title(参考訳): 機械学習による太陽熱脱塩研究のための最適データ収集と解析プロセス
- Authors: Guilong Peng, Senshan Sun, Yangjun Qin, Zhenwei Xu, Juxin Du, Swellam
W. sharshir, A.W. Kandel, A.E. Kabeel, Nuo Yang
- Abstract要約: 本研究は, 機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスの開発である。
提案手法では,1000以上のデータセットを収集し,従来の研究のデータセットの平均の10倍のデータを収集する。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An effective interdisciplinary study between machine learning and
solar-thermal desalination requires a sufficiently large and well-analyzed
experimental datasets. This study develops a modified dataset collection and
analysis process for studying solar-thermal desalination by machine learning.
Based on the optimized water condensation and collection process, the proposed
experimental method collects over one thousand datasets, which is ten times
more than the average number of datasets in previous works, by accelerating
data collection and reducing the time by 83.3%. On the other hand, the effects
of dataset features are investigated by using three different algorithms,
including artificial neural networks, multiple linear regressions, and random
forests. The investigation focuses on the effects of dataset size and range on
prediction accuracy, factor importance ranking, and the model's generalization
ability. The results demonstrate that a larger dataset can significantly
improve prediction accuracy when using artificial neural networks and random
forests. Additionally, the study highlights the significant impact of dataset
size and range on ranking the importance of influence factors. Furthermore, the
study reveals that the extrapolation data range significantly affects the
extrapolation accuracy of artificial neural networks. Based on the results,
massive dataset collection and analysis of dataset feature effects are
important steps in an effective and consistent machine learning process flow
for solar-thermal desalination, which can promote machine learning as a more
general tool in the field of solar-thermal desalination.
- Abstract(参考訳): 機械学習と太陽熱脱塩の効果的な学際研究には、十分に大きくよく分析された実験データセットが必要である。
本研究は,機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスを開発する。
最適化された集水・集水プロセスに基づいて,提案手法は,データ収集を高速化し,83.3%の時間を短縮することにより,従来の研究における平均データセットの10倍のデータセットを収集する。
一方, ニューラルネットワーク, 複数の線形回帰, ランダムフォレストを含む3つの異なるアルゴリズムを用いて, データセットの特徴の影響について検討した。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
その結果,ニューラルネットワークやランダムフォレストを用いた場合,データセットが大きくなると予測精度が大幅に向上することが示された。
さらに、この研究はデータセットのサイズと範囲が影響要因の重要性のランキングに与える影響を強調している。
さらに,外挿データ範囲がニューラルネットワークの外挿精度に大きく影響することを明らかにした。
これらの結果に基づき、太陽熱淡水化の分野で機械学習をより一般的なツールとして促進することのできる、太陽熱淡水化のための効果的で一貫した機械学習プロセスフローにおいて、データセットの収集とデータセット特徴効果の分析が重要なステップである。
関連論文リスト
- Towards Data-Efficient Pretraining for Atomic Property Prediction [51.660835328611626]
タスク関連データセットでの事前トレーニングは、大規模な事前トレーニングと一致するか、あるいは超える可能性があることを示す。
本稿では,コンピュータビジョンのFr'echet Inception Distanceにインスパイアされた,化学類似度指数(CSI)を紹介する。
論文 参考訳(メタデータ) (2025-02-16T11:46:23Z) - Multi-modal Data Fusion and Deep Ensemble Learning for Accurate Crop Yield Prediction [0.0]
本研究では、収穫量を予測するために設計された新しいDeep EnsembleモデルであるRicEns-Netを紹介する。
この研究は、合成開口レーダ(SAR)の使用、センチネル1, 2, 3衛星からの光リモートセンシングデータ、表面温度や降雨などの気象測定に焦点を当てている。
主な目的は、複雑な環境データを扱うことができる機械学習フレームワークを開発することにより、収量予測の精度を高めることである。
論文 参考訳(メタデータ) (2025-02-09T22:48:27Z) - Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor [0.0]
ノルウェーのヴェアス処理施設にあるパイロット・リアクターのデータを用いて、生物学的硝酸塩の最適化に機械学習をどのように利用できるかを探る。
予測精度にのみ焦点をあてるのではなく、本手法は効果的なデータ駆動モデリングのための基礎的要件を理解することを優先する。
論文 参考訳(メタデータ) (2024-12-18T16:49:23Z) - Enhancing Multivariate Time Series-based Solar Flare Prediction with Multifaceted Preprocessing and Contrastive Learning [0.9374652839580181]
正確な太陽フレア予測は、宇宙飛行士、宇宙機器、衛星通信システムに強い太陽フレアがもたらす重大なリスクのために重要である。
本研究は、先進的なデータ前処理と分類手法を利用して、太陽フレア予測を強化する。
論文 参考訳(メタデータ) (2024-09-21T05:00:34Z) - Toward data-driven research: preliminary study to predict surface roughness in material extrusion using previously published data with Machine Learning [4.589830030258457]
本研究の目的は, 材料押出時の表面粗さを最適化するための大規模な実験プログラムの使用を避けることである。
提案手法は機械学習モデルを利用して表面粗さを自動的に予測する。
論文 参考訳(メタデータ) (2024-06-20T16:40:55Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation [96.92250565207017]
本研究では,データセット蒸留作業におけるデータ効率と選択について検討する。
蒸留の力学を再現することにより、実際のデータセットに固有の冗長性についての洞察を提供する。
蒸留における因果関係から最も寄与した試料を見出した。
論文 参考訳(メタデータ) (2023-05-28T06:53:41Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。