論文の概要: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- arxiv url: http://arxiv.org/abs/2307.12594v1
- Date: Mon, 24 Jul 2023 08:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 15:12:46.146232
- Title: Optimized data collection and analysis process for studying
solar-thermal desalination by machine learning
- Title(参考訳): 機械学習による太陽熱脱塩研究のための最適データ収集と解析プロセス
- Authors: Guilong Peng, Senshan Sun, Yangjun Qin, Zhenwei Xu, Juxin Du, Swellam
W. sharshir, A.W. Kandel, A.E. Kabeel, Nuo Yang
- Abstract要約: 本研究は, 機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスの開発である。
提案手法では,1000以上のデータセットを収集し,従来の研究のデータセットの平均の10倍のデータを収集する。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An effective interdisciplinary study between machine learning and
solar-thermal desalination requires a sufficiently large and well-analyzed
experimental datasets. This study develops a modified dataset collection and
analysis process for studying solar-thermal desalination by machine learning.
Based on the optimized water condensation and collection process, the proposed
experimental method collects over one thousand datasets, which is ten times
more than the average number of datasets in previous works, by accelerating
data collection and reducing the time by 83.3%. On the other hand, the effects
of dataset features are investigated by using three different algorithms,
including artificial neural networks, multiple linear regressions, and random
forests. The investigation focuses on the effects of dataset size and range on
prediction accuracy, factor importance ranking, and the model's generalization
ability. The results demonstrate that a larger dataset can significantly
improve prediction accuracy when using artificial neural networks and random
forests. Additionally, the study highlights the significant impact of dataset
size and range on ranking the importance of influence factors. Furthermore, the
study reveals that the extrapolation data range significantly affects the
extrapolation accuracy of artificial neural networks. Based on the results,
massive dataset collection and analysis of dataset feature effects are
important steps in an effective and consistent machine learning process flow
for solar-thermal desalination, which can promote machine learning as a more
general tool in the field of solar-thermal desalination.
- Abstract(参考訳): 機械学習と太陽熱脱塩の効果的な学際研究には、十分に大きくよく分析された実験データセットが必要である。
本研究は,機械学習による太陽熱脱塩研究のためのデータセット収集と解析プロセスを開発する。
最適化された集水・集水プロセスに基づいて,提案手法は,データ収集を高速化し,83.3%の時間を短縮することにより,従来の研究における平均データセットの10倍のデータセットを収集する。
一方, ニューラルネットワーク, 複数の線形回帰, ランダムフォレストを含む3つの異なるアルゴリズムを用いて, データセットの特徴の影響について検討した。
この調査は、データセットのサイズと範囲が予測精度、因子重要度ランキング、モデルの一般化能力に与える影響に焦点を当てた。
その結果,ニューラルネットワークやランダムフォレストを用いた場合,データセットが大きくなると予測精度が大幅に向上することが示された。
さらに、この研究はデータセットのサイズと範囲が影響要因の重要性のランキングに与える影響を強調している。
さらに,外挿データ範囲がニューラルネットワークの外挿精度に大きく影響することを明らかにした。
これらの結果に基づき、太陽熱淡水化の分野で機械学習をより一般的なツールとして促進することのできる、太陽熱淡水化のための効果的で一貫した機械学習プロセスフローにおいて、データセットの収集とデータセット特徴効果の分析が重要なステップである。
関連論文リスト
- Enhancing Multivariate Time Series-based Solar Flare Prediction with Multifaceted Preprocessing and Contrastive Learning [0.9374652839580181]
正確な太陽フレア予測は、宇宙飛行士、宇宙機器、衛星通信システムに強い太陽フレアがもたらす重大なリスクのために重要である。
本研究は、先進的なデータ前処理と分類手法を利用して、太陽フレア予測を強化する。
論文 参考訳(メタデータ) (2024-09-21T05:00:34Z) - Toward data-driven research: preliminary study to predict surface roughness in material extrusion using previously published data with Machine Learning [4.589830030258457]
本研究の目的は, 材料押出時の表面粗さを最適化するための大規模な実験プログラムの使用を避けることである。
提案手法は機械学習モデルを利用して表面粗さを自動的に予測する。
論文 参考訳(メタデータ) (2024-06-20T16:40:55Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - Spatiotemporal Transformer for Imputing Sparse Data: A Deep Learning
Approach [19.665820528292798]
本稿では,スパースデータセットの欠落値問題に対処するため,新しいStemporal Transformerモデル(ST-Transformer)を提案する。
このモデルは、自制的なアプローチでトレーニングされており、観察されたデータポイントから欠落した値を自律的に予測することができる。
その効果は、テキサス州の36km×36kmグリッド上のSMAP 1土壌水分データに適用することで実証される。
論文 参考訳(メタデータ) (2023-12-01T22:39:02Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation [96.92250565207017]
本研究では,データセット蒸留作業におけるデータ効率と選択について検討する。
蒸留の力学を再現することにより、実際のデータセットに固有の冗長性についての洞察を提供する。
蒸留における因果関係から最も寄与した試料を見出した。
論文 参考訳(メタデータ) (2023-05-28T06:53:41Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - LiDAR dataset distillation within bayesian active learning framework:
Understanding the effect of data augmentation [63.20765930558542]
アクティブラーニング(AL)は、アノテーションコストとデータセットサイズの削減に対処するため、最近再び注目されている。
本稿では,大規模なセマンティックKITTIデータセットの1/4分の1でALベースのデータセット蒸留を原理的に評価する。
我々は、選択したデータセット構成からのサンプルの60%のみを使用して、データ拡張が完全なデータセット精度を達成することを観察した。
論文 参考訳(メタデータ) (2022-02-06T00:04:21Z) - Short-term forecasting of global solar irradiance with incomplete data [0.0]
本研究は、日射量と日射量の1日前予測のためのパイプラインを導入する。
自動回帰統合型移動平均(ARIMA)、単層フィードフォワードネットワーク(SL-FNN)、複数層フィードフォワードネットワーク(FL-FNN)、長短期メモリ(LSTM)の4つの手法を検討する。
実験は、成野-コロンビアにある12の自動気象観測所(AWS)で収集された実世界のデータセットで実施される。
論文 参考訳(メタデータ) (2021-06-12T21:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。