論文の概要: Re-experiment Smart: a Novel Method to Enhance Data-driven Prediction of Mechanical Properties of Epoxy Polymers
- arxiv url: http://arxiv.org/abs/2506.01994v1
- Date: Mon, 19 May 2025 04:42:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-08 12:40:08.668443
- Title: Re-experiment Smart: a Novel Method to Enhance Data-driven Prediction of Mechanical Properties of Epoxy Polymers
- Title(参考訳): Re-experiment Smart:エポキシポリマーの機械的特性をデータ駆動で予測する新しい手法
- Authors: Wanshan Cui, Yejin Jeong, Inwook Song, Gyuri Kim, Minsang Kwon, Donghun Lee,
- Abstract要約: 本稿では, 信頼性の低い外乱ケースを選択的に再実験することで, データセット品質を効率的に向上する手法を提案する。
提案手法は, 予測誤差(RMSE)を確実に低減し, 最小限の実験作業で精度を向上し, 再測定に必要なデータセットの約5%しか必要としない。
- 参考スコア(独自算出の注目度): 2.1389836877212347
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of polymer material properties through data-driven approaches greatly accelerates novel material development by reducing redundant experiments and trial-and-error processes. However, inevitable outliers in empirical measurements can severely skew machine learning results, leading to erroneous prediction models and suboptimal material designs. To address this limitation, we propose a novel approach to enhance dataset quality efficiently by integrating multi-algorithm outlier detection with selective re-experimentation of unreliable outlier cases. To validate the empirical effectiveness of the approach, we systematically construct a new dataset containing 701 measurements of three key mechanical properties: glass transition temperature ($T_g$), tan $\delta$ peak, and crosslinking density ($v_{c}$). To demonstrate its general applicability, we report the performance improvements across multiple machine learning models, including Elastic Net, SVR, Random Forest, and TPOT, to predict the three key properties. Our method reliably reduces prediction error (RMSE) and significantly improves accuracy with minimal additional experimental work, requiring only about 5% of the dataset to be re-measured.These findings highlight the importance of data quality enhancement in achieving reliable machine learning applications in polymer science and present a scalable strategy for improving predictive reliability in materials science.
- Abstract(参考訳): データ駆動型アプローチによるポリマー材料特性の正確な予測は、冗長な実験と試行錯誤プロセスを減らし、新しい材料開発を大幅に加速する。
しかし、経験的測定における避けられないアウトリーチは、機械学習の結果を著しく歪め、誤った予測モデルや準最適材料設計につながる。
この制限に対処するために,マルチアルゴリズム・アウトレイラ検出と信頼できないアウトレイラの選択的再実験を統合することにより,データセット品質を効率的に向上する手法を提案する。
提案手法の有効性を検証するため, ガラス転移温度(T_g$), tan $\delta$ peak, 架橋密度(v_{c}$)の3つの重要な力学特性の測定値を含む新たなデータセットを体系的に構築した。
汎用性を示すために,Elastic Net,SVR,Random Forest,TPOTなど,複数の機械学習モデルにまたがるパフォーマンス改善について報告する。
本手法は, 予測誤差(RMSE)を確実に低減し, 最小限の実験作業で精度を向上し, 再測定に必要なデータセットの約5%しか必要とせず, 高分子科学における信頼性の高い機械学習アプリケーションの実現におけるデータ品質向上の重要性を強調し, 材料科学における予測信頼性向上のためのスケーラブルな戦略を示す。
関連論文リスト
- Data-driven tool wear prediction in milling, based on a process-integrated single-sensor approach [1.6574413179773764]
本研究では,ツール摩耗予測のためのデータ駆動手法,特にディープラーニングについて検討する。
2つのプロセスで検証された最小限のトレーニングデータを用いて予測モデルの伝達可能性について検討した。
ConvNeXtモデルには例外的な性能があり、ツールの摩耗を識別する精度は99.1%である。
論文 参考訳(メタデータ) (2024-12-27T23:10:32Z) - Transfer Learning for Deep Learning-based Prediction of Lattice Thermal Conductivity [0.0]
深層学習モデル(ParAIsite)の精度と一般化性に及ぼす伝達学習の影響について検討する。
格子熱伝導率(LTC)の低品質近似の大規模なデータセット上で、初めて微調整を行うと、さらに改善が得られた。
有望な結果は、低熱伝導率材料を探索する大きなデータベースを探索する能力を高めるための道を開く。
論文 参考訳(メタデータ) (2024-11-27T11:57:58Z) - An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.517043342442487]
深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文 参考訳(メタデータ) (2024-10-24T18:15:48Z) - Learning Long-Horizon Predictions for Quadrotor Dynamics [48.08477275522024]
四元数に対する長軸予測力学を効率的に学習するための鍵となる設計選択について検討する。
逐次モデリング手法は,他のタイプの手法と比較して,合成誤差を最小限に抑える上での優位性を示す。
本稿では,モジュール性の向上を図りながら,学習プロセスをさらに単純化する,疎結合な動的学習手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T19:06:47Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。