論文の概要: The Catechol Benchmark: Time-series Solvent Selection Data for Few-shot Machine Learning
- arxiv url: http://arxiv.org/abs/2506.07619v1
- Date: Mon, 09 Jun 2025 10:34:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.911718
- Title: The Catechol Benchmark: Time-series Solvent Selection Data for Few-shot Machine Learning
- Title(参考訳): Catecholベンチマーク: 少数の機械学習のための時系列ソリューション選択データ
- Authors: Toby Boyne, Juan S. Campos, Becky D. Langdon, Jixiang Qing, Yilin Xie, Shiqiang Zhang, Calvin Tsay, Ruth Misener, Daniel W. Davies, Kim E. Jelfs, Sarah Boyall, Thomas M. Dixon, Linden Schrecker, Jose Pablo Folch,
- Abstract要約: 我々は、機械学習ベンチマークのための最初の過渡フローデータセットを提供する、収差予測のための新しいデータセットを提案する。
以前のデータセットは離散パラメータに焦点を当てていましたが、実験的なセットアップによって、多数の継続的プロセス条件をサンプリングすることができます。
我々は,特に理論的にモデル化が難しい課題である溶媒選択に焦点をあてる。
- 参考スコア(独自算出の注目度): 4.864188241160383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has promised to change the landscape of laboratory chemistry, with impressive results in molecular property prediction and reaction retro-synthesis. However, chemical datasets are often inaccessible to the machine learning community as they tend to require cleaning, thorough understanding of the chemistry, or are simply not available. In this paper, we introduce a novel dataset for yield prediction, providing the first-ever transient flow dataset for machine learning benchmarking, covering over 1200 process conditions. While previous datasets focus on discrete parameters, our experimental set-up allow us to sample a large number of continuous process conditions, generating new challenges for machine learning models. We focus on solvent selection, a task that is particularly difficult to model theoretically and therefore ripe for machine learning applications. We showcase benchmarking for regression algorithms, transfer-learning approaches, feature engineering, and active learning, with important applications towards solvent replacement and sustainable manufacturing.
- Abstract(参考訳): 機械学習は、分子特性予測と反応レトロ合成において印象的な結果をもたらす、実験室化学の風景を変えることを約束している。
しかし、化学データセットは、クリーニングや化学の徹底的な理解を必要とする傾向にあるため、機械学習コミュニティにはアクセスできないことが多い。
本稿では,1200以上のプロセス条件をカバーする,機械学習ベンチマークのための一貫した一貫したフローデータセットを提供する,収量予測のための新しいデータセットを提案する。
以前のデータセットは離散パラメータに重点を置いていたが、実験的なセットアップにより、多数の継続的プロセス条件をサンプリングすることが可能になり、機械学習モデルに新たな課題が生まれました。
我々は,特に理論的にモデル化が難しい課題である溶媒選択に焦点をあてる。
本稿では,レグレッションアルゴリズム,トランスファーラーニングアプローチ,機能工学,アクティブラーニングのベンチマークについて紹介する。
関連論文リスト
- CleanSurvival: Automated data preprocessing for time-to-event models using reinforcement learning [0.0]
データ前処理は、機械学習の重要かつ頻繁に無視される側面である。
CleanSurvivalは、プレプロセスパイプラインを最適化するための強化学習ベースのソリューションである。
連続的および分類的変数を処理し、Q-learningを使用して、データ計算、外れ値検出、特徴抽出のどの組み合わせが最適なパフォーマンスを達成するかを選択できる。
論文 参考訳(メタデータ) (2025-02-06T10:33:37Z) - Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor [0.0]
ノルウェーのヴェアス処理施設にあるパイロット・リアクターのデータを用いて、生物学的硝酸塩の最適化に機械学習をどのように利用できるかを探る。
予測精度にのみ焦点をあてるのではなく、本手法は効果的なデータ駆動モデリングのための基礎的要件を理解することを優先する。
論文 参考訳(メタデータ) (2024-12-18T16:49:23Z) - Intelligent Chemical Purification Technique Based on Machine Learning [5.023197681500998]
本研究では, カラムクロマトグラフィーを用いた人工知能の革新的開発を行い, 不効率を解消し, 化学分離・浄化領域におけるデータの収集を標準化することを目的とする。
高精度なデータ取得と高度な機械学習アルゴリズムを用いた自動プラットフォームの開発により、キー分離パラメータを予測する予測モデルを構築した。
新規な計量である分離確率(S_p$)は、有効化合物分離の確率を定量化し、実験的な検証によって検証する。
論文 参考訳(メタデータ) (2024-04-14T01:44:58Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Predicting Chemical Properties using Self-Attention Multi-task Learning
based on SMILES Representation [0.0]
本研究では,変圧器変圧器モデルの構造的差異について検討し,新しい自己注意モデルを提案する。
不均衡な化学データセットを用いたマルチタスク学習環境において,自己認識モジュールの表現学習性能を評価した。
論文 参考訳(メタデータ) (2020-10-19T09:46:50Z) - Towards the Automation of a Chemical Sulphonation Process with Machine
Learning [0.0]
本稿では,化学吸音過程における機械学習手法の適用結果について述べる。
プロセスパラメータからのデータを用いてランダムフォレスト、ニューラルネットワーク、線形回帰などの異なるモデルのトレーニングを行った。
実験の結果,これらの製品の品質値を精度良く予測することが可能であり,時間短縮の可能性があることが判明した。
論文 参考訳(メタデータ) (2020-09-25T10:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。