論文の概要: Federated Learning from Molecules to Processes: A Perspective
- arxiv url: http://arxiv.org/abs/2506.18525v1
- Date: Mon, 23 Jun 2025 11:27:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.954854
- Title: Federated Learning from Molecules to Processes: A Perspective
- Title(参考訳): 分子からプロセスへのフェデレーション学習の展望
- Authors: Jan G. Rittig, Clemens Kortmann,
- Abstract要約: 化学産業における機械学習(ML)開発における協調的な取り組みを構想する。
化学工学のいくつかの分野における連合学習の潜在的な応用について論じる。
これらの結果から,連合学習を併用したMLモデルは,各化学系企業で個別に訓練したモデルよりも有意に精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a perspective on federated learning in chemical engineering that envisions collaborative efforts in machine learning (ML) developments within the chemical industry. Large amounts of chemical and process data are proprietary to chemical companies and are therefore locked in data silos, hindering the training of ML models on large data sets in chemical engineering. Recently, the concept of federated learning has gained increasing attention in ML research, enabling organizations to jointly train machine learning models without disclosure of their individual data. We discuss potential applications of federated learning in several fields of chemical engineering, from the molecular to the process scale. In addition, we apply federated learning in two exemplary case studies that simulate practical scenarios of multiple chemical companies holding proprietary data sets: (i) prediction of binary mixture activity coefficients with graph neural networks and (ii) system identification of a distillation column with autoencoders. Our results indicate that ML models jointly trained with federated learning yield significantly higher accuracy than models trained by each chemical company individually and can perform similarly to models trained on combined datasets from all companies. Federated learning has therefore great potential to advance ML models in chemical engineering while respecting corporate data privacy, making it promising for future industrial applications.
- Abstract(参考訳): 本稿では,化学産業における機械学習(ML)開発における協調的な取り組みをめざした,化学工学における連合学習の展望について述べる。
大量の化学物質やプロセスのデータは化学企業独自のものであり、従ってデータサイロに閉じ込められているため、化学工学における大規模なデータセット上でのMLモデルのトレーニングを妨げている。
近年、連合学習の概念はML研究で注目を集めており、組織は個々のデータを公開することなく、共同で機械学習モデルをトレーニングできるようになっている。
分子からプロセススケールまで,いくつかの化学工学分野における連合学習の可能性について論じる。
さらに, 独自のデータセットを持つ複数の化学企業の実践シナリオをシミュレートする2つの事例研究に, フェデレートラーニングを適用した。
一 グラフニューラルネットワークによる二成分混合活動係数の予測と評価
二 オートエンコーダ付き蒸留塔のシステム同定
この結果から,連合学習と共同で学習したMLモデルは,各化学企業によって個別に訓練されたモデルよりも有意に精度が高く,すべての企業から学習したモデルと同等に動作可能であることがわかった。
したがって、フェデレートラーニングは、企業データのプライバシを尊重しながら、化学工学におけるMLモデルを進化させる大きな可能性を秘めている。
関連論文リスト
- Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [34.82692226532414]
機械学習の原子間ポテンシャル(MLIP)を改善するためのアンサンブル知識蒸留法(EKD)を提案する。
まず、複数の教師モデルはQCエネルギーに訓練され、次にデータセットのすべての構成に対して原子力を生成する。次に、学生MLIPは、教師モデルによって生成されたQCエネルギーと平均的な力の両方に訓練される。
得られた学生MLIPは、Compum6ベンチマークで新しい最先端の精度を達成し、分子動力学シミュレーションの安定性の向上を示す。
論文 参考訳(メタデータ) (2025-03-18T14:32:51Z) - Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [60.93245342663455]
現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文 参考訳(メタデータ) (2025-02-26T13:13:24Z) - ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [50.15254966969718]
textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。
ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。
我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文 参考訳(メタデータ) (2024-08-14T01:16:40Z) - A Large Encoder-Decoder Family of Foundation Models For Chemical Language [1.1073864511426255]
本稿では,PubChemから得られた9100万個のSMILESサンプルを事前学習した大規模エンコーダ・デコーダ化学基礎モデルを提案する。
複数のベンチマークデータセットにまたがる実験は、様々なタスクに対して最先端の結果を提供する際に提案したモデルのキャパシティを検証する。
論文 参考訳(メタデータ) (2024-07-24T20:30:39Z) - Structure to Property: Chemical Element Embeddings and a Deep Learning Approach for Accurate Prediction of Chemical Properties [0.0]
化学分類タスクのためのelEmBERTモデルを提案する。
これは多層エンコーダアーキテクチャのようなディープラーニング技術に基づいている。
我々は, 有機, 無機, 結晶化合物の集合に対して, アプローチがもたらす機会を実証する。
論文 参考訳(メタデータ) (2023-09-17T19:41:32Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。