論文の概要: Federated Learning of Molecular Properties in a Heterogeneous Setting
- arxiv url: http://arxiv.org/abs/2109.07258v1
- Date: Wed, 15 Sep 2021 12:49:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 20:15:53.210900
- Title: Federated Learning of Molecular Properties in a Heterogeneous Setting
- Title(参考訳): 不均質環境における分子特性のフェデレート学習
- Authors: Wei Zhu, Andrew White, Jiebo Luo
- Abstract要約: これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
- 参考スコア(独自算出の注目度): 79.00211946597845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chemistry research has both high material and computational costs to conduct
experiments. Institutions thus consider chemical data to be valuable and there
have been few efforts to construct large public datasets for machine learning.
Another challenge is that different intuitions are interested in different
classes of molecules, creating heterogeneous data that cannot be easily joined
by conventional distributed training. In this work, we introduce federated
heterogeneous molecular learning to address these challenges. Federated
learning allows end-users to build a global model collaboratively while
preserving the training data distributed over isolated clients. Due to the lack
of related research, we first simulate a federated heterogeneous benchmark
called FedChem. FedChem is constructed by jointly performing scaffold splitting
and Latent Dirichlet Allocation on existing datasets. Our results on FedChem
show that significant learning challenges arise when working with heterogeneous
molecules. We then propose a method to alleviate the problem, namely Federated
Learning by Instance reweighTing (FLIT). FLIT can align the local training
across heterogeneous clients by improving the performance for uncertain
samples. Comprehensive experiments conducted on our new benchmark FedChem
validate the advantages of this method over other federated learning schemes.
FedChem should enable a new type of collaboration for improving AI in chemistry
that mitigates concerns about valuable chemical data.
- Abstract(参考訳): 化学研究は、実験を行うための高い材料と計算コストを持っている。
このように、機関は化学データの価値を考慮し、機械学習のための大規模な公開データセットを構築する努力はほとんどない。
もう一つの課題は、異なる直観が異なる分子のクラスに興味を持ち、従来の分散トレーニングでは簡単に結合できない異種データを生成することである。
本稿では,これらの課題に対処するために,フェデレート不均質分子学習を導入する。
連合学習により、エンドユーザは、孤立したクライアントに分散したトレーニングデータを保存しながら、グローバルなモデルを協調的に構築できる。
関連研究の欠如により、我々は最初にフェデレーテッドヘテロジニアスベンチマークであるFedChemをシミュレートした。
fedchemは、既存のデータセット上で足場分割と潜在ディリクレ割り当てを共同で実行する。
FedChemの研究では、異種分子を扱う際に大きな学習課題が生じることを示した。
次に,この問題を緩和する手法,すなわちインスタンス重み付けによるフェデレーション学習(flit)を提案する。
FLITは、不確実なサンプルの性能を向上させることにより、異種クライアント間のローカルトレーニングを調整できる。
新しいベンチマークfeedchemを用いた包括的実験により,この手法が他のフェデレート学習方式よりも優れていることを検証した。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
関連論文リスト
- Federated Learning in Chemical Engineering: A Tutorial on a Framework for Privacy-Preserving Collaboration Across Distributed Data Sources [0.0]
この研究は、化学工学のコミュニティに、この分野へのアクセシビリティな導入を提供することを目的としている。
製造最適化、マルチモーダルデータ統合、薬物発見といったタスクにおけるフェデレートラーニングの適用について検討する。
チュートリアルは、$textttFlower$や$texttTensorFlow Federated$といった主要なフレームワークを使用して構築され、FLを採用するための適切なツールを化学技術者に提供するように設計されている。
論文 参考訳(メタデータ) (2024-11-23T13:16:06Z) - Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning [79.75718786477638]
我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
論文 参考訳(メタデータ) (2024-10-14T03:11:33Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Federated Learning on Transcriptomic Data: Model Quality and Performance
Trade-Offs [0.0]
大規模なゲノムまたは転写データの機械学習は、多くの新しい健康アプリケーションにとって重要である。
プライバシーと規制上の理由から、信頼できるサードパーティですべてのデータを集約することも問題となる。
生データを交換することなく、分散型で協調的な機械学習を可能にするため、フェデレーション学習は有望なソリューションである。
論文 参考訳(メタデータ) (2024-02-22T13:21:26Z) - Enhanced sampling of robust molecular datasets with uncertainty-based
collective variables [0.0]
化学関連データポイントの取得を導くために,不確実性を集合変数(CV)として活用する手法を提案する。
このアプローチでは、1つのモデルからのガウス混合モデルに基づく不確実性測定を、偏りのある分子動力学シミュレーションのためのCVとして採用する。
論文 参考訳(メタデータ) (2024-02-06T06:42:51Z) - Factor-Assisted Federated Learning for Personalized Optimization with
Heterogeneous Data [6.024145412139383]
フェデレートラーニング(Federated Learning)は、データプライバシ保護を目的とした、新興の分散機械学習フレームワークである。
異なるクライアントのデータには、共通の知識とパーソナライズされた知識の両方が含まれている。
我々は、FedSplitと呼ばれる異種データのための、新しい個人化されたフェデレーション学習フレームワークを開発した。
論文 参考訳(メタデータ) (2023-12-07T13:05:47Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。