論文の概要: Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning
- arxiv url: http://arxiv.org/abs/2410.10118v1
- Date: Mon, 14 Oct 2024 03:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 03:04:18.065761
- Title: Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning
- Title(参考訳): 分子マルチタスク学習における物理整合性ブリッジの不均一性
- Authors: Yuxuan Ren, Dihan Zheng, Chang Liu, Peiran Jin, Yu Shi, Lin Huang, Jiyan He, Shengjie Luo, Tao Qin, Tie-Yan Liu,
- Abstract要約: 我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
- 参考スコア(独自算出の注目度): 79.75718786477638
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, machine learning has demonstrated impressive capability in handling molecular science tasks. To support various molecular properties at scale, machine learning models are trained in the multi-task learning paradigm. Nevertheless, data of different molecular properties are often not aligned: some quantities, e.g. equilibrium structure, demand more cost to compute than others, e.g. energy, so their data are often generated by cheaper computational methods at the cost of lower accuracy, which cannot be directly overcome through multi-task learning. Moreover, it is not straightforward to leverage abundant data of other tasks to benefit a particular task. To handle such data heterogeneity challenges, we exploit the specialty of molecular tasks that there are physical laws connecting them, and design consistency training approaches that allow different tasks to exchange information directly so as to improve one another. Particularly, we demonstrate that the more accurate energy data can improve the accuracy of structure prediction. We also find that consistency training can directly leverage force and off-equilibrium structure data to improve structure prediction, demonstrating a broad capability for integrating heterogeneous data.
- Abstract(参考訳): 近年、機械学習は分子科学のタスクを処理できる優れた能力を示している。
大規模で様々な分子特性をサポートするため、機械学習モデルはマルチタスク学習パラダイムで訓練される。
しかし、いくつかの量、例えば平衡構造、計算コストの増大、例えばエネルギーなど、異なる分子特性のデータはしばしば一致しないため、それらのデータはより安価な計算手法によって、より低い精度で生成され、マルチタスク学習によって直接的に克服できない。
さらに、特定のタスクに利益をもたらすために、他のタスクの豊富なデータを利用するのは簡単ではない。
このようなデータ不均一性問題に対処するために、物理法則が存在する分子タスクの特殊性を活用し、異なるタスクが情報を直接交換して互いに改善できるように、一貫性のトレーニングアプローチを設計する。
特に、より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、力と非平衡構造データを直接活用して構造予測を改善し、異種データを統合する幅広い能力を示す。
関連論文リスト
- Scalable Multi-Task Transfer Learning for Molecular Property Prediction [10.512534299496725]
提案手法は, 最適転移率を自動的に取得することにより, 分子特性予測のためのスケーラブルなマルチタスク変換学習を可能にする。
実験により,提案手法は40の分子特性の予測性能を向上し,トレーニング収束を加速した。
論文 参考訳(メタデータ) (2024-10-01T06:28:14Z) - Multi-Task Multi-Fidelity Learning of Properties for Energetic Materials [34.8008617873679]
マルチタスクニューラルネットワークは、マルチモーダルデータから学習でき、特定の特性のために訓練されたシングルタスクモデルより優れている。
予想通り、データスカースプロパティでは改善がより重要になります。
このアプローチは、エネルギー材料以外の分野にも広く適用できる。
論文 参考訳(メタデータ) (2024-08-21T12:54:26Z) - Multitask methods for predicting molecular properties from heterogeneous data [0.27309692684728615]
マルチタスクガウス過程の回帰は、高価なデータソースと安価なデータソースの両方を活用することで制限を克服することを示した。
マルチタスクサロゲートは,データ生成コストを1桁以上削減し,CCレベルの精度で予測可能であることを報告した。
マルチタスクレグレッションは、既存のデータソースを機会的に活用することによって、データ生成コストをさらに削減するためのツールである。
論文 参考訳(メタデータ) (2024-01-31T15:04:03Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。