論文の概要: SparseChem: Fast and accurate machine learning model for small molecules
- arxiv url: http://arxiv.org/abs/2203.04676v1
- Date: Wed, 9 Mar 2022 12:40:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 14:55:40.546808
- Title: SparseChem: Fast and accurate machine learning model for small molecules
- Title(参考訳): SparseChem: 小さな分子の高速かつ正確な機械学習モデル
- Authors: Adam Arany, Jaak Simm, Martijn Oldenhof and Yves Moreau
- Abstract要約: SparseChemは、生化学応用のための高速で正確な機械学習モデルを提供する。
分類、回帰、検閲された回帰モデル、あるいはそれらの組み合わせをコマンドラインから訓練することができる。
ソースコードとドキュメンテーションはMIT License on GitHubで無料で入手できる。
- 参考スコア(独自算出の注目度): 6.88204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SparseChem provides fast and accurate machine learning models for biochemical
applications. Especially, the package supports very high-dimensional sparse
inputs, e.g., millions of features and millions of compounds. It is possible to
train classification, regression and censored regression models, or combination
of them from command line. Additionally, the library can be accessed directly
from Python. Source code and documentation is freely available under MIT
License on GitHub.
- Abstract(参考訳): SparseChemは、生化学応用のための高速で正確な機械学習モデルを提供する。
特に、パッケージは非常に高次元のスパース入力、例えば数百万の特徴と数百万の化合物をサポートしている。
分類、回帰、検閲された回帰モデル、あるいはそれらの組み合わせをコマンドラインから訓練することができる。
さらに、ライブラリはPythonから直接アクセスすることができる。
ソースコードとドキュメンテーションはMIT License on GitHubで無料で入手できる。
関連論文リスト
- BioNeMo Framework: a modular, high-performance library for AI model development in drug discovery [66.97700597098215]
計算生物学と化学AIモデルのトレーニングを容易にするために,BioNeMo Frameworkを紹介した。
256のNVIDIA A100では、BioNeMo Frameworkは40億のパラメータBERTベースのPLMを4.2日で1兆個以上のトークンでトレーニングしている。
BioNeMo Frameworkはオープンソースで、誰でも自由に使える。
論文 参考訳(メタデータ) (2024-11-15T19:46:16Z) - Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0]
skfpは、化学情報学の応用のための分子指紋の計算のためのPythonパッケージである。
skfpは業界標準のScikit-learnインターフェースを提供し、直感的な使用と機械学習パイプラインとの統合を容易にする。
また、柔軟性があり、非常に効率的で、完全にオープンソースです。
論文 参考訳(メタデータ) (2024-07-18T08:45:14Z) - RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - A Python library for efficient computation of molecular fingerprints [0.0]
分子指紋を効率的に計算し、包括的なインターフェースを提供するPythonライブラリを作成します。
このライブラリは、ユーザが並列性を使って大規模なデータセット上で計算を実行することを可能にする。
分子指紋を用いて、最先端のMLソリューションに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2024-03-27T19:02:09Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Synthetic data enable experiments in atomistic machine learning [0.0]
既存のMLポテンシャルモデルから,原子単位のエネルギーをラベル付けした大規模データセットの使用を実演する。
このプロセスの安価さは、量子力学の土台真実に比べれば、数百万のデータポイントを生成できる。
合成データラベルの学習は、後続の小さなデータセットの微調整に有用な事前学習タスクであることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:17:24Z) - MolGraph: a Python package for the implementation of molecular graphs
and graph neural networks with TensorFlow and Keras [51.92255321684027]
MolGraphは、分子機械学習(ML)のためのグラフニューラルネットワーク(GNN)パッケージである
MolGraphは、分子ML問題を解決するためにGNNアルゴリズムに渡すことができる小さな分子グラフを生成するための化学モジュールを実装している。
GNNは分子識別に有用であり,クロマトグラフィー保持時間データの解釈性が向上した。
論文 参考訳(メタデータ) (2022-08-21T18:37:41Z) - Scaling Up Models and Data with $\texttt{t5x}$ and $\texttt{seqio}$ [118.04625413322827]
$texttt5x$と$texttseqio$は、言語モデルの構築とトレーニングのためのオープンソースのソフトウェアライブラリである。
これらのライブラリは、複数のテラバイトのトレーニングデータを持つデータセット上で、数十億のパラメータを持つモデルをトレーニングするために使用されています。
論文 参考訳(メタデータ) (2022-03-31T17:12:13Z) - Deeptime: a Python library for machine learning dynamical models from
time series data [3.346668383314945]
Deeptimeは、時系列データに基づいて動的モデルを推定する様々なツールを提供する汎用Pythonライブラリである。
本稿では,ディープタイムソフトウェアの主な特徴と構造を紹介する。
論文 参考訳(メタデータ) (2021-10-28T10:53:03Z) - Ensemble Distillation for Robust Model Fusion in Federated Learning [72.61259487233214]
Federated Learning(FL)は、多くのデバイスが機械学習モデルを協調的にトレーニングする機械学習環境である。
現在のトレーニングスキームのほとんどでは、サーバモデルのパラメータと更新されたパラメータをクライアント側から平均化することで、中央モデルを洗練します。
本研究では,モデル融合のためのアンサンブル蒸留法を提案する。
論文 参考訳(メタデータ) (2020-06-12T14:49:47Z) - ML4Chem: A Machine Learning Package for Chemistry and Materials Science [0.0]
ML4Chemは、化学と材料科学のためのオープンソースの機械学習ライブラリである。
機械学習モデルとパイプラインの開発とデプロイのための拡張可能なプラットフォームを提供する。
ここでは、実装、デプロイ、推論のためのアトミックモジュールを紹介します。
論文 参考訳(メタデータ) (2020-03-02T00:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。