論文の概要: A Python library for efficient computation of molecular fingerprints
- arxiv url: http://arxiv.org/abs/2403.19718v1
- Date: Wed, 27 Mar 2024 19:02:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 17:43:20.189307
- Title: A Python library for efficient computation of molecular fingerprints
- Title(参考訳): 分子指紋の効率的な計算のためのPythonライブラリ
- Authors: Michał Szafarczyk, Piotr Ludynia, Przemysław Kukla,
- Abstract要約: 分子指紋を効率的に計算し、包括的なインターフェースを提供するPythonライブラリを作成します。
このライブラリは、ユーザが並列性を使って大規模なデータセット上で計算を実行することを可能にする。
分子指紋を用いて、最先端のMLソリューションに匹敵する結果が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning solutions are very popular in the field of chemoinformatics, where they have numerous applications, such as novel drug discovery or molecular property prediction. Molecular fingerprints are algorithms commonly used for vectorizing chemical molecules as a part of preprocessing in this kind of solution. However, despite their popularity, there are no libraries that implement them efficiently for large datasets, utilizing modern, multicore architectures. On top of that, most of them do not provide the user with an intuitive interface, or one that would be compatible with other machine learning tools. In this project, we created a Python library that computes molecular fingerprints efficiently and delivers an interface that is comprehensive and enables the user to easily incorporate the library into their existing machine learning workflow. The library enables the user to perform computation on large datasets using parallelism. Because of that, it is possible to perform such tasks as hyperparameter tuning in a reasonable time. We describe tools used in implementation of the library and asses its time performance on example benchmark datasets. Additionally, we show that using molecular fingerprints we can achieve results comparable to state-of-the-art ML solutions even with very simple models.
- Abstract(参考訳): 機械学習ソリューションは化学情報学の分野で非常に人気があり、新しい薬物発見や分子特性予測など多くの応用がある。
分子指紋は、この種の溶液での前処理の一部として化学分子をベクトル化するのによく使われるアルゴリズムである。
しかし、その人気にもかかわらず、最新のマルチコアアーキテクチャを利用して、大規模なデータセットに効率的に実装するライブラリは存在しない。
それに加えて、それらのほとんどは、直感的なインターフェースや、他の機械学習ツールと互換性のあるインターフェースを提供していません。
このプロジェクトでは,分子指紋を効率よく計算するPythonライブラリを作成し,包括的インターフェースを提供し,ユーザがライブラリを既存の機械学習ワークフローに簡単に組み込めるようにした。
このライブラリは、ユーザが並列性を使って大規模なデータセット上で計算を実行することを可能にする。
そのため、ハイパーパラメータチューニングのようなタスクを合理的な時間で実行することが可能である。
ライブラリの実装で使用されるツールを記述し、その時間性能をサンプルベンチマークデータセットで評価する。
さらに、分子指紋を用いて、非常に単純なモデルでも最先端のMLソリューションに匹敵する結果が得られることを示す。
関連論文リスト
- Deep Fast Machine Learning Utils: A Python Library for Streamlined Machine Learning Prototyping [0.0]
Deep Fast Machine Learning Utils (DFMLU)ライブラリは、機械学習プロセスのアスペクトを自動化および拡張するために設計されたツールを提供する。
DFMLUはモデル開発とデータ処理をサポートする機能を提供します。
この原稿はDFMLUの機能の概要を示し、各ツールにPythonの例を提供している。
論文 参考訳(メタデータ) (2024-09-14T21:39:17Z) - Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0]
skfpは、化学情報学の応用のための分子指紋の計算のためのPythonパッケージである。
skfpは業界標準のScikit-learnインターフェースを提供し、直感的な使用と機械学習パイプラインとの統合を容易にする。
また、柔軟性があり、非常に効率的で、完全にオープンソースです。
論文 参考訳(メタデータ) (2024-07-18T08:45:14Z) - Benchmarking Predictive Coding Networks -- Made Simple [48.652114040426625]
まず,性能と簡易性を重視したPCXというライブラリを提案する。
私たちはPCXを使って、コミュニティが実験に使用する大規模なベンチマークを実装しています。
論文 参考訳(メタデータ) (2024-07-01T10:33:44Z) - PARTIME: Scalable and Parallel Processing Over Time with Deep Neural
Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。
PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。
オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文 参考訳(メタデータ) (2022-10-17T14:49:14Z) - A Library for Representing Python Programs as Graphs for Machine
Learning [39.483608364770824]
我々はPythonプログラムのグラフ表現に静的解析を適用するオープンソースのPythonライブラリpython_graphsを紹介した。
図書館の能力と限界を提示し、このライブラリを何百万もの競合するプログラムに応用するケーススタディを実行し、このライブラリが機械学習研究に有効であることを示す。
論文 参考訳(メタデータ) (2022-08-15T22:36:17Z) - PyGOD: A Python Library for Graph Outlier Detection [56.33769221859135]
PyGODは、グラフデータの外れ値を検出するオープンソースライブラリである。
外れ値検出のための主要なグラフベースのメソッドを幅広くサポートしています。
PyGODはBSD 2-Clauseライセンスの下でhttps://pygod.orgとPython Package Index (PyPI)でリリースされている。
論文 参考訳(メタデータ) (2022-04-26T06:15:21Z) - SparseChem: Fast and accurate machine learning model for small molecules [6.88204255655161]
SparseChemは、生化学応用のための高速で正確な機械学習モデルを提供する。
分類、回帰、検閲された回帰モデル、あるいはそれらの組み合わせをコマンドラインから訓練することができる。
ソースコードとドキュメンテーションはMIT License on GitHubで無料で入手できる。
論文 参考訳(メタデータ) (2022-03-09T12:40:35Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - PyGlove: Symbolic Programming for Automated Machine Learning [88.15565138144042]
シンボリックプログラミングに基づくAutoMLの新しいプログラミング方法を紹介します。
このパラダイムでは、MLプログラムは変更可能であるため、他のプログラムで簡単に操作できます。
PyGloveユーザーは、静的プログラムを検索空間に簡単に変換し、検索空間と検索アルゴリズムをすばやく繰り返し、複雑な検索フローを作成できることを示しています。
論文 参考訳(メタデータ) (2021-01-21T19:05:44Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z) - Kernel methods library for pattern analysis and machine learning in
python [0.0]
kernelmethodsライブラリは、ドメインに依存しない方法で、python MLエコシステムにおける重要な空白を埋めます。
このライブラリは、カーネルベースの操作を効率的にするための、よく定義された多くのクラスを提供する。
論文 参考訳(メタデータ) (2020-05-27T16:44:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。