論文の概要: Predicting the activity of chemical compounds based on machine learning
approaches
- arxiv url: http://arxiv.org/abs/2401.01004v1
- Date: Sun, 10 Sep 2023 17:20:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 12:19:51.448706
- Title: Predicting the activity of chemical compounds based on machine learning
approaches
- Title(参考訳): 機械学習による化合物の活性予測
- Authors: Do Hoang Tu, Tran Van Lang, Pham Cong Xuyen, Le Mau Long
- Abstract要約: 本研究は,100種類の既存技術の組み合わせについて実験を行った。
ソリューションは、G平均、F1スコア、AUCメトリクスを含む一連の基準に基づいて選択される。
この結果はPubChemの約1万の化学物質のデータセットで検証されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Exploring methods and techniques of machine learning (ML) to address specific
challenges in various fields is essential. In this work, we tackle a problem in
the domain of Cheminformatics; that is, providing a suitable solution to aid in
predicting the activity of a chemical compound to the best extent possible. To
address the problem at hand, this study conducts experiments on 100 different
combinations of existing techniques. These solutions are then selected based on
a set of criteria that includes the G-means, F1-score, and AUC metrics. The
results have been tested on a dataset of about 10,000 chemical compounds from
PubChem that have been classified according to their activity
- Abstract(参考訳): さまざまな分野における特定の課題に対処するための機械学習(ML)の手法と手法の探索が不可欠である。
本研究では, 化学情報学の領域における問題, すなわち, 化学物質の活性を可能な限り予測するための適切な解を提供する。
この問題に対処するため,本研究は既存の手法を100種類の組み合わせて実験を行う。
これらの解は、G平均、F1スコア、AUCメトリクスを含む一連の基準に基づいて選択される。
その結果はPubChemの約1万の化学物質のデータセットでテストされ、その活性に応じて分類された。
関連論文リスト
- Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - ChemLLM: A Chemical Large Language Model [49.308528569982805]
大規模言語モデル(LLM)は化学応用において顕著な進歩を遂げた。
しかし、コミュニティには化学に特化したLLMが欠落している。
本稿では,化学に特化した最初のLLMを特徴とする包括的フレームワークであるChemLLMを紹介する。
論文 参考訳(メタデータ) (2024-02-10T01:11:59Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Semi-Supervised GCN for learning Molecular Structure-Activity
Relationships [4.468952886990851]
そこで本稿では,半教師付き学習を用いたグラフ-グラフ間ニューラルネットワークの学習手法を提案する。
最終目標として、我々のアプローチは、アクティビティ崖、リード最適化、デノボドラッグデザインといった問題に対処するための貴重なツールとなる可能性がある。
論文 参考訳(メタデータ) (2022-01-25T09:09:43Z) - The chemical space of terpenes: insights from data science and AI [0.30458514384586405]
テルペン(terpenes)は、化学的、生物学的に重要な多様性を持つ天然物の総称である。
私たちは、テルペンの多様性を特定し、コンパイルし、特徴付けるために、データサイエンスベースのアプローチを採用しています。
論文 参考訳(メタデータ) (2021-10-27T12:27:17Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Fine-Grained Chemical Entity Typing with Multimodal Knowledge
Representation [36.6963949360594]
核となる化学文献から化学反応に関する詳細な知識を抽出する方法は、新たな課題である。
本稿では, 微細な化学エンティティタイピングの問題を解決するために, マルチモーダル表現学習フレームワークを提案する。
実験の結果,提案手法は複数の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-29T19:41:35Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。