論文の概要: When SMILES have Language: Drug Classification using Text Classification Methods on Drug SMILES Strings
- arxiv url: http://arxiv.org/abs/2403.12984v1
- Date: Sun, 3 Mar 2024 11:09:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 07:27:10.252426
- Title: When SMILES have Language: Drug Classification using Text Classification Methods on Drug SMILES Strings
- Title(参考訳): SMILESが言語を持つとき:薬物SMILES文字列のテキスト分類法による薬物分類
- Authors: Azmine Toushik Wasi, Šerbetar Karlo, Raima Islam, Taki Hasan Rafi, Dong-Kyu Chae,
- Abstract要約: 薬物のような複雑な化学構造は、通常SMILES文字列によって分子と結合の配列として定義される。
薬物のSMILESを従来の文章として扱い、薬物分類のためのテキスト分類に関わった場合はどうでしょう?
この研究は、各原子と結合を文成分と見なすという概念を探求し、薬物の種類を分類するための基本的なNLP法を用いている。
- 参考スコア(独自算出の注目度): 5.648318448953635
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Complex chemical structures, like drugs, are usually defined by SMILES strings as a sequence of molecules and bonds. These SMILES strings are used in different complex machine learning-based drug-related research and representation works. Escaping from complex representation, in this work, we pose a single question: What if we treat drug SMILES as conventional sentences and engage in text classification for drug classification? Our experiments affirm the possibility with very competitive scores. The study explores the notion of viewing each atom and bond as sentence components, employing basic NLP methods to categorize drug types, proving that complex problems can also be solved with simpler perspectives. The data and code are available here: https://github.com/azminewasi/Drug-Classification-NLP.
- Abstract(参考訳): 薬物のような複雑な化学構造は、通常SMILES文字列によって分子と結合の配列として定義される。
これらのSMILES文字列は、複雑な機械学習に基づく薬物関連の研究や表現に使われている。
薬物のSMILESを従来の文章として扱い、薬物分類のためのテキスト分類に関わった場合はどうでしょう?
我々の実験は、非常に競争力のあるスコアでその可能性を実証した。
この研究は、各原子と結合を文成分と見なすという概念を探求し、薬物の種類を分類するための基本的なNLP法を用いて、複雑な問題がより単純な視点で解決可能であることを証明した。
データとコードは、https://github.com/azminewasi/Drug-Classification-NLP.comで入手できる。
関連論文リスト
- Coarse-to-Fine Highlighting: Reducing Knowledge Hallucination in Large Language Models [58.952782707682815]
COFTは、異なるレベルのキーテキストにフォーカスする新しい方法であり、長いコンテキストで失われることを避ける。
知識幻覚ベンチマークの実験ではCOFTの有効性が示され、F1スコアの30%以上の性能が向上した。
論文 参考訳(メタデータ) (2024-10-19T13:59:48Z) - DrugCLIP: Contrastive Drug-Disease Interaction For Drug Repurposing [4.969453745531116]
DrugCLIPは、ネガティブなラベルなしで薬物と疾患の相互作用を学ぶための対照的な学習方法である。
実地臨床試験記録に基づく薬物再服用データセットをキュレートした。
論文 参考訳(メタデータ) (2024-07-02T13:41:59Z) - Benchmarking Hallucination in Large Language Models based on
Unanswerable Math Word Problem [58.3723958800254]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて非常に効果的である。
それらは幻覚と呼ばれる曖昧な文脈で信頼できない予想を生じさせる可能性がある。
本稿では,不問答語問題(MWP)に基づく質問回答(QA)におけるLLM幻覚評価手法を提案する。
論文 参考訳(メタデータ) (2024-03-06T09:06:34Z) - Emerging Opportunities of Using Large Language Models for Translation
Between Drug Molecules and Indications [6.832024637226738]
薬物分子とそれに対応する指標を翻訳する新しい課題を提案する。
表示からの分子の生成、またはその逆は、病気のより効率的なターゲティングを可能にする。
論文 参考訳(メタデータ) (2024-02-14T21:33:13Z) - Empirical Evidence for the Fragment level Understanding on Drug
Molecular Structure of LLMs [16.508471997999496]
言語モデルが1次元配列から化学空間構造をどう理解するかについて検討する。
その結果,分子断片の観点から,言語モデルで化学構造が理解できることが示唆された。
論文 参考訳(メタデータ) (2024-01-15T12:53:58Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Multi-modal Molecule Structure-text Model for Text-based Retrieval and
Editing [107.49804059269212]
分子の化学構造とテキスト記述を共同で学習し, マルチモーダルな分子構造テキストモデル, MoleculeSTMを提案する。
実験において、分子STMは、新しい生化学的概念を創出するための最先端の一般化能力を得る。
論文 参考訳(メタデータ) (2022-12-21T06:18:31Z) - Structured information extraction from complex scientific text with
fine-tuned large language models [55.96705756327738]
そこで本研究では,共振器認識と関係抽出のための簡単なシーケンス・ツー・シーケンス手法を提案する。
このアプローチは、約500組のプロンプトで微調整された、事前訓練済みの大規模言語モデル(LLM)であるGPT-3を利用する。
このアプローチは、構造化されていないテキストから抽出された構造化知識の大規模なデータベースを得るための、シンプルで、アクセス可能で、非常に柔軟な経路を示す。
論文 参考訳(メタデータ) (2022-12-10T07:51:52Z) - Hyperbolic Molecular Representation Learning for Drug Repositioning [19.73556079390888]
薬物階層は、木のような構造の薬物間の関係に関する知識を符号化する貴重な情報源である。
そこで我々は,2つの情報源を組み込んだ半教師付き薬物注入法を開発した。
学習した薬物の埋め込みは薬物間の階層的関係を誘導できることを示す。
論文 参考訳(メタデータ) (2022-07-06T20:20:29Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z) - Semi-Supervised Hierarchical Drug Embedding in Hyperbolic Space [19.73556079390888]
薬物階層は、木のような構造における薬物関係に関する人間の知識を符号化する貴重な情報源である。
そこで我々は,2つの情報源を組み込んだ半教師付き薬物注入法を開発した。
本研究は,既存の薬物の新規使用や副作用の発見に有効であることを示す。
論文 参考訳(メタデータ) (2020-06-01T14:46:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。