論文の概要: AI- and HPC-enabled Lead Generation for SARS-CoV-2: Models and Processes
to Extract Druglike Molecules Contained in Natural Language Text
- arxiv url: http://arxiv.org/abs/2101.04617v1
- Date: Tue, 12 Jan 2021 17:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 01:48:40.221353
- Title: AI- and HPC-enabled Lead Generation for SARS-CoV-2: Models and Processes
to Extract Druglike Molecules Contained in Natural Language Text
- Title(参考訳): SARS-CoV-2のAIおよびHPC対応リード生成:自然言語テキストに含まれる薬物様分子の抽出モデルとプロセス
- Authors: Zhi Hong, J. Gregory Pauloski, Logan Ward, Kyle Chard, Ben Blaiszik,
and Ian Foster
- Abstract要約: ラベル付きテキストのコーパスを作成し、このラベル付きコーパスを使用して名前付きエンティティ認識モデルをトレーニングし、トレーニングされたモデルを用いて10912の薬物様分子を抽出する。
性能分析の結果, 自動抽出モデルは非熟練人間と同等の性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.237499051649312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers worldwide are seeking to repurpose existing drugs or discover new
drugs to counter the disease caused by severe acute respiratory syndrome
coronavirus 2 (SARS-CoV-2). A promising source of candidates for such studies
is molecules that have been reported in the scientific literature to be
drug-like in the context of coronavirus research. We report here on a project
that leverages both human and artificial intelligence to detect references to
drug-like molecules in free text. We engage non-expert humans to create a
corpus of labeled text, use this labeled corpus to train a named entity
recognition model, and employ the trained model to extract 10912 drug-like
molecules from the COVID-19 Open Research Dataset Challenge (CORD-19) corpus of
198875 papers. Performance analyses show that our automated extraction model
can achieve performance on par with that of non-expert humans.
- Abstract(参考訳): 世界中の研究者は、重症急性呼吸器症候群ウイルス(SARS-CoV-2)による病気に対抗するために、既存の薬物の再利用や新しい薬物の発見を目指している。
このような研究の候補は、新型コロナウイルス研究の文脈で薬物のような分子であると科学文献で報告されている分子である。
ここでは、人間と人工知能の両方を利用して、フリーテキストで薬物様分子の参照を検出するプロジェクトについて報告する。
我々は、高度でない人間がラベル付きテキストのコーパスを作成し、このラベル付きコーパスを使用して名前付きエンティティ認識モデルを訓練し、訓練されたモデルを用いて198875紙のオープンリサーチデータセットチャレンジ(CORD-19)コーパスから10912の薬物様分子を抽出する。
性能分析の結果, 自動抽出モデルは非熟練人間と同等の性能が得られることがわかった。
関連論文リスト
- Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - SynerGPT: In-Context Learning for Personalized Drug Synergy Prediction
and Drug Design [64.69434941796904]
本稿では,テキスト内薬物相乗学習のための新しい設定とモデルを提案する。
特定のがん細胞標的の文脈における10~20の薬物相乗関係の「個人化データセット」を作成した。
私たちの目標は、その文脈で追加の薬物シナジー関係を予測することです。
論文 参考訳(メタデータ) (2023-06-19T17:03:46Z) - covLLM: Large Language Models for COVID-19 Biomedical Literature [0.0]
新型コロナウイルス(COVID-19)のパンデミックは、新型コロナウイルス研究の爆発にもかかわらず、米国で11万人の死者を出した。
一つの理由は、患者に圧倒された臨床医が、新型コロナウイルスの感染率を抑えるのに苦労しているからだ。
潜在的な解決策は、大規模な言語モデルを用いて、新型コロナウイルスの文献を評価するツールを開発することである。
論文 参考訳(メタデータ) (2023-06-08T04:08:32Z) - Detecting Contradictory COVID-19 Drug Efficacy Claims from Biomedical
Literature [6.74913937258046]
NLPモデルは、この複雑で高い領域の文献を蒸留し、理解するのに役立ちます。
私たちはこれを自然言語推論の問題として捉え、ドメインの専門家が作成した新しいNLIデータセットを提供します。
我々はこれらのモデルがどのようにドメインの専門家がremdisivirおよびヒドロキシクロロキンに関する証拠を要約し、評価するのに役立つかを事例研究する。
論文 参考訳(メタデータ) (2022-12-19T21:37:36Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Tailoring Molecules for Protein Pockets: a Transformer-based Generative
Solution for Structured-based Drug Design [133.1268990638971]
標的タンパク質の構造に基づくデノボ薬物の設計は、新規な薬物候補を提供することができる。
そこで本研究では,特定のターゲットに対して,対象薬物をスクラッチから直接生成できるTamGentという生成ソリューションを提案する。
論文 参考訳(メタデータ) (2022-08-30T09:32:39Z) - Deep learning for drug repurposing: methods, databases, and applications [54.08583498324774]
新しい治療法のために既存の薬物を再利用することは、実験コストの低減で薬物開発を加速する魅力的な解決策である。
本稿では,薬物再資源化のための深層学習手法とツールの活用に関するガイドラインを紹介する。
論文 参考訳(メタデータ) (2022-02-08T09:42:08Z) - An Explainable-AI approach for Diagnosis of COVID-19 using MALDI-ToF
Mass Spectrometry [0.9250974571641537]
重症急性呼吸器症候群2型(SARS-CoV-2)は世界的なパンデミックを引き起こし、世界経済に大きな影響を与えた。
近年では、現在の金標準リアルタイムポリメラーゼ連鎖反応(RT-PCR)結果と高い一致を示す複数の代替プラットフォームが公表されている。
これらの新しい方法は鼻咽頭(NP)スワブを除去し、複雑な試薬の必要性を排除し、RT-PCRテスト試薬の供給の負担を軽減する。
本研究では,人工知能を用いたAIテスト手法を設計し,実験結果の信頼性について検討した。
論文 参考訳(メタデータ) (2021-09-28T23:29:31Z) - Evening the Score: Targeting SARS-CoV-2 Protease Inhibition in Graph
Generative Models for Therapeutic Candidates [11.853524110656991]
SARS-CoV-2ウイルスタンパク質を標的とした新規薬物候補の治療法設計について検討する。
抗SARS活性を持つ薬物のデータセットに類似した構造を持つ分子を生成するオートエンコーダを用いる。
生成過程において、薬物類似性、合成アクセシビリティ、および抗SARS活性のバランスをとるために、いくつかの設計目標に対する最適化を検討する。
論文 参考訳(メタデータ) (2021-05-07T18:39:25Z) - Genetic Constrained Graph Variational Autoencoder for COVID-19 Drug
Discovery [0.0]
そこで本研究では,GCGVAE (Genematic Constrained Graph Variational Autoencoder) と呼ばれる新しいモデルを提案する。
SARS、HIV、Hep3、MERSなど、さまざまなウイルスのタンパク質構造のデータに基づいてモデルをトレーニングし、SARS-CoV-2の可能な薬物を生成するために使用しました。
生成分子はSARS-CoV-2を阻害する効果が高い。
論文 参考訳(メタデータ) (2021-04-23T16:10:15Z) - Mapping the Landscape of Artificial Intelligence Applications against
COVID-19 [59.30734371401316]
世界保健機関(WHO)は、SARS-CoV-2ウイルスによる新型コロナウイルスの感染をパンデミックと宣言した。
我々は、機械学習と、より広範に、人工知能を用いた最近の研究の概要を、新型コロナウイルス危機の多くの側面に取り組むために提示する。
論文 参考訳(メタデータ) (2020-03-25T12:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。