論文の概要: Word Embeddings for Chemical Patent Natural Language Processing
- arxiv url: http://arxiv.org/abs/2010.12912v1
- Date: Sat, 24 Oct 2020 15:03:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 12:09:33.395652
- Title: Word Embeddings for Chemical Patent Natural Language Processing
- Title(参考訳): 化学特許自然言語処理のための単語埋め込み
- Authors: Camilo Thorne and Saber Akhondi
- Abstract要約: バイオメディカル埋め込みに対する化学特許語埋め込みの評価を行った。
文脈化された埋め込みを使用することで、比較的小さな金の標準よりも、この領域の妥当なパフォーマンスの予測モデルを導き出すことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We evaluate chemical patent word embeddings against known biomedical
embeddings and show that they outperform the latter extrinsically and
intrinsically. We also show that using contextualized embeddings can induce
predictive models of reasonable performance for this domain over a relatively
small gold standard.
- Abstract(参考訳): 既知バイオメディカル埋め込みに対する化学特許語埋め込みの評価を行い,本質的にも本質的にも,後者よりも優れていることを示す。
また、文脈的埋め込みを用いることで、比較的小さな金の標準よりも適切なパフォーマンスの予測モデルを導き出せることを示す。
関連論文リスト
- MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Towards out-of-distribution generalizable predictions of chemical
kinetics properties [61.15970601264632]
Out-Of-Distribution (OOD) の運動特性予測は一般化可能である必要がある。
本稿では,OODの運動特性予測を3つのレベル(構造,条件,機構)に分類する。
我々は、OOD設定における反応予測のための最先端MLアプローチと、速度論的特性予測問題における最先端グラフOOD手法をベンチマークするために、包括的なデータセットを作成する。
論文 参考訳(メタデータ) (2023-10-04T20:36:41Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - From axioms over graphs to vectors, and back again: evaluating the
properties of graph-based ontology embeddings [78.217418197549]
埋め込みを生成するアプローチの1つは、名前付きエンティティと論理公理構造のためのノードとエッジのセットを導入することである。
グラフに埋め込む方法(グラフ射影)は、それらが利用する公理の種類と異なる性質を持つ。
論文 参考訳(メタデータ) (2023-03-29T08:21:49Z) - Leveraging knowledge graphs to update scientific word embeddings using
latent semantic imputation [0.0]
glslsiは、最新の知識グラフからドメイン固有の単語を埋め込むことができることを示す。
生物医学領域における希少項およびOOV項に対して,LSIは信頼性の高い埋め込みベクトルを生成可能であることを示す。
論文 参考訳(メタデータ) (2022-10-27T12:15:26Z) - Topogivity: A Machine-Learned Chemical Rule for Discovering Topological
Materials [7.86558262769362]
トポロジカルな材料は、基礎科学と次世代の技術応用の両方に魅力を与える非伝統的な電子特性を示す。
ここでは、機械学習を用いて、物質がその化学式のみを用いてトポロジカルであるかどうかを高精度に診断する簡単な化学規則を開発する。
論文 参考訳(メタデータ) (2022-02-10T18:57:17Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - SEMIE: SEMantically Infused Embeddings with Enhanced Interpretability
for Domain-specific Small Corpus [1.2183405753834562]
本稿では,単語埋め込みに対する包括的解釈可能性の概念を提案し,ドメイン固有小コーパスに対して高い解釈可能な埋め込みを生成する新しい手法を提案する。
本報告では,単語埋め込みの評価結果を報告するとともに,解釈可能性向上のための新しい特徴を実証する。
論文 参考訳(メタデータ) (2021-03-21T16:28:08Z) - Knowledge-Base Enriched Word Embeddings for Biomedical Domain [5.086571902225929]
利用可能なコーポラとドメイン知識の情報を共同利用したバイオメディカルドメインのための新しい単語埋め込みモデルを提案する。
既存のアプローチとは異なり、提案手法は単純だが、ドメインリソースで利用可能な正確な知識を正しく捉えることに長けている。
論文 参考訳(メタデータ) (2021-02-20T18:18:51Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。