論文の概要: Stress Testing BERT Anaphora Resolution Models for Reaction Extraction
in Chemical Patents
- arxiv url: http://arxiv.org/abs/2306.13379v1
- Date: Fri, 23 Jun 2023 09:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-26 13:16:26.774672
- Title: Stress Testing BERT Anaphora Resolution Models for Reaction Extraction
in Chemical Patents
- Title(参考訳): 化学特許における反応抽出のための応力試験BERTアナフォラ分解モデル
- Authors: Chieling Yueh, Evangelos Kanoulas, Bruno Martins, Camilo Thorne, Saber
Akhondi
- Abstract要約: 化学特許には、共参照(co-reference)、変換(transform)、反応関連(reaction associated)、組立(work up)、包含(intained)の5つのアナフォリックな関係がある。
我々の目標は、ノイズフリーでノイズの多い環境で、反応テキストに対するアナフォラ分解能モデルの性能がどのように異なるかを検討することである。
- 参考スコア(独自算出の注目度): 7.653466578233261
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The high volume of published chemical patents and the importance of a timely
acquisition of their information gives rise to automating information
extraction from chemical patents. Anaphora resolution is an important component
of comprehensive information extraction, and is critical for extracting
reactions. In chemical patents, there are five anaphoric relations of interest:
co-reference, transformed, reaction associated, work up, and contained. Our
goal is to investigate how the performance of anaphora resolution models for
reaction texts in chemical patents differs in a noise-free and noisy
environment and to what extent we can improve the robustness against noise of
the model.
- Abstract(参考訳): 化学特許の大量発行と、その情報のタイムリーな取得の重要性により、化学特許から情報を抽出する自動化がもたらされる。
アナフォラ分解能は包括的情報抽出の重要な要素であり、反応の抽出に重要である。
化学特許には、共参照、変換、関連する反応、働き、含みの5つのアナフォリックな関係がある。
本研究の目的は, 化学特許における反応テキストに対するアナフォラ分解モデルの性能が, ノイズフリーでノイズの多い環境でどのように異なるか, そして, モデルのノイズに対するロバスト性をどの程度改善できるかを検討することである。
関連論文リスト
- An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - ReacLLaMA: Merging chemical and textual information in chemical
reactivity AI models [0.0]
化学反応性モデルは、分類(success/failure)や回帰(product yield)タスクの形式で化学反応の結果を予測するために開発されている。
報告されたモデルの大半は、反応剤、生成物、試薬、溶媒などの化学情報のみに基づいて訓練されている。
ここでは、Graphormerの反応性モデルを強化し、その精度を向上させることを目的とした手続きテキストの組み入れについて述べる。
論文 参考訳(メタデータ) (2024-01-30T18:57:08Z) - ReactIE: Enhancing Chemical Reaction Extraction with Weak Supervision [27.850325653751078]
構造化化学反応情報は、実験とコンピュータ支援医薬品設計のような先進的な取り組みに携わる化学者にとって重要な役割を担っている。
科学的文献から構造的反応を抽出することが重要であるにもかかわらず、この目的のためのデータアノテーションは、ドメインの専門家が必要とする多大な労力のためにコストを抑えることができる。
本稿では,2つの弱教師付き事前学習手法を組み合わせたReactIEを提案する。本手法では,テキスト内の頻繁なパターンを言語的手がかりとして用いて,化学反応の特異な特性を同定する。
論文 参考訳(メタデータ) (2023-07-04T02:52:30Z) - Predicting the Stereoselectivity of Chemical Transformations by Machine
Learning [6.051631066475523]
化学反応の立体選択性を定量的に予測するために、2つのガウス混合モデルを用いて、LASSOモデルと2つのランダムフォレストモデルを組み合わせた新しい機械学習手法を提案する。
近年の画期的なアプローチと比較して,本手法は特徴間の相互作用を捉え,データ分布を利用することが可能であり,立体選択性を予測する上で重要である。
論文 参考訳(メタデータ) (2021-10-12T01:21:14Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Named entity recognition in chemical patents using ensemble of
contextual language models [0.3731111830152912]
化学特許から情報を取り出すための文脈型言語モデルの有効性について検討する。
我々の最良のモデルは、多数アンサンブルのアプローチに基づくもので、正確なF1スコアは92.30%、緩和されたF1スコアは96.24%に達する。
論文 参考訳(メタデータ) (2020-07-24T15:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。