論文の概要: Stress Testing BERT Anaphora Resolution Models for Reaction Extraction
in Chemical Patents
- arxiv url: http://arxiv.org/abs/2306.13379v1
- Date: Fri, 23 Jun 2023 09:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-26 13:16:26.774672
- Title: Stress Testing BERT Anaphora Resolution Models for Reaction Extraction
in Chemical Patents
- Title(参考訳): 化学特許における反応抽出のための応力試験BERTアナフォラ分解モデル
- Authors: Chieling Yueh, Evangelos Kanoulas, Bruno Martins, Camilo Thorne, Saber
Akhondi
- Abstract要約: 化学特許には、共参照(co-reference)、変換(transform)、反応関連(reaction associated)、組立(work up)、包含(intained)の5つのアナフォリックな関係がある。
我々の目標は、ノイズフリーでノイズの多い環境で、反応テキストに対するアナフォラ分解能モデルの性能がどのように異なるかを検討することである。
- 参考スコア(独自算出の注目度): 7.653466578233261
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The high volume of published chemical patents and the importance of a timely
acquisition of their information gives rise to automating information
extraction from chemical patents. Anaphora resolution is an important component
of comprehensive information extraction, and is critical for extracting
reactions. In chemical patents, there are five anaphoric relations of interest:
co-reference, transformed, reaction associated, work up, and contained. Our
goal is to investigate how the performance of anaphora resolution models for
reaction texts in chemical patents differs in a noise-free and noisy
environment and to what extent we can improve the robustness against noise of
the model.
- Abstract(参考訳): 化学特許の大量発行と、その情報のタイムリーな取得の重要性により、化学特許から情報を抽出する自動化がもたらされる。
アナフォラ分解能は包括的情報抽出の重要な要素であり、反応の抽出に重要である。
化学特許には、共参照、変換、関連する反応、働き、含みの5つのアナフォリックな関係がある。
本研究の目的は, 化学特許における反応テキストに対するアナフォラ分解モデルの性能が, ノイズフリーでノイズの多い環境でどのように異なるか, そして, モデルのノイズに対するロバスト性をどの程度改善できるかを検討することである。
関連論文リスト
- Chemical Reaction Extraction from Long Patent Documents [3.376269351435396]
ChemPatKBは、先行技術検索を支援し、ドメインの専門家が化合物合成とユースケースの新しいイノベーションを探求するためのプラットフォームを提供するために使用できる。
このKBの基本的な構成要素は、長い特許文書から重要な反応スニペットを抽出することである。
本研究では,反応資源データベースを作成するために化学特許から反応を抽出する問題について検討する。
論文 参考訳(メタデータ) (2024-07-21T11:27:27Z) - A Self-feedback Knowledge Elicitation Approach for Chemical Reaction Predictions [24.80165173525286]
本稿では,データ処理による自己フィードバック型知識抽出手法を提案する。
我々は、事前知識を大規模言語モデルに注入するために適応的な即時学習を採用する。
この研究は、科学研究における知識の活用のための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2024-04-15T09:26:33Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - ReactIE: Enhancing Chemical Reaction Extraction with Weak Supervision [27.850325653751078]
構造化化学反応情報は、実験とコンピュータ支援医薬品設計のような先進的な取り組みに携わる化学者にとって重要な役割を担っている。
科学的文献から構造的反応を抽出することが重要であるにもかかわらず、この目的のためのデータアノテーションは、ドメインの専門家が必要とする多大な労力のためにコストを抑えることができる。
本稿では,2つの弱教師付き事前学習手法を組み合わせたReactIEを提案する。本手法では,テキスト内の頻繁なパターンを言語的手がかりとして用いて,化学反応の特異な特性を同定する。
論文 参考訳(メタデータ) (2023-07-04T02:52:30Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Named entity recognition in chemical patents using ensemble of
contextual language models [0.3731111830152912]
化学特許から情報を取り出すための文脈型言語モデルの有効性について検討する。
我々の最良のモデルは、多数アンサンブルのアプローチに基づくもので、正確なF1スコアは92.30%、緩和されたF1スコアは96.24%に達する。
論文 参考訳(メタデータ) (2020-07-24T15:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。