論文の概要: FoodChem: A food-chemical relation extraction model
- arxiv url: http://arxiv.org/abs/2110.02019v1
- Date: Tue, 5 Oct 2021 13:07:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 14:24:22.667087
- Title: FoodChem: A food-chemical relation extraction model
- Title(参考訳): foodchem: 食品・化学関係抽出モデル
- Authors: Gjorgjina Cenikj, Barbara Korou\v{s}i\'c Seljak and Tome Eftimov
- Abstract要約: 食品成分組成に含まれる化学物質を同定するための新しい関係抽出(RE)モデルを提案する。
BioBERTモデルは、マクロ平均F1スコアが0.902のアンバランスな拡張設定で、最良の結果を得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we present FoodChem, a new Relation Extraction (RE) model for
identifying chemicals present in the composition of food entities, based on
textual information provided in biomedical peer-reviewed scientific literature.
The RE task is treated as a binary classification problem, aimed at identifying
whether the contains relation exists between a food-chemical entity pair. This
is accomplished by fine-tuning BERT, BioBERT and RoBERTa transformer models.
For evaluation purposes, a novel dataset with annotated contains relations in
food-chemical entity pairs is generated, in a golden and silver version. The
models are integrated into a voting scheme in order to produce the silver
version of the dataset which we use for augmenting the individual models, while
the manually annotated golden version is used for their evaluation. Out of the
three evaluated models, the BioBERT model achieves the best results, with a
macro averaged F1 score of 0.902 in the unbalanced augmentation setting.
- Abstract(参考訳): 本稿では,生物医学的ピアリビュード科学文献に提供されたテキスト情報に基づいて,食品構成中の化学物質を識別するための新しい関係抽出(re)モデルであるfoodchemを提案する。
REタスクは二項分類問題として扱われ、食品化学の実体対の間に含みのある関係が存在するかどうかを識別する。
これはBERT、BioBERT、RoBERTaトランスモデルによって実現されている。
評価目的のために、金銀版において、食品・化学実体対の関係を含む注釈付き新規データセットを生成する。
これらのモデルは,個々のモデルの増補に使用するデータセットの銀版を生成するために投票方式に統合され,手動で注釈付けした黄金版が評価に使用される。
3つの評価モデルのうち、BioBERTモデルが最も良い結果が得られ、マクロ平均F1スコアは、アンバランスな拡張設定で0.902である。
関連論文リスト
- FlavorDiffusion: Predicting Food Pairings and Chemical Interactions Using Diffusion Models [0.0]
本稿では,フレーバー拡散モデルを用いた食品化学相互作用と成分ペアリングの予測手法を提案する。
グラフベースの埋め込み、拡散プロセス、化学特性の符号化を統合することで、FravorDiffusionはデータの不均衡に対処し、クラスタリングの品質を高める。
提案する枠組みは, 食品科学におけるスケーラブルで解釈可能な, 化学的に情報を得たソリューションを提供する, 計算ガストロノミーにおける重要な一歩である。
論文 参考訳(メタデータ) (2025-02-08T06:47:27Z) - Gene-Metabolite Association Prediction with Interactive Knowledge Transfer Enhanced Graph for Metabolite Production [49.814615043389864]
メタボリックグラフに基づく遺伝子メタボリック・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション・アソシエーション
2474の代謝産物と1947年の2つの一般的な微生物の遺伝子を含む最初のベンチマークを提示する。
提案手法は,各種リンク予測フレームワークのベースラインを最大12.3%向上させる。
論文 参考訳(メタデータ) (2024-10-24T06:54:27Z) - ReacLLaMA: Merging chemical and textual information in chemical
reactivity AI models [0.0]
化学反応性モデルは、分類(success/failure)や回帰(product yield)タスクの形式で化学反応の結果を予測するために開発されている。
報告されたモデルの大半は、反応剤、生成物、試薬、溶媒などの化学情報のみに基づいて訓練されている。
ここでは、Graphormerの反応性モデルを強化し、その精度を向上させることを目的とした手続きテキストの組み入れについて述べる。
論文 参考訳(メタデータ) (2024-01-30T18:57:08Z) - Relation Extraction in underexplored biomedical domains: A
diversity-optimised sampling and synthetic data generation approach [0.0]
ラベル付きデータの空間性は関係抽出モデルの開発に障害となる。
我々は、最初のキュレートされた評価データセットを作成し、LOTUSデータベースから文献項目を抽出し、トレーニングセットを構築する。
我々は,オープンな大規模言語モデルを用いた生成タスクと数ショット学習として,標準微調整の性能を評価する。
論文 参考訳(メタデータ) (2023-11-10T19:36:00Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - A Distant Supervision Corpus for Extracting Biomedical Relationships
Between Chemicals, Diseases and Genes [35.372588846754645]
ChemDisGeneは、マルチクラスマルチラベル文書レベルのバイオメディカル関係抽出モデルのトレーニングと評価のための新しいデータセットである。
我々のデータセットには、化学物質、疾患、遺伝子への言及をラベル付けした80万のバイオメディカル研究が含まれている。
論文 参考訳(メタデータ) (2022-04-13T18:02:05Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Energy-based View of Retrosynthesis [70.66156081030766]
エネルギーモデルとしてシーケンスおよびグラフベースの手法を統一するフレームワークを提案する。
本稿では,ベイズ前方および後方予測に対して一貫した訓練を行うフレームワーク内での新しい二重変種を提案する。
このモデルは、反応型が不明なテンプレートフリーアプローチに対して、最先端の性能を9.6%向上させる。
論文 参考訳(メタデータ) (2020-07-14T18:51:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。