論文の概要: Abstractified Multi-instance Learning (AMIL) for Biomedical Relation
Extraction
- arxiv url: http://arxiv.org/abs/2110.12501v1
- Date: Sun, 24 Oct 2021 17:49:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 14:10:45.438049
- Title: Abstractified Multi-instance Learning (AMIL) for Biomedical Relation
Extraction
- Title(参考訳): バイオメディカルな関係抽出のための抽象的マルチインスタンス学習(AMIL)
- Authors: William Hogan, Molly Huang, Yannis Katsis, Tyler Baldwin, Ho-Cheol
Kim, Yoshiki Vazquez Baeza, Andrew Bartko, Chun-Nan Hsu
- Abstract要約: 本稿では,生物医学領域における関係抽出のためのMIL (Multi-instance Learning) の改訂を提案する。
エンティティをタイプ別にグループ化することで、MILの利点を活かし、トレーニングシグナルをさらに軽視することが可能になる。
本稿では, 生物医学的関係抽出における性能の向上を図り, 抽象的マルチインスタンス学習(AMIL)と呼ぶこの改革について述べる。
- 参考スコア(独自算出の注目度): 0.7695660509846215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Relation extraction in the biomedical domain is a challenging task due to a
lack of labeled data and a long-tail distribution of fact triples. Many works
leverage distant supervision which automatically generates labeled data by
pairing a knowledge graph with raw textual data. Distant supervision produces
noisy labels and requires additional techniques, such as multi-instance
learning (MIL), to denoise the training signal. However, MIL requires multiple
instances of data and struggles with very long-tail datasets such as those
found in the biomedical domain. In this work, we propose a novel reformulation
of MIL for biomedical relation extraction that abstractifies biomedical
entities into their corresponding semantic types. By grouping entities by
types, we are better able to take advantage of the benefits of MIL and further
denoise the training signal. We show this reformulation, which we refer to as
abstractified multi-instance learning (AMIL), improves performance in
biomedical relationship extraction. We also propose a novel relationship
embedding architecture that further improves model performance.
- Abstract(参考訳): 生物医学領域における関係抽出は、ラベル付きデータの欠如とファクトトリプルの長期分布のために難しい課題である。
多くの研究は、知識グラフと生のテキストデータを組み合わせてラベル付きデータを自動的に生成する遠隔監視を活用している。
遠隔監視はノイズの多いラベルを生成し、訓練信号をノイズ化するためには、MIL(Multi-instance Learning)のような追加のテクニックを必要とする。
しかし、MILはデータの複数のインスタンスを必要とし、バイオメディカル領域で見られるような非常に長い尾のデータセットと競合する。
本研究では,生物医学的実体をそれらの意味型に抽象化する生物医学的関係抽出のための新しいMILの再構成を提案する。
エンティティをタイプ別にグループ化することで、MILの利点を活かし、トレーニングシグナルをさらに軽視することが可能になる。
本稿では, 生物医学的関係抽出における性能の向上を図り, 抽象的マルチインスタンス学習(AMIL)と呼ぶ。
また,モデル性能をさらに向上させる新しい関係埋め込みアーキテクチャを提案する。
関連論文リスト
- Graph-Based Retriever Captures the Long Tail of Biomedical Knowledge [2.2814097119704058]
大規模言語モデル(LLM)は、膨大な知識を要約して提示することで、情報の検索方法を変えつつある。
LLMはトレーニングセットから最も頻繁に見られる情報を強調し、まれな情報を無視する傾向があります。
本稿では,これらのクラスタをダウンサンプリングし,情報過負荷問題を緩和するために知識グラフを活用する新しい情報検索手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T18:31:11Z) - EMBRE: Entity-aware Masking for Biomedical Relation Extraction [12.821610050561256]
本稿では,関係抽出のためのEMBRE (Entity-Aware Masking for Biomedical Relation extract) 法を提案する。
具体的には、バックボーンモデルとエンティティマスキングの目的を事前学習することにより、エンティティ知識をディープニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2024-01-15T18:12:01Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - An Empirical Study on Relation Extraction in the Biomedical Domain [0.0]
文レベルの関係抽出と文書レベルの関係抽出について検討し、いくつかのベンチマークデータセット上で最先端の手法を実行する。
以上の結果から,(1)現行の文書レベルの関係抽出手法は高い一般化能力を有し,(2)既存の手法では,バイオメディシンのモデル微調整に大量のラベル付きデータを必要とすることがわかった。
論文 参考訳(メタデータ) (2021-12-11T03:36:38Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。
毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。
生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。
我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文 参考訳(メタデータ) (2021-09-27T17:00:14Z) - Slot Filling for Biomedical Information Extraction [0.5330240017302619]
バイオメディカルIEの課題に対してスロットフィリングアプローチを提案する。
我々は、トランフォーマベースのバイエンコーダDense Passage RetrievalをTransformerベースのリーダーモデルと結合する提案パラダイムに従う。
論文 参考訳(メタデータ) (2021-09-17T14:16:00Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z) - Towards Robust Partially Supervised Multi-Structure Medical Image
Segmentation on Small-Scale Data [123.03252888189546]
データ不足下における部分教師付き学習(PSL)における方法論的ギャップを埋めるために,不確実性下でのビシナルラベル(VLUU)を提案する。
マルチタスク学習とヴィジナルリスク最小化によって動機づけられたVLUUは、ビジナルラベルを生成することによって、部分的に教師付き問題を完全な教師付き問題に変換する。
本研究は,ラベル効率の高い深層学習における新たな研究の方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-11-28T16:31:00Z) - ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised
Medical Image Segmentation [99.90263375737362]
教師-学生最適化の非同期版であるATSOを提案する。
ATSOはラベルのないデータを2つのサブセットに分割し、モデルの微調整に1つのサブセットを交互に使用し、他のサブセットのラベルを更新する。
医用画像のセグメンテーションデータセットを2つ評価し,様々な半教師付き環境において優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-24T04:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。