論文の概要: Entity-driven Fact-aware Abstractive Summarization of Biomedical
Literature
- arxiv url: http://arxiv.org/abs/2203.15959v1
- Date: Wed, 30 Mar 2022 00:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 13:51:50.991428
- Title: Entity-driven Fact-aware Abstractive Summarization of Biomedical
Literature
- Title(参考訳): 生物医学文献のエンティティ駆動型ファクトアウェア抽象要約
- Authors: Amanuel Alambo, Tanvi Banerjee, Krishnaprasad Thirunarayan, Michael
Raymer
- Abstract要約: 本稿では, エンド・ツー・エンド・エンド・トランスフォーマーに基づくエンコーダ・デコーダ・モデルを用いて, バイオメディカル・アーティクルの抽象的な要約を学習するためのエンティティ駆動型ファクト・アウェア・フレームワークを提案する。
我々は5つの最先端変換器モデルを用いて実験を行う。
提案手法はICD-11-Summ-1000とPubMed-50kで評価される。
- 参考スコア(独自算出の注目度): 3.977582258550673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As part of the large number of scientific articles being published every
year, the publication rate of biomedical literature has been increasing.
Consequently, there has been considerable effort to harness and summarize the
massive amount of biomedical research articles. While transformer-based
encoder-decoder models in a vanilla source document-to-summary setting have
been extensively studied for abstractive summarization in different domains,
their major limitations continue to be entity hallucination (a phenomenon where
generated summaries constitute entities not related to or present in source
article(s)) and factual inconsistency. This problem is exacerbated in a
biomedical setting where named entities and their semantics (which can be
captured through a knowledge base) constitute the essence of an article. The
use of named entities and facts mined from background knowledge bases
pertaining to the named entities to guide abstractive summarization has not
been studied in biomedical article summarization literature. In this paper, we
propose an entity-driven fact-aware framework for training end-to-end
transformer-based encoder-decoder models for abstractive summarization of
biomedical articles. We call the proposed approach, whose building block is a
transformer-based model, EFAS, Entity-driven Fact-aware Abstractive
Summarization. We conduct experiments using five state-of-the-art
transformer-based models (two of which are specifically designed for long
document summarization) and demonstrate that injecting knowledge into the
training/inference phase of these models enables the models to achieve
significantly better performance than the standard source document-to-summary
setting in terms of entity-level factual accuracy, N-gram novelty, and semantic
equivalence while performing comparably on ROUGE metrics. The proposed approach
is evaluated on ICD-11-Summ-1000, and PubMed-50k.
- Abstract(参考訳): 毎年多くの科学論文が出版されている中で、生物医学文献の出版率は増加している。
その結果,大量のバイオメディカル研究論文の活用と要約に多大な努力が払われている。
バニラソースの文書から要約への抽象要約のためにトランスフォーマティブベースのエンコーダ・デコーダモデルが広く研究されているが、その主な制限はエンティティ幻覚(生成した要約がソースの記事に関連しない、あるいは存在しないエンティティを構成する現象)と事実的矛盾である。
この問題は、名前付きエンティティとその意味論(知識ベースを通して捉えられる)が記事の本質を構成する生体医学的な環境で悪化する。
抽象的な要約を導くために名前付きエンティティに関連する背景知識ベースから抽出された名前付きエンティティや事実は、生物医学記事要約文献では研究されていない。
本稿では,エンド・ツー・エンドのトランスフォーマーに基づくエンコーダ・デコーダモデルを訓練し,生体医学論文の要約を行うエンティティ駆動ファクト・アウェア・フレームワークを提案する。
提案手法はトランスフォーマーモデル, efas, entity-driven fact-aware abstractive summarization の構成要素である。
5つの最先端トランスフォーマーモデル(そのうちの2つは長文要約のために特別に設計された)を用いて実験を行い、これらのモデルのトレーニング/推論フェーズに知識を注入することで、エンティティレベルの事実の正確性、n-gramのノベル性、意味的等価性の観点から、モデルが標準のソースドキュメント対サマリー設定よりも大幅に優れたパフォーマンスを実現することを実証する。
提案手法はICD-11-Summ-1000とPubMed-50kで評価される。
関連論文リスト
- NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.14999444543328289]
本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文 参考訳(メタデータ) (2024-10-29T14:45:12Z) - SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - High-throughput Biomedical Relation Extraction for Semi-Structured Web Articles Empowered by Large Language Models [1.9665865095034865]
関係抽出タスクを大言語モデルのバイナリ分類として定式化する。
メインタイトルをテールエンティティとして指定し、コンテキストに明示的に組み込む。
長い内容はテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文 参考訳(メタデータ) (2023-12-13T16:43:41Z) - Controllable Topic-Focused Abstractive Summarization [57.8015120583044]
制御された抽象的な要約は、特定の側面をカバーするために、ソース記事の凝縮したバージョンを作成することに焦点を当てる。
本稿では,トピックに着目した要約を生成可能なトランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-11-12T03:51:38Z) - Integrating curation into scientific publishing to train AI models [1.6982459897303823]
我々は,複数モーダルデータキュレーションを学術出版プロセスに組み込んで,セグメント化された図形パネルやキャプションに注釈を付ける。
SourceData-NLPというデータセットには、620,000以上の注釈付きバイオメディカルエンティティが含まれている。
我々は、名前付き認識、図形キャプションを構成パネルに分割すること、コンテキスト依存型セマンティックタスクを用いて、AIモデルをトレーニングするためのデータセットの有用性を評価する。
論文 参考訳(メタデータ) (2023-10-31T13:22:38Z) - Improving Biomedical Abstractive Summarisation with Knowledge
Aggregation from Citation Papers [24.481854035628434]
既存の言語モデルは、バイオメディカルの専門家が生み出したものと同等の技術的要約を生成するのに苦労している。
本稿では,引用論文からドメイン固有の知識を統合する,新たな注目に基づく引用集約モデルを提案する。
我々のモデルは最先端のアプローチより優れており、抽象的なバイオメディカルテキスト要約の大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-10-24T09:56:46Z) - Readability Controllable Biomedical Document Summarization [17.166794984161964]
バイオメディカル文書の可読性制御のための新しいタスクを提案する。
ユーザの可読性要求を認識し、ニーズに合った要約を生成することを目的としている。
論文 参考訳(メタデータ) (2022-10-10T14:03:20Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Enhancing Factual Consistency of Abstractive Summarization [57.67609672082137]
ファクトアウェアな要約モデル FASum を提案し,実情関係を抽出し,要約生成プロセスに統合する。
次に,既存のシステムから生成した要約から事実誤りを自動的に補正する事実補正モデルFCを設計する。
論文 参考訳(メタデータ) (2020-03-19T07:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。