論文の概要: Improving Biomedical Abstractive Summarisation with Knowledge
Aggregation from Citation Papers
- arxiv url: http://arxiv.org/abs/2310.15684v1
- Date: Tue, 24 Oct 2023 09:56:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:30:49.240881
- Title: Improving Biomedical Abstractive Summarisation with Knowledge
Aggregation from Citation Papers
- Title(参考訳): 循環紙からの知識集約による医用抽象要約の改善
- Authors: Chen Tang, Shun Wang, Tomas Goldsack and Chenghua Lin
- Abstract要約: 既存の言語モデルは、バイオメディカルの専門家が生み出したものと同等の技術的要約を生成するのに苦労している。
本稿では,引用論文からドメイン固有の知識を統合する,新たな注目に基づく引用集約モデルを提案する。
我々のモデルは最先端のアプローチより優れており、抽象的なバイオメディカルテキスト要約の大幅な改善を実現している。
- 参考スコア(独自算出の注目度): 24.481854035628434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Abstracts derived from biomedical literature possess distinct domain-specific
characteristics, including specialised writing styles and biomedical
terminologies, which necessitate a deep understanding of the related
literature. As a result, existing language models struggle to generate
technical summaries that are on par with those produced by biomedical experts,
given the absence of domain-specific background knowledge. This paper aims to
enhance the performance of language models in biomedical abstractive
summarisation by aggregating knowledge from external papers cited within the
source article. We propose a novel attention-based citation aggregation model
that integrates domain-specific knowledge from citation papers, allowing neural
networks to generate summaries by leveraging both the paper content and
relevant knowledge from citation papers. Furthermore, we construct and release
a large-scale biomedical summarisation dataset that serves as a foundation for
our research. Extensive experiments demonstrate that our model outperforms
state-of-the-art approaches and achieves substantial improvements in
abstractive biomedical text summarisation.
- Abstract(参考訳): バイオメディカル文学から派生した抽象化は、専門的な書体や、関連する文献の深い理解を必要とするバイオメディカル用語など、ドメイン固有の特徴を持っている。
結果として、既存の言語モデルは、ドメイン固有の背景知識が欠如していることから、バイオメディカルの専門家が生み出したものと同等の技術的要約を生成するのに苦労する。
本稿では,文献から引用された外部論文から知識を集約することにより,生物医学的抽象要約における言語モデルの性能を向上させることを目的とする。
本稿では,引用論文からドメイン固有の知識を統合し,引用論文から論文の内容と関連知識の両方を活用することで要約をニューラルネットワークで生成する,新しい注目に基づく引用集約モデルを提案する。
さらに,本研究の基盤となる大規模生物医学的要約データセットを構築し,公開する。
広範な実験により,本モデルが最先端のアプローチを上回り,抽象的生物医学的テキスト要約の大幅な改善を達成していることが示された。
関連論文リスト
- Generalized knowledge-enhanced framework for biomedical entity and relation extraction [0.6856896119187885]
バイオメディカルな実体と関係抽出のためのタスク非依存で再利用可能な背景知識グラフを構築するための新しいフレームワークを開発する。
私たちのモデルの設計は、人間がドメイン固有のトピックを学ぶ方法にインスパイアされています。
我々のフレームワークは、そのような共通知識共有機構を用いて、異なるドメイン固有のバイオメディカルテキストに効果的に転送可能な学習が可能な、一般的なニューラルネットワーク知識グラフを構築する。
論文 参考訳(メタデータ) (2024-08-13T04:06:45Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - Multi-level biomedical NER through multi-granularity embeddings and
enhanced labeling [3.8599767910528917]
本稿では,複数のモデルの強みを統合するハイブリッドアプローチを提案する。
BERTは、文脈化された単語の埋め込み、文字レベルの情報キャプチャのための事前訓練されたマルチチャネルCNN、およびテキスト内の単語間の依存関係のシーケンスラベリングとモデル化のためのBiLSTM + CRFを提供する。
我々は、ベンチマークi2b2/2010データセットを用いて、F1スコア90.11を達成する。
論文 参考訳(メタデータ) (2023-12-24T21:45:36Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - High-throughput Biomedical Relation Extraction for Semi-Structured Web Articles Empowered by Large Language Models [1.9665865095034865]
関係抽出タスクを大言語モデルのバイナリ分類として定式化する。
メインタイトルをテールエンティティとして指定し、コンテキストに明示的に組み込む。
長い内容はテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文 参考訳(メタデータ) (2023-12-13T16:43:41Z) - Enhancing Biomedical Lay Summarisation with External Knowledge Graphs [28.956500948255677]
そこで本研究では,知識グラフをレイ・サマリゼーション・モデルに組み込むための3つのアプローチの有効性について検討する。
この結果から,グラフベースのドメイン知識の統合は,生成したテキストの可読性を大幅に向上させることで,レイ・サマライズを著しく向上させることが可能であることが確認された。
論文 参考訳(メタデータ) (2023-10-24T10:25:21Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。
毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。
生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。
我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文 参考訳(メタデータ) (2021-09-27T17:00:14Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Literature Triage on Genomic Variation Publications by
Knowledge-enhanced Multi-channel CNN [5.187865216685969]
本研究の目的は,ゲノム変異と特定の疾患や表現型との関連性を検討することである。
我々は多チャンネル畳み込みネットワークを採用し、リッチテキスト情報を活用し、異なるコーパスからのセマンティックギャップをブリッジする。
本モデルは,バイオメディカル文献トリアージ結果の精度を向上させる。
論文 参考訳(メタデータ) (2020-05-08T13:47:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。