論文の概要: CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models
- arxiv url: http://arxiv.org/abs/2306.05317v1
- Date: Thu, 8 Jun 2023 16:08:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 13:26:46.123566
- Title: CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models
- Title(参考訳): ProbSum 2023でのCUED: 要約モデルの階層的アンサンブル
- Authors: Potsawee Manakul, Yassir Fathullah, Adian Liusie, Vyas Raina, Vatsal
Raina, Mark Gales
- Abstract要約: 我々は,患者の医療進歩ノートを限られたデータセットで要約する上での課題について考察する。
バイオNLPワークショップ2023における課題リスト要約(Shared Task 1A)では,臨床T5の微調整による765件の診療ノートが,他の抽出的,抽象的,ゼロショットベースラインよりも優れていることを示した。
- 参考スコア(独自算出の注目度): 8.237131071390715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the challenge of summarizing patients' medical
progress notes in a limited data setting. For the Problem List Summarization
(shared task 1A) at the BioNLP Workshop 2023, we demonstrate that Clinical-T5
fine-tuned to 765 medical clinic notes outperforms other extractive,
abstractive and zero-shot baselines, yielding reasonable baseline systems for
medical note summarization. Further, we introduce Hierarchical Ensemble of
Summarization Models (HESM), consisting of token-level ensembles of diverse
fine-tuned Clinical-T5 models, followed by Minimum Bayes Risk (MBR) decoding.
Our HESM approach lead to a considerable summarization performance boost, and
when evaluated on held-out challenge data achieved a ROUGE-L of 32.77, which
was the best-performing system at the top of the shared task leaderboard.
- Abstract(参考訳): 本稿では,患者の医療進歩ノートを限られたデータで要約することの課題について考察する。
バイオNLPワークショップ2023における課題リスト要約(Shared Task 1A)では,臨床T5の微調整が他の抽出,抽象的,ゼロショットベースラインよりも優れ,医用メモ要約のための合理的なベースラインシステムが得られることを示した。
さらに,様々な微調整された臨床用t5モデルのトークンレベルアンサンブルと,最小ベイズリスク(mbr)デコードからなる階層型要約モデル(hesm)を導入する。
我々のHESMアプローチは,性能向上に大きく寄与し,保持された課題データに基づいて評価すると,共有タスクリーダーボードの上位で最高の性能を示すROUGE-Lが32.77と達成された。
関連論文リスト
- SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and
Related Observable Overgeneration Mistakes [49.97855996078954]
本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文 参考訳(メタデータ) (2024-03-12T15:06:22Z) - SoftTiger: A Clinical Foundation Model for Healthcare Workflows [5.559128550958323]
医療基盤モデルとして設計された臨床用大規模言語モデル(CLaM)であるSoftTigerをリリースし紹介する。
我々は,臨床ノートを臨床データに構造化する上で重要な問題に対処する。
我々は,3つの重要なサブタスク,すなわち国際的患者要約,臨床的印象,医療的出会いのデータを収集し,注釈する。
論文 参考訳(メタデータ) (2024-03-01T04:39:16Z) - Overview of the Problem List Summarization (ProbSum) 2023 Shared Task on
Summarizing Patients' Active Diagnoses and Problems from Electronic Health
Record Progress Notes [5.222442967088892]
BioNLP Workshop 2023は、問題リスト要約に関する共有タスクの立ち上げを開始した(ProbSum)。
参加者の目標は,重篤な患者の入院から収集した毎日のケアノートからのインプットを用いて,診断と問題のリストを作成するモデルを開発することである。
8つのチームが最終システムを共有タスクのリーダーボードに提出しました。
論文 参考訳(メタデータ) (2023-06-08T15:19:57Z) - PULSAR: Pre-training with Extracted Healthcare Terms for Summarising
Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。
BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。
1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。
私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文 参考訳(メタデータ) (2023-06-05T10:17:50Z) - Neural Summarization of Electronic Health Records [8.784162652042957]
本研究では,4つの最先端ニューラルネットワーク要約モデルを用いて,放電要約の様々な部分の自動生成の実現可能性について検討した。
従来の微調整言語モデルでは、レポート全体を要約する性能が向上した。
論文 参考訳(メタデータ) (2023-05-24T15:05:53Z) - MAPPING: Model Average with Post-processing for Stroke Lesion
Segmentation [57.336056469276585]
我々は nnU-Net フレームワークに基づく脳卒中病変のセグメンテーションモデルを提案し, ストローク後の解剖学的トレースに応用する。
本手法は,2022年のMICCAI ATLAS Challengeにおいて,平均Diceスコアが0.6667,Lesion-wise F1スコアが0.5643,Simple Lesion Countスコアが4.5367,Volume differenceスコアが8804.9102であった。
論文 参考訳(メタデータ) (2022-11-11T14:17:04Z) - COLO: A Contrastive Learning based Re-ranking Framework for One-Stage
Summarization [84.70895015194188]
コントラスト学習に基づく一段階要約フレームワークであるCOLOを提案する。
COLOはCNN/DailyMailベンチマークの1段階システムの抽出と抽象化結果を44.58と46.33ROUGE-1スコアに引き上げた。
論文 参考訳(メタデータ) (2022-09-29T06:11:21Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Attend to Medical Ontologies: Content Selection for Clinical Abstractive
Summarization [22.062385543743293]
シークエンス・ツー・シーケンス(seq2seq)ネットワークは、テキスト要約タスクのための確立されたモデルである。
本稿では,臨床抽象的要約のためのコンテンツ選択問題に対して,有能な存在論的用語を要約器に拡張することでアプローチする。
論文 参考訳(メタデータ) (2020-05-01T01:12:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。