Fugu-MT 論文翻訳(概要): CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models

論文の概要: CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models

arxiv url: http://arxiv.org/abs/2306.05317v1
Date: Thu, 8 Jun 2023 16:08:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-09 13:26:46.123566
Title: CUED at ProbSum 2023: Hierarchical Ensemble of Summarization Models
Title（参考訳）: ProbSum 2023でのCUED: 要約モデルの階層的アンサンブル
Authors: Potsawee Manakul, Yassir Fathullah, Adian Liusie, Vyas Raina, Vatsal Raina, Mark Gales
Abstract要約: 我々は,患者の医療進歩ノートを限られたデータセットで要約する上での課題について考察する。バイオNLPワークショップ2023における課題リスト要約(Shared Task 1A)では,臨床T5の微調整による765件の診療ノートが,他の抽出的,抽象的,ゼロショットベースラインよりも優れていることを示した。
参考スコア（独自算出の注目度）: 8.237131071390715
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we consider the challenge of summarizing patients' medical progress notes in a limited data setting. For the Problem List Summarization (shared task 1A) at the BioNLP Workshop 2023, we demonstrate that Clinical-T5 fine-tuned to 765 medical clinic notes outperforms other extractive, abstractive and zero-shot baselines, yielding reasonable baseline systems for medical note summarization. Further, we introduce Hierarchical Ensemble of Summarization Models (HESM), consisting of token-level ensembles of diverse fine-tuned Clinical-T5 models, followed by Minimum Bayes Risk (MBR) decoding. Our HESM approach lead to a considerable summarization performance boost, and when evaluated on held-out challenge data achieved a ROUGE-L of 32.77, which was the best-performing system at the top of the shared task leaderboard.
Abstract（参考訳）: 本稿では,患者の医療進歩ノートを限られたデータで要約することの課題について考察する。バイオNLPワークショップ2023における課題リスト要約(Shared Task 1A)では,臨床T5の微調整が他の抽出,抽象的,ゼロショットベースラインよりも優れ,医用メモ要約のための合理的なベースラインシステムが得られることを示した。さらに,様々な微調整された臨床用t5モデルのトークンレベルアンサンブルと,最小ベイズリスク(mbr)デコードからなる階層型要約モデル(hesm)を導入する。我々のHESMアプローチは,性能向上に大きく寄与し,保持された課題データに基づいて評価すると,共有タスクリーダーボードの上位で最高の性能を示すROUGE-Lが32.77と達成された。

関連論文リスト

Beyond Benchmarks of IUGC: Rethinking Requirements of Deep Learning Methods for Intrapartum Ultrasound Biometry from Fetal Ultrasound Videos [58.71502465551297]
MICCAI 2024と共同でIUGC(Intrapartum Ultrasound Grand Challenge)が打ち上げられた。 IUGCは、標準的な平面分類、胎児の頭頂部生理的セグメンテーション、バイオメトリーを統合した、臨床指向のマルチタスク自動測定フレームワークを導入している。この課題は、これまでに3つの病院から収集された774のビデオ(68,106フレーム)を含む、最大規模のマルチセンターの超音波ビデオデータセットをリリースしている。
論文参考訳（メタデータ） (2026-02-13T13:28:22Z)
FUGC: Benchmarking Semi-Supervised Learning Methods for Cervical Segmentation [63.7829089874007]
本稿では,頚椎椎間板断裂における半教師あり学習のための最初のベンチマークであるFetal Ultrasound Grand Challenge (FUGC)を紹介する。 FUGCは、500のトレーニング画像、90の検証画像、300のテスト画像を含む890のTVSイメージのデータセットを提供する。 Dice similarity Coefficient (DSC), Hausdorff Distance (HD), and Runtime (RT), with a weighted combination of 0.4/0.4/0.2。
論文参考訳（メタデータ） (2026-01-22T01:34:39Z)
Overview of CHIP 2025 Shared Task 2: Discharge Medication Recommendation for Metabolic Diseases Based on Chinese Electronic Health Records [47.67215289515775]
退院薬の推奨は、治療継続性を確保し、寛容を予防し、長期管理を改善する上で重要な役割を担っている。本報告では、適切な退院薬を自動的に推奨する最先端のアプローチを開発することを目的とした、CHIP 2025共有タスク2コンペティションの概要について述べる。合計526チームが登録され、167チームと95チームがそれぞれフェーズAとフェーズBのリーダーボードに有効結果を提出した。トップパフォーマンスチームは最終テストセットで最高成績を記録し、ジャカードスコアは0.5102、F1スコアは0.6267であった。
論文参考訳（メタデータ） (2025-11-09T05:11:27Z)
MedHELM: Holistic Evaluation of Large Language Models for Medical Tasks [47.486705282473984]
大規模言語モデル(LLM)は、医学試験においてほぼ完璧なスコアを得る。これらの評価は、実際の臨床実践の複雑さと多様性を不十分に反映している。 MedHELMは,医療業務におけるLCMの性能を評価するための評価フレームワークである。
論文参考訳（メタデータ） (2025-05-26T22:55:49Z)
A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment [46.776978552161395]
小型言語モデル(SLM)は、GPT-4のような大規模言語モデルに代わる費用対効果を提供する。 SLMは費用対効果のある代替手段を提供するが、その限られた能力は生物医学的な領域適応を必要とする。本研究では,SLMを高性能な臨床モデルに適用するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-15T21:40:21Z)
Benchmarking Open-Source Large Language Models on Healthcare Text Classification Tasks [2.7729041396205014]
本研究では,オープンソースの5つの大言語モデル(LLM)の分類性能を評価する。全てのモデルとタスクの組み合わせに対して、95%の信頼区間を有する精度、リコール、F1スコアを報告する。
論文参考訳（メタデータ） (2025-03-19T12:51:52Z)
CSTRL: Context-Driven Sequential Transfer Learning for Abstractive Radiology Report Summarization [0.37109226820205005]
放射線学報告は、診断の発見と印象を含むいくつかのセクションから構成される。共通の抽象的な要約問題に優れた事前学習モデルは、専門の医療領域に適用した場合に困難に直面する。キーコンテンツ抽出とコヒーレント要約を保証するシーケンシャルトランスファー学習を導入する。
論文参考訳（メタデータ） (2025-02-21T08:32:11Z)
Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文参考訳（メタデータ） (2024-12-02T15:25:02Z)
Enhanced Electronic Health Records Text Summarization Using Large Language Models [0.0]
このプロジェクトは、臨床が優先する、焦点を絞った要約を生成するシステムを作成することで、以前の作業の上に構築される。提案システムでは,Flan-T5モデルを用いて,臨床専門のトピックに基づいた調整されたERHサマリーを生成する。
論文参考訳（メタデータ） (2024-10-12T19:36:41Z)
Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。 MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。 MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文参考訳（メタデータ） (2024-08-22T17:01:34Z)
Generating Faithful and Complete Hospital-Course Summaries from the Electronic Health Record [3.6513957125331555]
ドキュメントの負担の増加による意図しない結果が、患者との対面時間を短縮した。本稿では,患者の入院状況の要約を自動生成するためのソリューションを提案し,評価する。
論文参考訳（メタデータ） (2024-04-01T15:47:21Z)
Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。評価のために,GPT-4に基づく実測値CheXpromptを提案する。 LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文参考訳（メタデータ） (2024-03-12T18:12:02Z)
Overview of the Problem List Summarization (ProbSum) 2023 Shared Task on Summarizing Patients' Active Diagnoses and Problems from Electronic Health Record Progress Notes [5.222442967088892]
BioNLP Workshop 2023は、問題リスト要約に関する共有タスクの立ち上げを開始した(ProbSum)。参加者の目標は,重篤な患者の入院から収集した毎日のケアノートからのインプットを用いて,診断と問題のリストを作成するモデルを開発することである。 8つのチームが最終システムを共有タスクのリーダーボードに提出しました。
論文参考訳（メタデータ） (2023-06-08T15:19:57Z)
PULSAR: Pre-training with Extracted Healthcare Terms for Summarising Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。 BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。 1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文参考訳（メタデータ） (2023-06-05T10:17:50Z)
COLO: A Contrastive Learning based Re-ranking Framework for One-Stage Summarization [84.70895015194188]
コントラスト学習に基づく一段階要約フレームワークであるCOLOを提案する。 COLOはCNN/DailyMailベンチマークの1段階システムの抽出と抽象化結果を44.58と46.33ROUGE-1スコアに引き上げた。
論文参考訳（メタデータ） (2022-09-29T06:11:21Z)
WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文参考訳（メタデータ） (2022-04-13T15:27:05Z)
Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文参考訳（メタデータ） (2021-08-02T10:42:52Z)
Predicting Clinical Diagnosis from Patients Electronic Health Records Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文参考訳（メタデータ） (2020-07-15T09:22:55Z)
Attend to Medical Ontologies: Content Selection for Clinical Abstractive Summarization [22.062385543743293]
シークエンス・ツー・シーケンス(seq2seq)ネットワークは、テキスト要約タスクのための確立されたモデルである。本稿では,臨床抽象的要約のためのコンテンツ選択問題に対して,有能な存在論的用語を要約器に拡張することでアプローチする。
論文参考訳（メタデータ） (2020-05-01T01:12:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。