論文の概要: Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation
- arxiv url: http://arxiv.org/abs/2012.02420v2
- Date: Thu, 21 Sep 2023 20:53:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 19:54:47.452912
- Title: Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation
- Title(参考訳): 自動臨床言語簡易化のベンチマーク:データセット,アルゴリズム,評価
- Authors: Junyu Luo, Zifei Zheng, Hanzhong Ye, Muchao Ye, Yaqing Wang, Quanzeng
You, Cao Xiao and Fenglong Ma
- Abstract要約: 我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
- 参考スコア(独自算出の注目度): 48.87254340298189
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patients with low health literacy usually have difficulty understanding
medical jargon and the complex structure of professional medical language.
Although some studies are proposed to automatically translate expert language
into layperson-understandable language, only a few of them focus on both
accuracy and readability aspects simultaneously in the clinical domain. Thus,
simplification of the clinical language is still a challenging task, but
unfortunately, it is not yet fully addressed in previous work. To benchmark
this task, we construct a new dataset named MedLane to support the development
and evaluation of automated clinical language simplification approaches.
Besides, we propose a new model called DECLARE that follows the human
annotation procedure and achieves state-of-the-art performance compared with
eight strong baselines. To fairly evaluate the performance, we also propose
three specific evaluation metrics. Experimental results demonstrate the utility
of the annotated MedLane dataset and the effectiveness of the proposed model
DECLARE.
- Abstract(参考訳): 医療リテラシーの低い患者は、医学用語や専門用語の複雑な構造を理解するのが難しい。
専門家言語を日常理解可能な言語に自動的に翻訳する研究が提案されているが、臨床領域における正確性と可読性の両方に焦点をあてる研究はほとんどない。
このように、臨床言語を単純化することは依然として困難な作業であるが、残念ながら以前の作業ではまだ完全には対処されていない。
このタスクをベンチマークするために, 臨床言語自動化手法の開発と評価を支援するために, medlane という新しいデータセットを構築した。
さらに,人間のアノテーションの手順に従って,8つの強いベースラインと比較して最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
また,性能を評価するために,3つの評価指標を提案する。
実験により,注釈付きMedLaneデータセットの有用性と提案モデルDECLAREの有効性が示された。
関連論文リスト
- Improving Clinical Note Generation from Complex Doctor-Patient Conversation [20.2157016701399]
大言語モデル(LLM)を用いた臨床ノート作成分野への3つの重要な貢献について述べる。
まず、CliniKnoteを紹介します。CliniKnoteは、1200の複雑な医師と患者との会話と、その全臨床ノートを組み合わせたデータセットです。
第2に,従来のSOAPcitepodder20soap(Subjective, Objective, Assessment, Plan)のメモを上位にキーワードセクションを追加することで,必須情報の迅速な識別を可能にするK-SOAPを提案する。
第3に、医師と患者との会話からK-SOAPノートを生成する自動パイプラインを開発し、様々な近代LCMをベンチマークする。
論文 参考訳(メタデータ) (2024-08-26T18:39:31Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text
Summaries [62.32403630651586]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Adapted Large Language Models Can Outperform Medical Experts in Clinical Text Summarization [8.456700096020601]
大規模言語モデル (LLM) は自然言語処理 (NLP) において有望であるが, 様々な臨床要約タスクにおける有効性は証明されていない。
本研究では,4つの臨床要約課題にまたがる8つのLCMに適応法を適用した。
10名の医師による臨床読影者を対象に, 要約, 完全性, 正当性, 簡潔性を評価した。ほとんどの場合, ベスト適応LSMの要約は, 医用専門家の要約と比べ, 同等(45%), 上等(36%)である。
論文 参考訳(メタデータ) (2023-09-14T05:15:01Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。