論文の概要: A Benchmark Dataset for Understandable Medical Language Translation
- arxiv url: http://arxiv.org/abs/2012.02420v1
- Date: Fri, 4 Dec 2020 06:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 09:44:35.809366
- Title: A Benchmark Dataset for Understandable Medical Language Translation
- Title(参考訳): 理解可能な医学用語翻訳のためのベンチマークデータセット
- Authors: Junyu Luo, Zifei Zheng, Hanzhong Ye, Muchao Ye, Yaqing Wang, Quanzeng
You, Cao Xiao and Fenglong Ma
- Abstract要約: MedLaneは、人手による新しい医療用言語翻訳データセットである。
我々は、MedLaneデータセット上で1つのナイーブと6つのディープラーニングベースのアプローチを評価する。
- 参考スコア(独自算出の注目度): 47.917510052684506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce MedLane -- a new human-annotated Medical Language
translation dataset, to align professional medical sentences with
layperson-understandable expressions. The dataset contains 12,801 training
samples, 1,015 validation samples, and 1,016 testing samples. We then evaluate
one naive and six deep learning-based approaches on the MedLane dataset,
including directly copying, a statistical machine translation approach Moses,
four neural machine translation approaches (i.e., the proposed PMBERT-MT model,
Seq2Seq and its two variants), and a modified text summarization model
PointerNet. To compare the results, we utilize eleven metrics, including three
new measures specifically designed for this task. Finally, we discuss the
limitations of MedLane and baselines, and point out possible research
directions for this task.
- Abstract(参考訳): 本稿では,専門的な医学文と素人理解可能な表現を連携させるための,人間による新しい医学用語翻訳データセットであるmedlaneを紹介する。
データセットには12,801のトレーニングサンプル、1,015の検証サンプル、1,016のテストサンプルが含まれている。
次に,medlaneデータセットにおける1つのnaiveと6つのディープラーニングに基づくアプローチを評価する。直接コピー,統計機械翻訳アプローチモーゼ,4つのニューラルネットワーク翻訳アプローチ(提案するpmbert-mtモデル,seq2seqとその2つの変種),修正されたテキスト要約モデル pointernet などである。
結果を比較するために,この課題に特化して設計された3つの新しい指標を含む11の指標を利用する。
最後に,メドレーンとベースラインの限界を議論し,この課題に対する研究の方向性を指摘する。
関連論文リスト
- Improving Clinical Note Generation from Complex Doctor-Patient Conversation [20.2157016701399]
大言語モデル(LLM)を用いた臨床ノート作成分野への3つの重要な貢献について述べる。
まず、CliniKnoteを紹介します。CliniKnoteは、1200の複雑な医師と患者との会話と、その全臨床ノートを組み合わせたデータセットです。
第2に,従来のSOAPcitepodder20soap(Subjective, Objective, Assessment, Plan)のメモを上位にキーワードセクションを追加することで,必須情報の迅速な識別を可能にするK-SOAPを提案する。
第3に、医師と患者との会話からK-SOAPノートを生成する自動パイプラインを開発し、様々な近代LCMをベンチマークする。
論文 参考訳(メタデータ) (2024-08-26T18:39:31Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text
Summaries [62.32403630651586]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Adapted Large Language Models Can Outperform Medical Experts in Clinical Text Summarization [8.456700096020601]
大規模言語モデル (LLM) は自然言語処理 (NLP) において有望であるが, 様々な臨床要約タスクにおける有効性は証明されていない。
本研究では,4つの臨床要約課題にまたがる8つのLCMに適応法を適用した。
10名の医師による臨床読影者を対象に, 要約, 完全性, 正当性, 簡潔性を評価した。ほとんどの場合, ベスト適応LSMの要約は, 医用専門家の要約と比べ, 同等(45%), 上等(36%)である。
論文 参考訳(メタデータ) (2023-09-14T05:15:01Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。