論文の概要: Named Entities in Medical Case Reports: Corpus and Experiments
- arxiv url: http://arxiv.org/abs/2003.13032v1
- Date: Sun, 29 Mar 2020 14:08:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:41:48.374770
- Title: Named Entities in Medical Case Reports: Corpus and Experiments
- Title(参考訳): 医療事例報告における名前付きエンティティ:コーパスと実験
- Authors: Sarah Schulz and Jurica \v{S}eva and Samuel Rodriguez and Malte
Ostendorff and Georg Rehm
- Abstract要約: 本稿では, PubMed Centralのオープンアクセスライブラリを起源とする, 症例報告における医療機関のアノテーションを含む新しいコーパスを提案する。
症例報告では, 症例, 状況, 所見, 要因, 否定修飾剤を注記する。
この種のコーパスは、英語の科学コミュニティで利用可能となった最初のコーパスである。
- 参考スコア(独自算出の注目度): 0.5773440045183915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new corpus comprising annotations of medical entities in case
reports, originating from PubMed Central's open access library. In the case
reports, we annotate cases, conditions, findings, factors and negation
modifiers. Moreover, where applicable, we annotate relations between these
entities. As such, this is the first corpus of this kind made available to the
scientific community in English. It enables the initial investigation of
automatic information extraction from case reports through tasks like Named
Entity Recognition, Relation Extraction and (sentence/paragraph) relevance
detection. Additionally, we present four strong baseline systems for the
detection of medical entities made available through the annotated dataset.
- Abstract(参考訳): 本稿では, PubMed Centralのオープンアクセスライブラリを起源とする, 症例報告における医療機関のアノテーションを含む新しいコーパスを提案する。
症例報告では, 症例, 状況, 所見, 因子, 否定修飾因子に注釈を付した。
さらに、適用すれば、これらのエンティティ間の関係を注釈します。
この種のコーパスは、英語で科学コミュニティに提供される最初のものである。
これにより、名前付きエンティティ認識、関係抽出、(文/パラグラフ)関連検出といったタスクを通じて、ケースレポートから自動情報抽出を最初に行うことができる。
さらに,アノテートされたデータセットから医療機関を検出するための4つの強力なベースラインシステムを提案する。
関連論文リスト
- RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - "Nothing Abnormal": Disambiguating Medical Reports via Contrastive
Knowledge Infusion [6.9551174393701345]
コントラスト型事前学習と摂動型書き換えに基づく書き換えアルゴリズムを提案する。
胸部報告に基づくOpenI-Annotatedと、一般的な医療報告に基づくVA-Annotatedの2つのデータセットを作成しました。
提案アルゴリズムは,高内容忠実度で少ないあいまいな方法で文を効果的に書き換える。
論文 参考訳(メタデータ) (2023-05-15T02:01:20Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Automated tabulation of clinical trial results: A joint entity and
relation extraction approach with transformer-based language representations [5.825190876052148]
本稿では,2つの言語処理タスク間で問題を分解し,エビデンス表の自動生成について検討する。
本稿では,実践成果を報告するRCT要約文の自動集計に着目する。
これらのモデルを訓練し、試験するために、6つの疾患領域から600近い結果文を含む新しいゴールドスタンダードコーパスが開発された。
論文 参考訳(メタデータ) (2021-12-10T15:26:43Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Writing by Memorizing: Hierarchical Retrieval-based Medical Report
Generation [26.134055930805523]
レポートと文レベルのテンプレートの両方を自動的に抽出する新しい階層的検索機構を組み込んだMedWriterを提案する。
MedWriterはまずVisual-Language Retrieval(VLR)モジュールを使用して、与えられた画像の最も関連性の高いレポートを取得する。
文間の論理的一貫性を保証するため、言語言語検索(LLR)モジュールを導入し、関連する文を検索する。
最終的に、言語デコーダは、検索されたレポートと文から画像の特徴と特徴を融合して、意味のある医療レポートを生成する。
論文 参考訳(メタデータ) (2021-05-25T07:47:23Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z) - Extracting Structured Data from Physician-Patient Conversations By
Predicting Noteworthy Utterances [39.888619005843246]
本稿では,会話の書き起こし,ビジット後要約,対応する証拠(転写文),構造化ラベルからなる新しいデータセットについて述べる。
方法論的な課題の1つは、会話が長く(約1500語)、現代のディープラーニングモデルではそれらを入力として使うのが難しいことである。
予測音声を初めてフィルタリングすることにより,診断とRoS異常の両方を認識するための予測性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:10:37Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - NUBES: A Corpus of Negation and Uncertainty in Spanish Clinical Texts [5.424799109837065]
本稿では,NUBes corpusの最初のバージョンを紹介する(スペイン語のバイオメディカルテキストにおける否定的アノテーションと不確実性アノテーション)。
コーパスは現在進行中の研究の一部であり、否定と不確実性を示す匿名化された健康記録から得られた29,682の文で構成されている。
論文 参考訳(メタデータ) (2020-04-02T15:51:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。