論文の概要: Efficient extraction of medication information from clinical notes: an evaluation in two languages
- arxiv url: http://arxiv.org/abs/2502.03257v1
- Date: Wed, 05 Feb 2025 15:13:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:27:56.439996
- Title: Efficient extraction of medication information from clinical notes: an evaluation in two languages
- Title(参考訳): 臨床ノートからの医薬情報の効率的な抽出--2言語による評価
- Authors: Thibaut Fabacher, Erik-André Sauleau, Emmanuelle Arcay, Bineta Faye, Maxime Alter, Archia Chahard, Nathan Miraillet, Adrien Coulet, Aurélie Névéol,
- Abstract要約: 本稿では,患者の治療体制に関連する物質とその関係を抽出するためのトランスフォーマーベースのアーキテクチャを提案する。
提案手法を用いて, ホピトー大学ストラスブール校の注釈付きコーパスを用いて, フランスの臨床ノートのモデルを訓練し, 評価した。
- 参考スコア(独自算出の注目度): 2.5610226051536578
- License:
- Abstract: Objective: To evaluate the accuracy, computational cost and portability of a new Natural Language Processing (NLP) method for extracting medication information from clinical narratives. Materials and Methods: We propose an original transformer-based architecture for the extraction of entities and their relations pertaining to patients' medication regimen. First, we used this approach to train and evaluate a model on French clinical notes, using a newly annotated corpus from H\^opitaux Universitaires de Strasbourg. Second, the portability of the approach was assessed by conducting an evaluation on clinical documents in English from the 2018 n2c2 shared task. Information extraction accuracy and computational cost were assessed by comparison with an available method using transformers. Results: The proposed architecture achieves on the task of relation extraction itself performance that are competitive with the state-of-the-art on both French and English (F-measures 0.82 and 0.96 vs 0.81 and 0.95), but reduce the computational cost by 10. End-to-end (Named Entity recognition and Relation Extraction) F1 performance is 0.69 and 0.82 for French and English corpus. Discussion: While an existing system developed for English notes was deployed in a French hospital setting with reasonable effort, we found that an alternative architecture offered end-to-end drug information extraction with comparable extraction performance and lower computational impact for both French and English clinical text processing, respectively. Conclusion: The proposed architecture can be used to extract medication information from clinical text with high performance and low computational cost and consequently suits with usually limited hospital IT resources
- Abstract(参考訳): 目的: 臨床物語から医薬品情報を抽出する自然言語処理法(NLP)の精度, 計算コスト, 移植性を評価する。
材料と方法: 患者の薬局に関するエンティティとそれらの関係を抽出するためのトランスフォーマーベースのアーキテクチャを提案する。
まず,H\^opitaux Universitaires de Strasbourgの注釈付きコーパスを用いて,フランスの臨床ノートのモデルを訓練し,評価した。
第2に、2018年のn2c2共有タスクから、英語の臨床文書の評価を行うことにより、アプローチの可搬性を評価した。
情報抽出精度と計算コストを,変圧器を用いた利用可能な方法との比較により評価した。
結果: 提案したアーキテクチャは,フランス語と英語の両方の最先端技術(F-measures 0.82 と 0.96 と 0.81 と 0.95 )と競合する関係抽出自体のパフォーマンスを達成しているが,計算コストを 10 に削減する。
エンド・ツー・エンド(名前付きエンティティ認識と関係抽出) F1 のパフォーマンスは、フランス語と英語のコーパスで 0.69 と 0.82 である。
考察: 既存の英語ノート用システムは, 合理的な努力でフランスの病院に展開されているが, 代替アーキテクチャでは, 同等の抽出性能と, 臨床テキスト処理における計算効果の低いエンドツーエンドの薬物情報抽出が可能であることが判明した。
結論:提案アーキテクチャは,高パフォーマンスで計算コストの低い臨床テキストから医薬情報を抽出し,その結果,病院IT資源の制限に適合する。
関連論文リスト
- ELMTEX: Fine-Tuning Large Language Models for Structured Clinical Information Extraction. A Case Study on Clinical Reports [3.0363830583066713]
本稿では,Large Language Models (LLMs) を用いて,構造化されていない臨床報告から構造化情報を抽出することを目的としたプロジェクトの結果について述べる。
我々は,ユーザインタフェースを用いたワークフローを開発し,戦略と微調整により,様々なサイズのLCMを評価した。
以上の結果から,微調整された小型モデルでは性能が向上し,資源制限設定の効率化が期待できることがわかった。
論文 参考訳(メタデータ) (2025-02-08T16:44:56Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Leveraging deep active learning to identify low-resource mobility
functioning information in public clinical notes [0.157286095422595]
国際機能・障害・健康分類(ICF)のモビリティ領域に関する最初の公開アノテートデータセット
我々はNational NLP Clinical Challenges (n2c2) 研究データセットを用いてキーワード拡張を用いた候補文のプールを構築する。
最終的なデータセットは,5,511のアクションエンティティ,5,328のモビリティエンティティ,306のアシストエンティティ,639の量子化エンティティを含む,合計11,784のエンティティからなる4,265の文で構成されています。
論文 参考訳(メタデータ) (2023-11-27T15:53:11Z) - FRASIMED: a Clinical French Annotated Resource Produced through
Crosslingual BERT-Based Annotation Projection [0.6116681488656472]
本稿では,言語横断的アノテーション投影による注釈付きデータセットの翻訳版を生成する手法を紹介する。
本報告では,フランスにおける2'051の合成臨床症例からなる注釈コーパスであるFRASIMED(Francial Annotated Resource with Semantic Information for Medical Detection)の作成について述べる。
論文 参考訳(メタデータ) (2023-09-19T17:17:28Z) - Impact of translation on biomedical information extraction from
real-life clinical notes [0.7227232362460347]
本稿では,フランス語モデルを含む手法と,英語モデルを含む手法の2つを比較した。
アルゴリズムのすべてのステップ(NER、正規化、翻訳)を評価するために、フランス語、英語、バイリンガルの注釈付きデータセットを使用しました。
最近の翻訳モデルの改善にもかかわらず、フランス語のネイティブな手法に有利な2つのアプローチの間には大きな性能差がある。
論文 参考訳(メタデータ) (2023-06-03T07:48:00Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - A Unified Framework of Medical Information Annotation and Extraction for
Chinese Clinical Text [1.4841452489515765]
現在の最先端(SOTA)NLPモデルは、ディープラーニング技術と高度に統合されている。
本研究では,医学的実体認識,関係抽出,属性抽出の工学的枠組みを提案する。
論文 参考訳(メタデータ) (2022-03-08T03:19:16Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。