論文の概要: Natural Language Processing for Electronic Health Records in Scandinavian Languages: Norwegian, Swedish, and Danish
- arxiv url: http://arxiv.org/abs/2503.18539v1
- Date: Mon, 24 Mar 2025 10:47:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:39:55.388918
- Title: Natural Language Processing for Electronic Health Records in Scandinavian Languages: Norwegian, Swedish, and Danish
- Title(参考訳): スカンジナビア語における電子健康記録のための自然言語処理:ノルウェー語、スウェーデン語、デンマーク語
- Authors: Ashenafi Zebene Woldaregay, Jørgen Aarmo Lund, Phuong Dinh Ngo, Mariyam Tayefi, Joel Burman, Stine Hansen, Martin Hylleholt Sillesen, Hercules Dalianis, Robert Jenssen, Lindsetmo Rolf Ole, Karl Øyvind Mikalsen,
- Abstract要約: この研究は、スカンジナビア本土の臨床テキストに対する最先端のNLP法の評価と分析を体系的に行うことを目的としている。
113記事のうち、18%がノルウェーの臨床的テキストに焦点を当て、64%(n=72)がスウェーデン語、10%(n=11)がデンマーク語、8%(n=9)が複数の言語に焦点を当てている。
- 参考スコア(独自算出の注目度): 7.7320970512851614
- License:
- Abstract: Background: Clinical natural language processing (NLP) refers to the use of computational methods for extracting, processing, and analyzing unstructured clinical text data, and holds a huge potential to transform healthcare in various clinical tasks. Objective: The study aims to perform a systematic review to comprehensively assess and analyze the state-of-the-art NLP methods for the mainland Scandinavian clinical text. Method: A literature search was conducted in various online databases including PubMed, ScienceDirect, Google Scholar, ACM digital library, and IEEE Xplore between December 2022 and February 2024. Further, relevant references to the included articles were also used to solidify our search. The final pool includes articles that conducted clinical NLP in the mainland Scandinavian languages and were published in English between 2010 and 2024. Results: Out of the 113 articles, 18% (n=21) focus on Norwegian clinical text, 64% (n=72) on Swedish, 10% (n=11) on Danish, and 8% (n=9) focus on more than one language. Generally, the review identified positive developments across the region despite some observable gaps and disparities between the languages. There are substantial disparities in the level of adoption of transformer-based models. In essential tasks such as de-identification, there is significantly less research activity focusing on Norwegian and Danish compared to Swedish text. Further, the review identified a low level of sharing resources such as data, experimentation code, pre-trained models, and rate of adaptation and transfer learning in the region. Conclusion: The review presented a comprehensive assessment of the state-of-the-art Clinical NLP for electronic health records (EHR) text in mainland Scandinavian languages and, highlighted the potential barriers and challenges that hinder the rapid advancement of the field in the region.
- Abstract(参考訳): 背景: 臨床自然言語処理(NLP)は、構造化されていない臨床テキストデータを抽出、処理、分析するための計算手法の使用を指し、様々な臨床タスクにおいて医療を変革する大きな可能性を秘めている。
目的:本研究は、スカンジナビア本土臨床テキストの最先端NLP手法を総合的に評価し、分析する体系的なレビューを行うことを目的としている。
方法:2022年12月から2024年2月まで,PubMed, ScienceDirect, Google Scholar, ACM Digital Library, IEEE Xploreなどのオンラインデータベースで文献検索を行った。
さらに,対象記事に関する関連資料も検索の強化に使用された。
最終プールには、スカンジナビア本土の言語で臨床NLPを実施、2010年から2024年にかけて英語で出版された記事が含まれている。
結果:113項目のうち,18%(n=21)はノルウェー語の臨床テキストに,64%(n=72)はスウェーデン語に,10%(n=11)はデンマーク語に,8%(n=9)は複数の言語に焦点をあてた。
概して、このレビューは、言語間のいくつかの観察可能なギャップと相違にもかかわらず、地域全体の肯定的な発展を明らかにした。
トランスフォーマーベースのモデルの採用のレベルには、かなりの相違がある。
脱識別のような本質的なタスクでは、スウェーデンのテキストに比べてノルウェーとデンマークに焦点を当てた研究活動は著しく少ない。
さらに,データ,実験コード,事前学習モデル,地域適応率,移動学習率などの低レベルの共有資源について検討した。
結論:本研究は,スカンジナビア本土の電子健康記録(EHR)テキストに対する最先端臨床NLPの包括的評価を行い,領域の急速な進歩を妨げる潜在的な障壁と課題を強調した。
関連論文リスト
- De-identification of clinical free text using natural language
processing: A systematic review of current approaches [48.343430343213896]
自然言語処理は、その非識別プロセスの自動化の可能性を繰り返し示してきた。
本研究の目的は,過去13年間に臨床自由テキストの非識別化が進展したことを示す体系的な証拠を提供することである。
論文 参考訳(メタデータ) (2023-11-28T13:20:41Z) - Natural Language Processing in Electronic Health Records in Relation to
Healthcare Decision-making: A Systematic Review [2.555168694997103]
自然言語処理は電子健康記録から臨床知見を抽出するために広く用いられている。
注釈付きデータや自動化ツール、その他の課題の欠如は、EHRに対するNLPのフル活用を妨げる。
機械学習(ML)、ディープラーニング(DL)、NLP技術を研究し、この分野の限界と機会を包括的に理解するために比較した。
論文 参考訳(メタデータ) (2023-06-22T12:10:41Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - A Scoping Review of Publicly Available Language Tasks in Clinical
Natural Language Processing [7.966218734325912]
バイオメディカルリサーチとコンピュータサイエンス文献データベースを含む6つのデータベースを検索した。
47のNLPタスクを有する35の論文が2007年から2021年の間に包括的基準を満たした。
論文 参考訳(メタデータ) (2021-12-07T22:49:58Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z) - SemClinBr -- a multi institutional and multi specialty semantically
annotated corpus for Portuguese clinical NLP tasks [0.7311642662742726]
SemClinBrは1000の臨床ノートを持ち、65,117個のエンティティと11,263個の関係を持つコーパスである。
この研究はSemClinBrというコーパスで、臨床ノートが1000個あり、65,117のエンティティと11,263のリレーションがラベル付けされている。
論文 参考訳(メタデータ) (2020-01-27T20:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。