論文の概要: De-identification of clinical free text using natural language
processing: A systematic review of current approaches
- arxiv url: http://arxiv.org/abs/2312.03736v1
- Date: Tue, 28 Nov 2023 13:20:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 03:10:59.325807
- Title: De-identification of clinical free text using natural language
processing: A systematic review of current approaches
- Title(参考訳): 自然言語処理による臨床フリーテキストの非同定--最近のアプローチの体系的考察
- Authors: Aleksandar Kova\v{c}evi\'c, Bojana Ba\v{s}aragin, Nikola
Milo\v{s}evi\'c, Goran Nenadi\'c
- Abstract要約: 自然言語処理は、その非識別プロセスの自動化の可能性を繰り返し示してきた。
本研究の目的は,過去13年間に臨床自由テキストの非識別化が進展したことを示す体系的な証拠を提供することである。
- 参考スコア(独自算出の注目度): 48.343430343213896
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Background: Electronic health records (EHRs) are a valuable resource for
data-driven medical research. However, the presence of protected health
information (PHI) makes EHRs unsuitable to be shared for research purposes.
De-identification, i.e. the process of removing PHI is a critical step in
making EHR data accessible. Natural language processing has repeatedly
demonstrated its feasibility in automating the de-identification process.
Objectives: Our study aims to provide systematic evidence on how the
de-identification of clinical free text has evolved in the last thirteen years,
and to report on the performances and limitations of the current
state-of-the-art systems. In addition, we aim to identify challenges and
potential research opportunities in this field. Methods: A systematic search in
PubMed, Web of Science and the DBLP was conducted for studies published between
January 2010 and February 2023. Titles and abstracts were examined to identify
the relevant studies. Selected studies were then analysed in-depth, and
information was collected on de-identification methodologies, data sources, and
measured performance. Results: A total of 2125 publications were identified for
the title and abstract screening. 69 studies were found to be relevant. Machine
learning (37 studies) and hybrid (26 studies) approaches are predominant, while
six studies relied only on rules. Majority of the approaches were trained and
evaluated on public corpora. The 2014 i2b2/UTHealth corpus is the most
frequently used (36 studies), followed by the 2006 i2b2 (18 studies) and 2016
CEGS N-GRID (10 studies) corpora.
- Abstract(参考訳): 背景: 電子健康記録(EHR)は、データ駆動医療研究にとって貴重な資源である。
しかしながら、保護された健康情報(PHI)の存在は、EHRを研究目的で共有するのに不適当である。
PHIを除去するプロセスは、EHRデータをアクセス可能にするための重要なステップである。
自然言語処理は、その非識別プロセスの自動化の可能性を繰り返し示してきた。
目的:本研究は,過去13年間で臨床フリーテキストの非特定化がいかに進展したかを体系的に証明し,現在の最先端システムの性能と限界について報告することを目的とする。
また,本分野での課題や研究機会の特定も目指している。
方法:2010年1月から2023年2月にかけて,PubMed,Web of Science,DBLPの体系的検索を行った。
関連する研究を識別するために,タイトルと要約を調査した。
その後、選抜された研究を詳細に分析し、非識別手法、データソース、測定性能に関する情報を収集した。
結果: タイトルと要約スクリーニングには合計2125冊の出版物が同定された。
69の研究が関連することが判明した。
機械学習(37研究)とハイブリッド(26研究)のアプローチが主流だが、6つの研究はルールのみに依存している。
アプローチの大部分は公開コーパスでトレーニングされ、評価された。
2014年のi2b2/uthealthコーパスが最も頻繁に使用される(36の研究)が、2006年のi2b2 (18研究)と2016年のcegs n-grid (10研究)コーパスが続く。
関連論文リスト
- A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - A survey of recent methods for addressing AI fairness and bias in
biomedicine [48.46929081146017]
人工知能システムは、人種や性別に基づくような社会的不平等を永続するか、偏見を示すことができる。
バイオメディカル自然言語処理 (NLP) やコンピュータビジョン (CV) の分野での様々な脱バイアス法に関する最近の論文を調査した。
我々は,2018年1月から2023年12月にかけて,複数のキーワードの組み合わせを用いて,PubMed,ACMデジタルライブラリ,IEEE Xploreに関する文献検索を行った。
バイオメディシンに応用可能な一般領域からの他の方法について検討し, バイアスに対処し, 公平性を向上する方法について検討した。
論文 参考訳(メタデータ) (2024-02-13T06:38:46Z) - A Review of Deep Learning Methods for Photoplethysmography Data [10.27280499967643]
Photoplethysmographyは、ポータビリティ、ユーザフレンドリな操作、非侵襲機能に長けているため、有望なデバイスである。
近年の深層学習の進歩は、個人の健康管理に関わるタスクにPSG信号を活用することで顕著な成果を上げている。
論文 参考訳(メタデータ) (2024-01-23T14:11:29Z) - Natural Language Processing in Electronic Health Records in Relation to
Healthcare Decision-making: A Systematic Review [2.555168694997103]
自然言語処理は電子健康記録から臨床知見を抽出するために広く用いられている。
注釈付きデータや自動化ツール、その他の課題の欠如は、EHRに対するNLPのフル活用を妨げる。
機械学習(ML)、ディープラーニング(DL)、NLP技術を研究し、この分野の限界と機会を包括的に理解するために比較した。
論文 参考訳(メタデータ) (2023-06-22T12:10:41Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - What is the State of the Art of Computer Vision-Assisted Cytology? A
Systematic Literature Review [47.42354724922676]
現在,細胞診に応用されているコンピュータビジョン技術の現状を明らかにするために,システマティック文献レビューを実施している。
分析された研究で最も使われている方法は深層学習(70論文)であるが、古典的なコンピュータビジョンのみ(101論文)を使用するものは少ない。
結論として,多くの染色に対して高品質なデータセットがまだ存在せず,ほとんどの研究は日常的な臨床診断ルーチンに適用できるほど成熟していない。
論文 参考訳(メタデータ) (2021-05-24T13:50:45Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z) - Artificial Intelligence, speech and language processing approaches to
monitoring Alzheimer's Disease: a systematic review [5.635607414700482]
本稿では,アルツハイマー病の認知機能低下を予測するための人工知能,音声,言語処理の利用に関する現在の知見を要約する。
筆者らは2000年から2019年にかけて, PROSPEROに登録されたオリジナルの研究の体系的レビューを行った。
論文 参考訳(メタデータ) (2020-10-12T21:43:04Z) - Digital personal health libraries: a systematic literature review [15.392783869176778]
本稿では,デジタル・パーソナル・ヘルス・ライブラリ(PHL)の開発に関する最近の文献について述べる。
多様な臨床専門分野における消費者健康情報学の潜在的な応用に関する洞察を提供する。
論文 参考訳(メタデータ) (2020-06-21T01:11:38Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。