論文の概要: Closing the Gap: Joint De-Identification and Concept Extraction in the
Clinical Domain
- arxiv url: http://arxiv.org/abs/2005.09397v1
- Date: Tue, 19 May 2020 12:44:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 13:12:55.021842
- Title: Closing the Gap: Joint De-Identification and Concept Extraction in the
Clinical Domain
- Title(参考訳): 臨床領域における共同診断と概念抽出
- Authors: Lukas Lange, Heike Adel, Jannik Str\"otgen
- Abstract要約: 我々は、英語のベンチマークデータセット(非識別の96.1% F1、概念抽出の88.9% F1、概念抽出の91.4% F1)とスペイン語(概念抽出の91.4% F1)に新しい技術状況を設定した。
- 参考スコア(独自算出の注目度): 11.98821166621488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exploiting natural language processing in the clinical domain requires
de-identification, i.e., anonymization of personal information in texts.
However, current research considers de-identification and downstream tasks,
such as concept extraction, only in isolation and does not study the effects of
de-identification on other tasks. In this paper, we close this gap by reporting
concept extraction performance on automatically anonymized data and
investigating joint models for de-identification and concept extraction. In
particular, we propose a stacked model with restricted access to
privacy-sensitive information and a multitask model. We set the new state of
the art on benchmark datasets in English (96.1% F1 for de-identification and
88.9% F1 for concept extraction) and Spanish (91.4% F1 for concept extraction).
- Abstract(参考訳): 臨床領域での自然言語処理の活用には、非識別、すなわちテキストにおける個人情報の匿名化が必要である。
しかし,近年の研究では,概念抽出などの非識別や下流課題は単独でのみ考慮され,非識別が他のタスクに与える影響は研究されていない。
本稿では,自動匿名化データに対する概念抽出性能を報告し,非同定と概念抽出のための共同モデルを検討することにより,このギャップを解消する。
特に,プライバシに敏感な情報へのアクセスを制限するスタックモデルとマルチタスクモデルを提案する。
我々は、この技術の新たな状態を、英語のベンチマークデータセット(非識別の96.1% F1、概念抽出の88.9% F1)とスペイン語(概念抽出の91.4% F1)に設定した。
関連論文リスト
- Representation Learning and Identity Adversarial Training for Facial Behavior Understanding [3.350769246260559]
主観的同一性はモデルに対するショートカット学習を提供し、AU予測に対する準最適解をもたらすことを示す。
我々はIAT(Identity Adrial Training)を提案し、アイデンティティ不変の特徴を学習するために強力なIAT正規化が必要であることを実証する。
提案手法であるFMAE(Facial Masked Autoencoder)とIATは単純で汎用的で効果的である。
論文 参考訳(メタデータ) (2024-07-15T21:13:28Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Applying unsupervised keyphrase methods on concepts extracted from
discharge sheets [7.102620843620572]
各内容が記録されている部分を特定し、また、臨床テキストから意味を抽出するための重要な概念を特定する必要がある。
本研究では,臨床自然言語処理技術を用いて,これらの課題に対処した。
一般的な教師なしキーフレーズ抽出手法が検証され,評価されている。
論文 参考訳(メタデータ) (2023-03-15T20:55:25Z) - Multi-Stage Spatio-Temporal Aggregation Transformer for Video Person
Re-identification [78.08536797239893]
本稿では,2つの新しいプロキシ埋め込みモジュールを設計したMSTAT(Multi-Stage Space-Temporal Aggregation Transformer)を提案する。
MSTATは、属性関連、アイデンティティ関連、および属性関連情報をビデオクリップからエンコードする3つのステージから構成される。
MSTATは様々な標準ベンチマークで最先端の精度を達成できることを示す。
論文 参考訳(メタデータ) (2023-01-02T05:17:31Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z) - Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild [97.14064057840089]
本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-17T19:25:28Z) - DICE: Data-Efficient Clinical Event Extraction with Generative Models [93.49354508621232]
臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
論文 参考訳(メタデータ) (2022-08-16T23:12:04Z) - Privacy-Aware Identity Cloning Detection based on Deep Forest [9.051524543426451]
このアプローチでは、ソーシャルネットワークから収集されたプライバシに敏感なユーザプロファイルデータと強力なディープラーニングモデルを活用して、クローンID検出を行う。
提案手法は,実世界のデータセット上で,最先端の識別クローン検出技術と,他の一般的な識別不正検出モデルに対して評価した。
論文 参考訳(メタデータ) (2021-10-21T04:55:52Z) - Taking Modality-free Human Identification as Zero-shot Learning [46.51413603352702]
我々は、新しいモダリティフリーヒューマン識別(MFHI)タスクを、スケーラブルな方法で汎用的なゼロショット学習モデルとして開発する。
各アイデンティティの識別プロトタイプを学習することで、視覚的および意味的なモダリティをブリッジすることができる。
さらに、意味論に基づく空間的注意は、高グローバルなカテゴリーレベルと局所的な属性レベルを区別した表現を得るために、視覚的モダリティに強制される。
論文 参考訳(メタデータ) (2020-10-02T13:08:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。