論文の概要: DeviceBERT: Applied Transfer Learning With Targeted Annotations and Vocabulary Enrichment to Identify Medical Device and Component Terminology in FDA Recall Summaries
- arxiv url: http://arxiv.org/abs/2406.05307v1
- Date: Sat, 8 Jun 2024 00:33:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 20:24:20.161044
- Title: DeviceBERT: Applied Transfer Learning With Targeted Annotations and Vocabulary Enrichment to Identify Medical Device and Component Terminology in FDA Recall Summaries
- Title(参考訳): DeviceBERT:FDAのリコール・サマリーにおける医療機器とコンポーネント・ターミノロジーの同定のためのターゲットアノテーションと語彙豊か化による応用トランスファーラーニング
- Authors: Miriam Farrington,
- Abstract要約: FDAのメディカルデバイスリコールは、重要かつ時間に敏感なイベントである。
手動でリコールアクションサマリーから関連するデバイス情報を抽出するのは時間を要する作業である。
本稿では,医療機器アノテーション,前処理,濃縮パイプラインである DeviceBERT を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: FDA Medical Device recalls are critical and time-sensitive events, requiring swift identification of impacted devices to inform the public of a recall event and ensure patient safety. The OpenFDA device recall dataset contains valuable information about ongoing device recall actions, but manually extracting relevant device information from the recall action summaries is a time-consuming task. Named Entity Recognition (NER) is a task in Natural Language Processing (NLP) that involves identifying and categorizing named entities in unstructured text. Existing NER models, including domain-specific models like BioBERT, struggle to correctly identify medical device trade names, part numbers and component terms within these summaries. To address this, we propose DeviceBERT, a medical device annotation, pre-processing and enrichment pipeline, which builds on BioBERT to identify and label medical device terminology in the device recall summaries with improved accuracy. Furthermore, we demonstrate that our approach can be applied effectively for performing entity recognition tasks where training data is limited or sparse.
- Abstract(参考訳): FDAのメディカルデバイスリコールは、重要かつ時間に敏感なイベントであり、感染したデバイスを素早く識別し、リコールイベントを一般大衆に知らせ、患者の安全を確保する必要がある。
OpenFDAのデバイスリコールデータセットには、進行中のデバイスリコールアクションに関する貴重な情報が含まれているが、リコールアクションサマリーから関連するデバイス情報を手作業で抽出することは、時間を要する作業である。
名前付きエンティティ認識(英: Named Entity Recognition、NER)は、自然言語処理(NLP)において、名前付きエンティティを非構造化テキストで識別し分類するタスクである。
BioBERTのようなドメイン固有のモデルを含む既存のNERモデルは、これらの要約の中で医療機器の商標、部品番号、コンポーネント用語を正しく識別するのに苦労している。
そこで我々は,BioBERT上に構築された医療機器アノテーション,前処理,濃縮パイプラインであるDeviceBERTを提案する。
さらに,本手法は,訓練データに制限や疎結合なエンティティ認識タスクを効果的に適用できることを実証した。
関連論文リスト
- In-depth analysis of recall initiators of medical devices with a Machine Learning-Natural language Processing workflow [3.392104905453323]
この研究は、2018年から2024年までの医療機器リコールデータベースに基づいて、医療機器リコール開始者を特定し、評価し、分析した。
その結果、ノイズクラスタリングアルゴリズムを用いたアプリケーションにおける教師なし密度に基づく空間クラスタリングは、それぞれのリコール開始器を特定の方法で提示できることが示唆された。
論文 参考訳(メタデータ) (2024-06-14T12:38:49Z) - W-procer: Weighted Prototypical Contrastive Learning for Medical
Few-Shot Named Entity Recognition [9.582387775646277]
Weighted Prototypeal Contrastive Learning for Medical Few Shot Named Entity Regniation (W-PROCER)を提案する。
当社のアプローチは主に,プロトタイプベースの契約損失と重み付けネットワークの構築を中心に展開している。
提案するW-PROCERフレームワークは,3つのベンチマークデータセットにおいて,強いベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2023-05-29T21:17:52Z) - DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 [80.36535668574804]
我々は新しいGPT4対応脱識別フレームワーク(DeID-GPT)を開発した。
開発したDeID-GPTは,非構造化医用テキストからの個人情報のマスキングにおいて,高い精度と信頼性を示した。
本研究は,ChatGPTおよびGPT-4を医療用テキストデータ処理および非識別に利用した最初期の1つである。
論文 参考訳(メタデータ) (2023-03-20T11:34:37Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Using Large Pre-Trained Language Model to Assist FDA in Premarket
Medical Device [0.0]
本稿では,FDA医療機器のマーケティングプロセスを支援する自然言語処理の可能性を提案する。
実際のデバイス記述は、CFRのFDA第21章に記載されているデバイス記述と一致して、対応するデバイスタイプを決定する。
FastTextのような事前学習された単語埋め込みと大規模な事前学習された文埋め込みモデルの両方を、デバイス記述の特徴付けの正確性に基づいて評価する。
論文 参考訳(メタデータ) (2022-11-03T04:18:05Z) - Label Semantic Aware Pre-training for Few-shot Text Classification [53.80908620663974]
テキスト分類システムの一般化とデータ効率を向上させるために,ラベルセマンティック・アウェア事前学習(LSAP)を提案する。
LSAPは、ラベル付き文の2次事前学習を行うことにより、ラベルセマンティクスを事前学習された生成モデル(T5)に組み込む。
論文 参考訳(メタデータ) (2022-04-14T17:33:34Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - An Intellectual Property Entity Recognition Method Based on Transformer
and Technological Word Information [23.64426782192688]
本稿では,トランスフォーマーと技術単語情報に基づく知的財産の抽出手法を提案する。
相対位置符号化を導入するトランスフォーマーエンコーダは、テキストの深い意味情報を学ぶために使用される。
パブリックデータセットとアノテートされた特許データセットの実験結果は,エンティティ認識の精度を向上させることを示す。
論文 参考訳(メタデータ) (2022-03-21T03:28:37Z) - Instant One-Shot Word-Learning for Context-Specific Neural
Sequence-to-Sequence Speech Recognition [62.997667081978825]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識する機構を備えたエンドツーエンドのASRシステムを提案する。
本稿では,この機構により,これまで認識できなかった単語の85%以上を認識できることを示す。
論文 参考訳(メタデータ) (2021-07-05T21:08:34Z) - Benchmarking Modern Named Entity Recognition Techniques for Free-text
Health Record De-identification [6.026640792312181]
連邦法は、保護された健康情報(PHI)を含むEHRデータの共有を制限する。
本研究は, 深層学習に基づく名前付きエンティティ認識(NER)手法を探索し, 識別タスクにおいてどのメソッドがより優れているかを判定する。
i2b2トレーニングデータセットでモデルをトレーニング,テストし,地域病院から収集したEHRデータを用いて,そのパフォーマンスを質的に評価した。
論文 参考訳(メタデータ) (2021-03-25T01:26:58Z) - Transforming unstructured voice and text data into insight for paramedic
emergency service using recurrent and convolutional neural networks [68.8204255655161]
救急隊員は救急車内で限られた時間内に救命判断をしなければならないことが多い。
本研究の目的は、音声とテキストデータを自動的に融合して、救急隊員に適切な状況認識情報を提供することである。
論文 参考訳(メタデータ) (2020-05-30T06:47:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。