論文の概要: DICE: Data-Efficient Clinical Event Extraction with Generative Models
- arxiv url: http://arxiv.org/abs/2208.07989v2
- Date: Thu, 25 May 2023 11:04:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-27 00:06:39.468984
- Title: DICE: Data-Efficient Clinical Event Extraction with Generative Models
- Title(参考訳): DICE:生成モデルを用いたデータ効率の良い臨床イベント抽出
- Authors: Mingyu Derek Ma, Alexander K. Taylor, Wei Wang, Nanyun Peng
- Abstract要約: 臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
- 参考スコア(独自算出の注目度): 93.49354508621232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event extraction for the clinical domain is an under-explored research area.
The lack of training data along with the high volume of domain-specific
terminologies with vague entity boundaries makes the task especially
challenging. In this paper, we introduce DICE, a robust and data-efficient
generative model for clinical event extraction. DICE frames event extraction as
a conditional generation problem and introduces a contrastive learning
objective to accurately decide the boundaries of biomedical mentions. DICE also
trains an auxiliary mention identification task jointly with event extraction
tasks to better identify entity mention boundaries, and further introduces
special markers to incorporate identified entity mentions as trigger and
argument candidates for their respective tasks. To benchmark clinical event
extraction, we compose MACCROBAT-EE, the first clinical event extraction
dataset with argument annotation, based on an existing clinical information
extraction dataset MACCROBAT. Our experiments demonstrate state-of-the-art
performances of DICE for clinical and news domain event extraction, especially
under low data settings.
- Abstract(参考訳): 臨床領域のイベント抽出は、未調査の研究領域である。
曖昧なエンティティ境界を持つドメイン固有用語の大量さとともに、トレーニングデータの欠如は、タスクを特に困難にしている。
本稿では,臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
DICEは、イベント抽出を条件生成問題として捉え、バイオメディカル参照の境界を正確に決定する対照的な学習目標を導入する。
DICEはまた、イベント抽出タスクと共に補助的な参照識別タスクをトレーニングし、エンティティ参照境界をよりよく識別すると同時に、識別されたエンティティ参照をそれぞれのタスクのトリガーおよび引数候補として含めるための特別なマーカーも導入する。
臨床イベント抽出のベンチマークを行うため,既存の臨床情報抽出データセットであるMACCROBAT-EEをベースとした最初の臨床イベント抽出データセットであるMACCROBAT-EEを構成する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能を,特に低データ設定下で実証した。
関連論文リスト
- Sparse Anatomical Prompt Semi-Supervised Learning with Masked Image
Modeling for CBCT Tooth Segmentation [10.617296334463942]
Cone Beam Computed Tomography (CBCT) 歯科画像における歯の識別とセグメンテーションは, 歯科医が行う手技診断の効率と精度を著しく向上させることができる。
既存のセグメンテーション手法は主に大規模なデータボリュームトレーニングに基づいて開発され、そのアノテーションは非常に時間がかかります。
本研究では, 大量の未ラベルデータを効果的に活用し, 限られたラベル付きデータで正確な歯のセグメンテーションを実現するタスク指向Masked Auto-Encoderパラダイムを提案する。
論文 参考訳(メタデータ) (2024-02-07T05:05:21Z) - Segment Together: A Versatile Paradigm for Semi-Supervised Medical Image
Segmentation [17.69933345468061]
医用画像セグメンテーションのための強力なディープラーニングモデルをトレーニングする上で、不足は大きな障害となっている。
textbfVersatile textbfSemi-supervised framework を導入する。
論文 参考訳(メタデータ) (2023-11-20T11:35:52Z) - Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data
Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。
我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。
7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文 参考訳(メタデータ) (2023-11-01T04:37:28Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - DIAS: A Dataset and Benchmark for Intracranial Artery Segmentation in DSA sequences [19.61593883367223]
血管形態の定量化にはDSA(Digital Subtraction Angiography)の頭蓋内動脈(IA)が重要である。
現在の研究は、主にプロプライエタリデータセットを使用した単一フレームDSAのセグメンテーションに焦点を当てている。
DSAシークエンスにおけるIAセグメンテーションのためのデータセットであるDIASを紹介する。
論文 参考訳(メタデータ) (2023-06-21T10:03:56Z) - Medical Data Augmentation via ChatGPT: A Case Study on Medication
Identification and Medication Event Classification [2.980018103007841]
2022年のN2C2コンクールでは、電子健康記録の重要な要因の特定を促進するために様々なタスクが提示された。
事前訓練された大規模言語モデル (LLM) はこれらのタスクにおいて例外的な性能を示した。
本研究の目的は、注釈付きデータの限られた可用性を克服するために、データ拡張のためのLCM(特にChatGPT)の利用を検討することである。
論文 参考訳(メタデータ) (2023-06-10T20:55:21Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - One-Shot Medical Landmark Localization by Edge-Guided Transform and
Noisy Landmark Refinement [59.14062241534754]
医用ランドマークのワンショット化のための2段階のフレームワークを提案する。
ステージIでは,新たな損失関数の指導の下で,グローバルアライメントと局所変形のエンドツーエンドのカスケードを学習する。
ステージIIでは,信頼性の高い擬似ラベルを選択するための自己整合性や,半教師付き学習のための相互整合性について検討する。
論文 参考訳(メタデータ) (2022-07-31T15:42:28Z) - Back to Prior Knowledge: Joint Event Causality Extraction via
Convolutional Semantic Infusion [5.566928318239452]
複合イベントと因果関係抽出は,情報検索とデータマイニングにおいて極めて重要な課題である。
共同抽出フレームワーク内で長さの異なる n-gram の頻繁な窓に対する畳み込み知識注入を提案する。
我々のモデルは強力なBERT+CSNNベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2021-02-19T13:31:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。