論文の概要: DICE: Data-Efficient Clinical Event Extraction with Generative Models
- arxiv url: http://arxiv.org/abs/2208.07989v1
- Date: Tue, 16 Aug 2022 23:12:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 12:11:14.352158
- Title: DICE: Data-Efficient Clinical Event Extraction with Generative Models
- Title(参考訳): DICE:生成モデルを用いたデータ効率の良い臨床イベント抽出
- Authors: Mingyu Derek Ma, Alex Taylor, Wei Wang, Nanyun Peng
- Abstract要約: 臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
DICEは、イベント抽出を条件付き生成問題として捉え、ドメインの専門家による説明を利用して、低リソース環境下での性能を高める。
また、MACCROBAT-EEは、イベント引数アノテーションを付加した最初の臨床イベント抽出データセットである。
- 参考スコア(独自算出の注目度): 33.314555910686714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event extraction in the clinical domain is an under-explored research area.
The lack of training data in addition to the high volume of domain-specific
jargon that includes long entities with vague boundaries make the task
especially challenging. In this paper, we introduce DICE, a robust and
data-efficient generative model for clinical event extraction. DICE frames
event extraction as a conditional generation problem and utilizes descriptions
provided by domain experts to boost the performance under low-resource
settings. Furthermore, DICE learns to locate and bound biomedical mentions with
an auxiliary mention identification task trained jointly with event extraction
tasks to leverage inter-task dependencies and further incorporates the
identified mentions as trigger and argument candidates for their respective
tasks. We also introduce MACCROBAT-EE, the first clinical event extraction
dataset with event argument annotation. Our experiments demonstrate the
robustness of DICE under low data settings for the clinical domain and the
benefits of incorporating flexible joint training and mention markers into
generative approaches.
- Abstract(参考訳): 臨床領域における事象抽出は未開拓の研究領域である。
トレーニングデータの欠如に加えて、あいまいな境界を持つ長いエンティティを含むドメイン固有のジャーゴンが大量にあるため、タスクは特に困難である。
本稿では,臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
DICEは、イベント抽出を条件付き生成問題とし、ドメインの専門家による説明を利用して、低リソース環境での性能を高める。
さらに、diceは、イベント抽出タスクと共同で訓練された補助的言及識別タスクで生体医学的言及の所在と境界を学習し、タスク間の依存関係を活用し、識別された言及をそれぞれのタスクのトリガーおよび引数候補として組み込む。
また,最初の臨床イベント抽出データセットであるmaccrobat-eeについても紹介する。
本実験は, 臨床領域における低データ環境下でのDICEの堅牢性と, フレキシブル・ジョイントトレーニングと参照マーカーの併用によるメリットについて実証した。
関連論文リスト
- Sparse Anatomical Prompt Semi-Supervised Learning with Masked Image
Modeling for CBCT Tooth Segmentation [10.617296334463942]
Cone Beam Computed Tomography (CBCT) 歯科画像における歯の識別とセグメンテーションは, 歯科医が行う手技診断の効率と精度を著しく向上させることができる。
既存のセグメンテーション手法は主に大規模なデータボリュームトレーニングに基づいて開発され、そのアノテーションは非常に時間がかかります。
本研究では, 大量の未ラベルデータを効果的に活用し, 限られたラベル付きデータで正確な歯のセグメンテーションを実現するタスク指向Masked Auto-Encoderパラダイムを提案する。
論文 参考訳(メタデータ) (2024-02-07T05:05:21Z) - Segment Together: A Versatile Paradigm for Semi-Supervised Medical Image
Segmentation [17.69933345468061]
医用画像セグメンテーションのための強力なディープラーニングモデルをトレーニングする上で、不足は大きな障害となっている。
textbfVersatile textbfSemi-supervised framework を導入する。
論文 参考訳(メタデータ) (2023-11-20T11:35:52Z) - Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data
Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。
我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。
7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文 参考訳(メタデータ) (2023-11-01T04:37:28Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - DIAS: A Dataset and Benchmark for Intracranial Artery Segmentation in DSA sequences [19.61593883367223]
血管形態の定量化にはDSA(Digital Subtraction Angiography)の頭蓋内動脈(IA)が重要である。
現在の研究は、主にプロプライエタリデータセットを使用した単一フレームDSAのセグメンテーションに焦点を当てている。
DSAシークエンスにおけるIAセグメンテーションのためのデータセットであるDIASを紹介する。
論文 参考訳(メタデータ) (2023-06-21T10:03:56Z) - Medical Data Augmentation via ChatGPT: A Case Study on Medication
Identification and Medication Event Classification [2.980018103007841]
2022年のN2C2コンクールでは、電子健康記録の重要な要因の特定を促進するために様々なタスクが提示された。
事前訓練された大規模言語モデル (LLM) はこれらのタスクにおいて例外的な性能を示した。
本研究の目的は、注釈付きデータの限られた可用性を克服するために、データ拡張のためのLCM(特にChatGPT)の利用を検討することである。
論文 参考訳(メタデータ) (2023-06-10T20:55:21Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - One-Shot Medical Landmark Localization by Edge-Guided Transform and
Noisy Landmark Refinement [59.14062241534754]
医用ランドマークのワンショット化のための2段階のフレームワークを提案する。
ステージIでは,新たな損失関数の指導の下で,グローバルアライメントと局所変形のエンドツーエンドのカスケードを学習する。
ステージIIでは,信頼性の高い擬似ラベルを選択するための自己整合性や,半教師付き学習のための相互整合性について検討する。
論文 参考訳(メタデータ) (2022-07-31T15:42:28Z) - Back to Prior Knowledge: Joint Event Causality Extraction via
Convolutional Semantic Infusion [5.566928318239452]
複合イベントと因果関係抽出は,情報検索とデータマイニングにおいて極めて重要な課題である。
共同抽出フレームワーク内で長さの異なる n-gram の頻繁な窓に対する畳み込み知識注入を提案する。
我々のモデルは強力なBERT+CSNNベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2021-02-19T13:31:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。