論文の概要: Task formulation for Extracting Social Determinants of Health from
Clinical Narratives
- arxiv url: http://arxiv.org/abs/2301.11386v1
- Date: Thu, 26 Jan 2023 20:00:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-30 17:26:35.109544
- Title: Task formulation for Extracting Social Determinants of Health from
Clinical Narratives
- Title(参考訳): 臨床物語から健康の社会的決定要因を抽出するための課題定式化
- Authors: Manabu Torii, Ian M. Finn, Son Doan, Paul Wang, Elly W. Yang, Daniel
S. Zisook
- Abstract要約: 2022 n2c2 NLP Challengeは、臨床物語における健康の社会的決定要因の同定を提起した。
本稿では,この課題のために開発した3つのシステムについて述べるとともに,それぞれのシステムで使用される特徴的タスクの定式化について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: The 2022 n2c2 NLP Challenge posed identification of social
determinants of health (SDOH) in clinical narratives. We present three systems
that we developed for the Challenge and discuss the distinctive task
formulation used in each of the three systems. Materials and Methods: The first
system identifies target pieces of information independently using machine
learning classifiers. The second system uses a large language model (LLM) to
extract complete structured outputs per document. The third system extracts
candidate phrases using machine learning and identifies target relations with
hand-crafted rules. Results: The three systems achieved F1 scores of 0.884,
0.831, and 0.663 in the Subtask A of the Challenge, which are ranked third,
seventh, and eighth among the 15 participating teams. The review of the
extraction results from our systems reveals characteristics of each approach
and those of the SODH extraction task. Discussion: Phrases and relations
annotated in the task is unique and diverse, not conforming to the conventional
event extraction task. These annotations are difficult to model with limited
training data. The system that extracts information independently, ignoring the
annotated relations, achieves the highest F1 score. Meanwhile, LLM with its
versatile capability achieves the high F1 score, while respecting the annotated
relations. The rule-based system tackling relation extraction obtains the low
F1 score, while it is the most explainable approach. Conclusion: The F1 scores
of the three systems vary in this challenge setting, but each approach has
advantages and disadvantages in a practical application. The selection of the
approach depends not only on the F1 score but also on the requirements in the
application.
- Abstract(参考訳): 目的: 2022 n2c2 NLP Challengeでは、臨床物語における社会的健康決定因子(SDOH)の同定が提案された。
そこで本研究では,本課題のために開発した3つのシステムについて述べる。
Materials and Methods: 最初のシステムは、機械学習の分類器を用いて、目的の情報を独立して識別する。
第2のシステムは、文書ごとに完全に構造化された出力を抽出するために、大きな言語モデル(LLM)を使用する。
第3のシステムは、機械学習を用いて候補句を抽出し、手作りルールとターゲット関係を識別する。
結果: この3つのシステムは,15チーム中3位,7位,8位のサブタスクAで0.884,0.831,0.663得点を達成した。
本システムからの抽出結果のレビューにより,各アプローチの特徴とsodh抽出タスクの特徴が明らかになった。
議論: タスクにアノテートされたフレーズとリレーションはユニークで多様であり、従来のイベント抽出タスクに準拠していない。
これらのアノテーションは、限られたトレーニングデータでモデル化することが難しい。
注釈付き関係を無視して独立して情報を抽出するシステムは、最高F1スコアを得る。
一方、llmの汎用性は、注釈付き関係を尊重しながら高いf1スコアを達成する。
規則に基づく関係抽出はF1スコアが低く、最も説明可能なアプローチである。
結論:3つのシステムのf1スコアはこの課題設定で異なるが,それぞれのアプローチには実用上のメリットとデメリットがある。
アプローチの選択は、F1スコアだけでなく、アプリケーションの要件にも依存します。
関連論文リスト
- Software Mention Recognition with a Three-Stage Framework Based on BERTology Models at SOMD 2024 [0.0]
本稿では,Scholarly Publications shared-taskにおけるSoftware Mention DetectionにおけるサブタスクIのシステムについて述べる。
ベストパフォーマンスシステムは3段階のフレームワークを通じて名前付きエンティティ認識問題に対処する。
XLM-Rベースのモデルに基づくフレームワークは、重み付けされたF1スコア67.80%を実現し、ソフトウェアメンション認識タスクのサブタスクIの3位にチームに提供する。
論文 参考訳(メタデータ) (2024-04-23T17:06:24Z) - Clarify When Necessary: Resolving Ambiguity Through Interaction with LMs [58.620269228776294]
そこで本稿では,ユーザに対して,あいまいさを解消するためのタスク非依存のフレームワークを提案する。
我々は3つのNLPアプリケーション(質問応答、機械翻訳、自然言語推論)にまたがるシステムを評価する。
インテントシムは堅牢であり、幅広いNLPタスクやLMの改善を実証している。
論文 参考訳(メタデータ) (2023-11-16T00:18:50Z) - GPT-FinRE: In-context Learning for Financial Relation Extraction using
Large Language Models [1.9559144041082446]
本稿では,そのようなデータセットREFinDにおける関係抽出のソリューションについて述べる。
本稿では,文脈内学習(ICL)の枠組みとしてOpenAIモデルを用いた。
総合で3位になった。最高のF1スコアは0.718だ。
論文 参考訳(メタデータ) (2023-06-30T10:12:30Z) - Zero-Shot Learning for Requirements Classification: An Exploratory Study [6.855054517723465]
要件工学(RE)研究者は、さまざまなREタスクに対して機械学習(ML)とディープラーニング(DL)アプローチを実験している。
今日のML-DLアプローチのほとんどは、教師付き学習技術に基づいており、アノテーション付きデータセットを使用してトレーニングする必要がある。
本稿では,ZSL (Unsupervised Zero-Shot Learning) 技術を用いて要求分類を行う手法を提案する。
論文 参考訳(メタデータ) (2023-02-09T16:05:01Z) - The 2022 n2c2/UW Shared Task on Extracting Social Determinants of Health [0.9023847175654602]
n2c2/UW SDOH Challengeは、臨床ノートから社会決定因子(SDOH)情報を抽出する。
本稿では,共有タスク,データ,参加チーム,パフォーマンス結果,今後の作業への配慮について述べる。
論文 参考訳(メタデータ) (2023-01-13T14:20:23Z) - COLO: A Contrastive Learning based Re-ranking Framework for One-Stage
Summarization [84.70895015194188]
コントラスト学習に基づく一段階要約フレームワークであるCOLOを提案する。
COLOはCNN/DailyMailベンチマークの1段階システムの抽出と抽象化結果を44.58と46.33ROUGE-1スコアに引き上げた。
論文 参考訳(メタデータ) (2022-09-29T06:11:21Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - AIFB-WebScience at SemEval-2022 Task 12: Relation Extraction First --
Using Relation Extraction to Identify Entities [0.0]
本稿では,変換器に基づく言語モデルに基づくエンドツーエンドのジョイントエンティティと関係抽出手法を提案する。
実体抽出と関係抽出を連続的に行う既存手法とは対照的に,本システムは関係抽出からの情報を実体抽出に組み込む。
論文 参考訳(メタデータ) (2022-03-10T12:19:44Z) - Exploring Neural Models for Query-Focused Summarization [74.41256438059256]
クエリ中心の要約(QFS)に対するニューラルネットワークの体系的な探索を行う。
本稿では,QMSumデータセットの最先端性能を最大3.38ROUGE-1,3.72ROUGE-2,3.28ROUGE-Lのマージンで達成する2つのモデル拡張を提案する。
論文 参考訳(メタデータ) (2021-12-14T18:33:29Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - CAiRE in DialDoc21: Data Augmentation for Information-Seeking Dialogue
System [55.43871578056878]
DialDoc21コンペティションでは,サブタスク1で74.95 F1スコア,60.74 Exact Matchスコア,サブタスク2で37.72 SacreBLEUスコアを達成した。
論文 参考訳(メタデータ) (2021-06-07T11:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。