論文の概要: DR.BENCH: Diagnostic Reasoning Benchmark for Clinical Natural Language
Processing
- arxiv url: http://arxiv.org/abs/2209.14901v1
- Date: Thu, 29 Sep 2022 16:05:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 16:10:07.537897
- Title: DR.BENCH: Diagnostic Reasoning Benchmark for Clinical Natural Language
Processing
- Title(参考訳): 臨床自然言語処理のための診断推論ベンチマーク dr.bench
- Authors: Yanjun Gao, Dmitriy Dligach, Timothy Miller, John Caskey, Brihat
Sharma, Matthew M Churpek, Majid Afshar
- Abstract要約: 診断推論ベンチマーク(DR.BENCH)は臨床診断推論能力を持つcNLPモデルの開発と評価のための新しいベンチマークである。
DR.BENCHは、訓練済みの言語モデルを評価するための自然言語生成フレームワークとして設計された最初の臨床スイートである。
- 参考スコア(独自算出の注目度): 5.022185333260402
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The meaningful use of electronic health records (EHR) continues to progress
in the digital era with clinical decision support systems augmented by
artificial intelligence. A priority in improving provider experience is to
overcome information overload and reduce the cognitive burden so fewer medical
errors and cognitive biases are introduced during patient care. One major type
of medical error is diagnostic error due to systematic or predictable errors in
judgment that rely on heuristics. The potential for clinical natural language
processing (cNLP) to model diagnostic reasoning in humans with forward
reasoning from data to diagnosis and potentially reduce the cognitive burden
and medical error has not been investigated. Existing tasks to advance the
science in cNLP have largely focused on information extraction and named entity
recognition through classification tasks. We introduce a novel suite of tasks
coined as Diagnostic Reasoning Benchmarks, DR.BENCH, as a new benchmark for
developing and evaluating cNLP models with clinical diagnostic reasoning
ability. The suite includes six tasks from ten publicly available datasets
addressing clinical text understanding, medical knowledge reasoning, and
diagnosis generation. DR.BENCH is the first clinical suite of tasks designed to
be a natural language generation framework to evaluate pre-trained language
models. Experiments with state-of-the-art pre-trained generative language
models using large general domain models and models that were continually
trained on a medical corpus demonstrate opportunities for improvement when
evaluated in DR. BENCH. We share DR. BENCH as a publicly available GitLab
repository with a systematic approach to load and evaluate models for the cNLP
community.
- Abstract(参考訳): 電子健康記録(ehr)の有意義な使用は、人工知能によって拡張された臨床意思決定支援システムと共にデジタル時代の進歩を続けている。
提供者体験を改善する上での優先事項は、情報の過負荷を克服し、認知的負担を軽減することである。
主要な医療ミスの1つは、ヒューリスティックスに依存する判断の系統的または予測可能な誤りによる診断エラーである。
臨床自然言語処理(cnlp)が、データから診断への前方的推論による診断推論をモデル化し、認知的負担と医療的誤りを低減できる可能性について検討していない。
cNLPの科学を前進させるための既存のタスクは、主に情報抽出と分類タスクによる名前付きエンティティ認識に焦点を当てている。
臨床診断推論能力を有するcNLPモデルの開発と評価のための新しいベンチマークとして,診断推論ベンチマーク(DR.BENCH)と呼ばれる新しいタスクスイートを導入する。
このスイートには、臨床テキスト理解、医療知識推論、診断生成に関する10の公開データセットからの6つのタスクが含まれている。
DR.BENCHは、訓練済みの言語モデルを評価する自然言語生成フレームワークとして設計された最初の臨床スイートである。
医療コーパスで継続的に訓練された大規模汎用ドメインモデルとモデルを用いた最先端の事前学習型生成言語モデルによる実験は、DR. BENCHでの評価において改善の機会を示す。
DR.BENCHはGitLabリポジトリとして公開されており、cNLPコミュニティのモデルをロードして評価するための体系的なアプローチです。
関連論文リスト
- Diagnostic Reasoning in Natural Language: Computational Model and Application [68.47402386668846]
言語基底タスク(NL-DAR)の文脈における診断誘導推論(DAR)について検討する。
パール構造因果モデルに基づくNL-DARの新しいモデリングフレームワークを提案する。
得られたデータセットを用いて,NL-DARにおける人間の意思決定過程を解析する。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - Leveraging Large Language Models through Natural Language Processing to provide interpretable Machine Learning predictions of mental deterioration in real time [5.635300481123079]
公式推計によると、世界中で5000万人が認知症に罹患しており、毎年1000万人の新しい患者が増えている。
この目的のために、人工知能と計算言語学は自然言語分析、パーソナライズされたアセスメント、モニタリング、治療に活用することができる。
この仕事には、手頃で柔軟な、非侵襲的でパーソナライズされた診断システムを提供しています。
論文 参考訳(メタデータ) (2024-09-05T09:27:05Z) - A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.40362209055023]
本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文 参考訳(メタデータ) (2024-07-07T18:02:00Z) - A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.07114445705692]
神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文 参考訳(メタデータ) (2024-05-21T06:44:40Z) - Assertion Detection Large Language Model In-context Learning LoRA
Fine-tuning [2.401755243180179]
本稿では,大規模言語モデル(LLM)を多数の医療データに基づいて事前学習してアサーション検出を行う手法を提案する。
提案手法は従来の手法よりも0.31高い0.74のF-1を達成した。
論文 参考訳(メタデータ) (2024-01-31T05:11:00Z) - Leveraging A Medical Knowledge Graph into Large Language Models for
Diagnosis Prediction [7.5569033426158585]
自動診断におけるLarge Language Models (LLMs) の習熟度を高めるための革新的なアプローチを提案する。
我々は,国立医科大学統一医療言語システム(UMLS)からKGを抽出した。
我々のアプローチは説明可能な診断経路を提供し、AIによる診断決定支援システムの実現に近づいている。
論文 参考訳(メタデータ) (2023-08-28T06:05:18Z) - Rationale production to support clinical decision-making [31.66739991129112]
本稿では,病院の退院予測にInfoCalを適用した。
選択された解釈可能性を持つ各提示モデルや特徴重要度法は,それぞれ異なる結果をもたらす。
論文 参考訳(メタデータ) (2021-11-15T09:02:10Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Natural Language Processing to Detect Cognitive Concerns in Electronic
Health Records Using Deep Learning [0.970914263240787]
認知症はコミュニティでは認識が低く、医療専門家では診断が低く、クレームデータではコード化されていない。
認知機能障害に関する情報は、医療記録の未構造化の診療ノートにしばしば見られるが、専門家による手作業によるレビューは時間がかかり、しばしばエラーを起こしやすい。
電子カルテにおける認知的関心を持つ患者を識別するために,自然言語処理アルゴリズムを適用した。
論文 参考訳(メタデータ) (2020-11-12T16:59:56Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。