論文の概要: Question Answering for Complex Electronic Health Records Database using
Unified Encoder-Decoder Architecture
- arxiv url: http://arxiv.org/abs/2111.14703v1
- Date: Sun, 14 Nov 2021 05:01:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 01:22:04.210333
- Title: Question Answering for Complex Electronic Health Records Database using
Unified Encoder-Decoder Architecture
- Title(参考訳): unified encoder-decoder architecture を用いた複雑な電子健康記録データベースに対する質問応答
- Authors: Seongsu Bae, Daeyoung Kim, Jiho Kim, Edward Choi
- Abstract要約: 自然言語質問をSPARQLなどのクエリに変換するEHR-QAのための統一デコーダアーキテクチャUniQAを設計する。
また、複雑な医療用語や様々なタイプミスに対処し、SPARQL構文をよりよく学習するための、シンプルで効果的な入力マスキング(IM)を提案する。
UniQAは、EHRドメインで最も複雑なNLQ2データセットであるMIMIC*(14.2%ゲイン)と、そのタイプミスドバージョンに対して、大幅なパフォーマンス向上を示した。
- 参考スコア(独自算出の注目度): 8.656936724622145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An intelligent machine that can answer human questions based on electronic
health records (EHR-QA) has a great practical value, such as supporting
clinical decisions, managing hospital administration, and medical chatbots.
Previous table-based QA studies focusing on translating natural questions into
table queries (NLQ2SQL), however, suffer from the unique nature of EHR data due
to complex and specialized medical terminology, hence increased decoding
difficulty. In this paper, we design UniQA, a unified encoder-decoder
architecture for EHR-QA where natural language questions are converted to
queries such as SQL or SPARQL. We also propose input masking (IM), a simple and
effective method to cope with complex medical terms and various typos and
better learn the SQL/SPARQL syntax. Combining the unified architecture with an
effective auxiliary training objective, UniQA demonstrated a significant
performance improvement against the previous state-of-the-art model for
MIMICSQL* (14.2% gain), the most complex NLQ2SQL dataset in the EHR domain, and
its typo-ridden versions (approximately 28.8% gain). In addition, we confirmed
consistent results for the graph-based EHR-QA dataset, MIMICSPARQL*.
- Abstract(参考訳): 電子健康記録(EHR-QA)に基づく人間の質問に答えられるインテリジェントマシンは、臨床診断のサポート、病院管理の管理、医療チャットボットなど、非常に実践的な価値がある。
しかし、テーブル質問をテーブルクエリ(NLQ2SQL)に翻訳することに焦点を当てたテーブルベースのQA研究は、複雑で専門的な医療用語によるEHRデータの独特な性質に悩まされており、復号の難しさが増している。
本稿では,自然言語質問をSQLやSPARQLなどのクエリに変換するEHR-QAのための統一エンコーダデコーダアーキテクチャUniQAを設計する。
また、複雑な医療用語や様々なタイプミスに対処し、SQL/SPARQL構文をよりよく学習するための、シンプルで効果的な入力マスキング(IM)を提案する。
統合アーキテクチャと効果的な補助訓練の目標を組み合わせることで、MIMICSQL*の以前の最先端モデル(14.2%のゲイン)、EHRドメインで最も複雑なNLQ2SQLデータセット、そしてタイポライデンバージョン(約28.8%のゲイン)に対する大幅なパフォーマンス向上を実証した。
さらに、グラフベースのEHR-QAデータセットMIMICSPARQL*の一貫性のある結果を確認した。
関連論文リスト
- Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - LG AI Research & KAIST at EHRSQL 2024: Self-Training Large Language Models with Pseudo-Labeled Unanswerable Questions for a Reliable Text-to-SQL System on EHRs [58.59113843970975]
テキストから回答へのモデルは、Electronic Health Recordsを知識のない医療専門家に利用できるようにする上で重要なものだ。
疑似ラベル付き非解答質問を用いた自己学習戦略を提案し,EHRのテキスト・ツー・アンサーモデルの信頼性を高める。
論文 参考訳(メタデータ) (2024-05-18T03:25:44Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records [0.6138671548064356]
本稿では,テキスト・ツー・ジェネレーションと検索拡張生成(RAG)を組み合わせて疫学的な疑問に答えるエンド・ツー・エンド手法を提案する。
RAGは、現実的な業界環境で示すように、彼らの能力を改善するための有望な方向性を提供します。
論文 参考訳(メタデータ) (2024-03-14T09:45:05Z) - EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records [36.213730355895805]
発声は、医師、看護師、保険審査・健康記録チームを含む222人の病院職員から集められた。
我々はこれらの質問を、MIMIC-IIIとeICUの2つのオープンソースのEHRデータベースに手動でリンクし、データセットに様々な時間表現と解決不可能な質問を格納した。
論文 参考訳(メタデータ) (2023-01-16T05:10:20Z) - DrugEHRQA: A Question Answering Dataset on Structured and Unstructured
Electronic Health Records For Medicine Related Queries [7.507210439502174]
本稿では, 質問応答データセット(DrugEHRQA)を開発した。
我々のデータセットには、70,000以上の質問応答対を含む、医薬品関連のクエリがある。
論文 参考訳(メタデータ) (2022-05-03T03:50:50Z) - Uncertainty-Aware Text-to-Program for Question Answering on Structured
Electronic Health Records [8.272573489245717]
EHR-QAのためのプログラムベースモデル(NLQ2Program)を,今後の方向性に向けた第一歩として設計する。
グラフベースのEHR-QAデータセットであるMIMICSPARQL*に,プログラムベースのアプローチを半教師付き方式で取り組んだ。
信頼性の高い EHR-QA モデルに対して,不確実性分解法を適用し,入力問題におけるあいまいさを計測する。
論文 参考訳(メタデータ) (2022-03-14T08:12:16Z) - Knowledge Graph-based Question Answering with Electronic Health Records [30.901617020638124]
Question Answering (QA)は、インテリジェントマシンの開発と評価のための広く使われているフレームワークである。
本稿では,自然言語クエリをSPARQLに変換するグラフベースのEHR QAを提案する。
すべてのデータセットはオープンソースとして公開されており、EHR QAの研究をさらに促進している。
論文 参考訳(メタデータ) (2020-10-19T11:31:20Z) - Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex
Healthcare Question Answering [89.76059961309453]
HeadQAデータセットには、公衆医療専門試験で認可された複数の選択質問が含まれている。
これらの質問は、現在のQAシステムにとって最も難しいものです。
知識抽出フレームワーク(MurKe)を用いた多段階推論を提案する。
市販の事前訓練モデルを完全に活用しようと努力しています。
論文 参考訳(メタデータ) (2020-08-06T02:47:46Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z) - Template-Based Question Generation from Retrieved Sentences for Improved
Unsupervised Question Answering [98.48363619128108]
擬似学習データを用いてQAモデルを訓練するための教師なしアプローチを提案する。
関連した検索文に簡単なテンプレートを適用してQA学習のための質問を生成すると、元の文脈文よりも、下流QAのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2020-04-24T17:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。