論文の概要: Knowledge Graph-based Question Answering with Electronic Health Records
- arxiv url: http://arxiv.org/abs/2010.09394v2
- Date: Mon, 2 Aug 2021 07:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:13:55.300742
- Title: Knowledge Graph-based Question Answering with Electronic Health Records
- Title(参考訳): 電子健康記録を用いた知識グラフによる質問応答
- Authors: Junwoo Park, Youngwoo Cho, Haneol Lee, Jaegul Choo, Edward Choi
- Abstract要約: Question Answering (QA)は、インテリジェントマシンの開発と評価のための広く使われているフレームワークである。
本稿では,自然言語クエリをSPARQLに変換するグラフベースのEHR QAを提案する。
すべてのデータセットはオープンソースとして公開されており、EHR QAの研究をさらに促進している。
- 参考スコア(独自算出の注目度): 30.901617020638124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Question Answering (QA) is a widely-used framework for developing and
evaluating an intelligent machine. In this light, QA on Electronic Health
Records (EHR), namely EHR QA, can work as a crucial milestone towards
developing an intelligent agent in healthcare. EHR data are typically stored in
a relational database, which can also be converted to a directed acyclic graph,
allowing two approaches for EHR QA: Table-based QA and Knowledge Graph-based
QA. We hypothesize that the graph-based approach is more suitable for EHR QA as
graphs can represent relations between entities and values more naturally
compared to tables, which essentially require JOIN operations. In this paper,
we propose a graph-based EHR QA where natural language queries are converted to
SPARQL instead of SQL. To validate our hypothesis, we create four EHR QA
datasets (graph-based VS table-based, and simplified database schema VS
original database schema), based on a table-based dataset MIMICSQL. We test
both a simple Seq2Seq model and a state-of-the-art EHR QA model on all datasets
where the graph-based datasets facilitated up to 34% higher accuracy than the
table-based dataset without any modification to the model architectures.
Finally, all datasets are open-sourced to encourage further EHR QA research in
both directions.
- Abstract(参考訳): Question Answering (QA)は、インテリジェントマシンの開発と評価のための広く使われているフレームワークである。
この光の中で、Electronic Health Records(EHR)のQA(EHR QA)は、医療におけるインテリジェントなエージェントを開発する上で重要なマイルストーンとなる。
ehrデータは、通常、リレーショナル・データベースに格納されるが、これは有向非循環グラフにも変換できるため、ehl qaには2つのアプローチがある:テーブルベースのqaと知識グラフベースのqaである。
グラフがテーブルよりも自然にエンティティと値の関係を表現できるため、グラフベースのアプローチは、基本的にJOIN操作を必要とするため、EHR QAに適していると仮定する。
本稿では,自然言語クエリをSQLの代わりにSPARQLに変換するグラフベースのEHR QAを提案する。
仮説を検証するために、テーブルベースのデータセットMIMICSQLに基づいて、4つのEHR QAデータセット(グラフベースのVSテーブルベース、単純化されたデータベーススキーマVSオリジナルデータベーススキーマ)を作成する。
グラフベースのデータセットは、モデルアーキテクチャを変更することなく、テーブルベースのデータセットよりも最大34%高い精度で、単純なSeq2Seqモデルと最先端のEHR QAモデルの両方をテストする。
最後に、すべてのデータセットはオープンソースとして公開され、EHR QAのさらなる研究を促進する。
関連論文リスト
- SynTQA: Synergistic Table-based Question Answering via Mixture of Text-to-SQL and E2E TQA [25.09488366689108]
テキスト・ツー・パースとエンドツーエンド質問応答(E2E TQA)は、表に基づく質問回答タスクの2つの主要なアプローチである。
複数のベンチマークで成功したが、まだ比較されておらず、相乗効果は未解明のままである。
ベンチマークデータセットの最先端モデルを評価することによって、さまざまな長所と短所を識別する。
論文 参考訳(メタデータ) (2024-09-25T07:18:45Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA [9.659820850719413]
我々は,推論能力の強い大規模言語モデル(LLM)を自動データアノテータとして活用する。
私たちの方法における重要な革新は、Synthesize Step-by-Step戦略にあります。
我々は、チャートVQAモデルを大幅に強化し、ChartQAおよびPlotQAデータセットの最先端の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T03:02:27Z) - Neural Graph Reasoning: Complex Logical Query Answering Meets Graph
Databases [63.96793270418793]
複雑な論理クエリ応答(CLQA)は、グラフ機械学習の最近登場したタスクである。
ニューラルグラフデータベース(NGDB)の概念を紹介する。
NGDBはNeural Graph StorageとNeural Graph Engineで構成されている。
論文 参考訳(メタデータ) (2023-03-26T04:03:37Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - Uncertainty-Aware Text-to-Program for Question Answering on Structured
Electronic Health Records [8.272573489245717]
EHR-QAのためのプログラムベースモデル(NLQ2Program)を,今後の方向性に向けた第一歩として設計する。
グラフベースのEHR-QAデータセットであるMIMICSPARQL*に,プログラムベースのアプローチを半教師付き方式で取り組んだ。
信頼性の高い EHR-QA モデルに対して,不確実性分解法を適用し,入力問題におけるあいまいさを計測する。
論文 参考訳(メタデータ) (2022-03-14T08:12:16Z) - Question-Answer Sentence Graph for Joint Modeling Answer Selection [122.29142965960138]
我々は,質問文,質問文,回答文のペア間のスコアを計算するための最先端(SOTA)モデルを訓練し,統合する。
オンライン推論は、目に見えないクエリのAS2タスクを解決するために実行される。
論文 参考訳(メタデータ) (2022-02-16T05:59:53Z) - Question Answering for Complex Electronic Health Records Database using
Unified Encoder-Decoder Architecture [8.656936724622145]
自然言語質問をSPARQLなどのクエリに変換するEHR-QAのための統一デコーダアーキテクチャUniQAを設計する。
また、複雑な医療用語や様々なタイプミスに対処し、SPARQL構文をよりよく学習するための、シンプルで効果的な入力マスキング(IM)を提案する。
UniQAは、EHRドメインで最も複雑なNLQ2データセットであるMIMIC*(14.2%ゲイン)と、そのタイプミスドバージョンに対して、大幅なパフォーマンス向上を示した。
論文 参考訳(メタデータ) (2021-11-14T05:01:38Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z) - Template-Based Question Generation from Retrieved Sentences for Improved
Unsupervised Question Answering [98.48363619128108]
擬似学習データを用いてQAモデルを訓練するための教師なしアプローチを提案する。
関連した検索文に簡単なテンプレートを適用してQA学習のための質問を生成すると、元の文脈文よりも、下流QAのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2020-04-24T17:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。