論文の概要: Effective Transfer Learning for Identifying Similar Questions: Matching
User Questions to COVID-19 FAQs
- arxiv url: http://arxiv.org/abs/2008.13546v1
- Date: Tue, 4 Aug 2020 18:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 23:48:58.474612
- Title: Effective Transfer Learning for Identifying Similar Questions: Matching
User Questions to COVID-19 FAQs
- Title(参考訳): 類似した質問を識別するための効果的な転送学習: ユーザの質問とcovid-19のfaqのマッチング
- Authors: Clara H. McCreery, Namit Katariya, Anitha Kannan, Manish Chablani,
Xavier Amatriain
- Abstract要約: 医療質問応答対にニューラルネットワークを事前学習する2つの微調整アプローチが,医療質問類似性を決定するのに有用な中間課題であることを示す。
また、トレーニングされたモデルを使用して、ユーザの質問と新型コロナウイルス関連のFAQをマッチングする、現在稼働中のシステムについても説明する。
- 参考スコア(独自算出の注目度): 5.512295869673147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: People increasingly search online for answers to their medical questions but
the rate at which medical questions are asked online significantly exceeds the
capacity of qualified people to answer them. This leaves many questions
unanswered or inadequately answered. Many of these questions are not unique,
and reliable identification of similar questions would enable more efficient
and effective question answering schema. COVID-19 has only exacerbated this
problem. Almost every government agency and healthcare organization has tried
to meet the informational need of users by building online FAQs, but there is
no way for people to ask their question and know if it is answered on one of
these pages. While many research efforts have focused on the problem of general
question similarity, these approaches do not generalize well to domains that
require expert knowledge to determine semantic similarity, such as the medical
domain. In this paper, we show how a double fine-tuning approach of pretraining
a neural network on medical question-answer pairs followed by fine-tuning on
medical question-question pairs is a particularly useful intermediate task for
the ultimate goal of determining medical question similarity. While other
pretraining tasks yield an accuracy below 78.7% on this task, our model
achieves an accuracy of 82.6% with the same number of training examples, an
accuracy of 80.0% with a much smaller training set, and an accuracy of 84.5%
when the full corpus of medical question-answer data is used. We also describe
a currently live system that uses the trained model to match user questions to
COVID-related FAQs.
- Abstract(参考訳): 医師の質問に対する回答を求める人が増えているが、オンラインで質問される割合は、回答する資格のある人の能力を大きく上回っている。
多くの疑問は答えられず、答えが不十分である。
これらの質問の多くはユニークではなく、類似した質問の信頼性の高い識別は、より効率的で効果的な質問応答スキーマを可能にする。
新型コロナウイルス(covid-19)はこの問題を悪化させた。
ほぼすべての政府機関や医療機関が、オンラインFAQを構築して、ユーザの情報ニーズを満たしようと試みてきたが、質問をして、その1ページに答えられるかどうかを知る方法がない。
多くの研究は一般的な質問の類似性の問題に焦点を当てているが、これらのアプローチは医学領域のような意味的類似性を決定するのに専門家の知識を必要とする領域にうまく一般化していない。
本稿では,医療質問対におけるニューラルネットワークの事前学習と,医療質問対の微調整が,医療質問の類似性を決定する究極の目的に対して,特に有効な中間課題であることを示す。
他のプリトレーニングタスクでは78.7%未満の精度が得られるが、同じトレーニングサンプル数で82.6%の精度、より少ないトレーニングセットで80.0%の精度、医療質問データの全コーパスを使用する場合の84.5%の精度が得られる。
また、トレーニングされたモデルを使用して、ユーザの質問と新型コロナウイルス関連のFAQをマッチングする、現在稼働中のシステムについても説明する。
関連論文リスト
- RealMedQA: A pilot biomedical question answering dataset containing realistic clinical questions [3.182594503527438]
本稿では,人間とLLMが生み出す現実的な臨床質問のデータセットであるRealMedQAを紹介する。
LLMは「理想的な」QAペアを生成するのに、よりコスト効率が高いことを示す。
論文 参考訳(メタデータ) (2024-08-16T09:32:43Z) - Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models [73.79091519226026]
Uncertainty of Thoughts (UoT) は、大きな言語モデルを拡張するアルゴリズムであり、効果的な質問をすることで積極的に情報を求めることができる。
医療診断、トラブルシューティング、および20の質問ゲームに関する実験において、UoTは、タスク完了の成功率において平均38.1%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-02-05T18:28:44Z) - Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - Top K Relevant Passage Retrieval for Biomedical Question Answering [1.0636004442689055]
質問応答は、大量の文書を用いて事実のない質問に答えるタスクである。
既存のDense Passage Retrievalモデルは、2018年12月20日からWikipediaでトレーニングされている。
本研究では, バイオメディカル領域における既存のDPRフレームワークについて検討し, 医療上の疑問に答える信頼できる情報源である Pubmed の記事から回答を得た。
論文 参考訳(メタデータ) (2023-08-08T04:06:11Z) - Medical Question Understanding and Answering with Knowledge Grounding
and Semantic Self-Supervision [53.692793122749414]
本稿では,知識基盤とセマンティック・セルフスーパービジョンを備えた医療質問理解・回答システムについて紹介する。
我々のシステムは、まず、教師付き要約損失を用いて、長い医学的、ユーザによる質問を要約するパイプラインである。
システムはまず、信頼された医療知識ベースから要約されたユーザ質問とFAQとをマッチングし、対応する回答文書から一定の数の関連文を検索する。
論文 参考訳(メタデータ) (2022-09-30T08:20:32Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - Retrieving and ranking short medical questions with two stages neural
matching model [3.8020157990268206]
インターネットユーザーの80%が、オンライン上で健康に関する質問をしている。
医学分野における代表的な質問や回答は、医療データマイニングに有用な原資料である。
問合せレベルの医療質問のセマンティックマッチングのための新しい2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-16T07:00:35Z) - Where's the Question? A Multi-channel Deep Convolutional Neural Network
for Question Identification in Textual Data [83.89578557287658]
本稿では,実際の質問を分離する目的で,新しい多チャンネル深層畳み込みニューラルネットワークアーキテクチャであるQuest-CNNを提案する。
提案するニューラルネットワークと他のディープニューラルネットワークの総合的な性能比較分析を行った。
提案したQuest-CNNは、透析ケア設定におけるデータエントリレビュー対話のデータセットと一般的なドメインデータセットの両方において、最高のF1スコアを達成した。
論文 参考訳(メタデータ) (2020-10-15T15:11:22Z) - Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex
Healthcare Question Answering [89.76059961309453]
HeadQAデータセットには、公衆医療専門試験で認可された複数の選択質問が含まれている。
これらの質問は、現在のQAシステムにとって最も難しいものです。
知識抽出フレームワーク(MurKe)を用いた多段階推論を提案する。
市販の事前訓練モデルを完全に活用しようと努力しています。
論文 参考訳(メタデータ) (2020-08-06T02:47:46Z) - A Qualitative Evaluation of Language Models on Automatic
Question-Answering for COVID-19 [4.676651062800037]
新型コロナウイルスは740万人以上の感染者と41万8000人以上の死者を出した。
オンラインコミュニティ、フォーラム、ソーシャルメディアは、関連する質問や回答を検索する潜在的な場所を提供する。
本稿では,新型コロナウイルスに関する質問に自動回答する言語モデルを適用し,生成した回答を質的に評価する。
論文 参考訳(メタデータ) (2020-06-19T05:13:57Z) - Automated Question Answer medical model based on Deep Learning
Technology [0.43748379918040853]
本研究は、RNNのフレームワークとエンコーダデコーダを用いてエンドツーエンドモデルをトレーニングし、少数の医療・健康問題に対する賢明で有用な回答を生成する。
提案モデルは、WebMD、HealthTap、eHealthForums、iCliniqなど、さまざまなオンラインサービスからのデータを用いて、トレーニングと評価を行った。
論文 参考訳(メタデータ) (2020-05-21T01:40:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。