論文の概要: Query-focused Extractive Summarisation for Biomedical and COVID-19
Complex Question Answering
- arxiv url: http://arxiv.org/abs/2209.01815v1
- Date: Mon, 5 Sep 2022 07:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 13:31:19.846265
- Title: Query-focused Extractive Summarisation for Biomedical and COVID-19
Complex Question Answering
- Title(参考訳): バイオメディカルおよびCOVID-19複合質問応答のためのクエリ中心抽出要約
- Authors: Diego Moll\'a (Macquarie University, Sydney, Australia)
- Abstract要約: 本稿では,最近の2つのBioASQ Synergy Tasksへのマッコーリー大学の参加について述べる。
本稿では, 問合せに焦点を絞った抽出要約手法を適用し, 生体医学的問題に対する複雑な回答を生成する。
The Synergy task, we selected the candidate sentences following two phases: document search and snippet search。
そこで本研究では,BioASQ10bトレーニングデータの下半期にトレーニングを行った結果の改善について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents Macquarie University's participation to the two most
recent BioASQ Synergy Tasks (as per June 2022), and to the BioASQ10 Task~B
(BioASQ10b), Phase~B. In these tasks, participating systems are expected to
generate complex answers to biomedical questions, where the answers may contain
more than one sentence. We apply query-focused extractive summarisation
techniques. In particular, we follow a sentence classification-based approach
that scores each candidate sentence associated to a question, and the $n$
highest-scoring sentences are returned as the answer. The Synergy Task
corresponds to an end-to-end system that requires document selection, snippet
selection, and finding the final answer, but it has very limited training data.
For the Synergy task, we selected the candidate sentences following two phases:
document retrieval and snippet retrieval, and the final answer was found by
using a DistilBERT/ALBERT classifier that had been trained on the training data
of BioASQ9b. Document retrieval was achieved as a standard search over the
CORD-19 data using the search API provided by the BioASQ organisers, and
snippet retrieval was achieved by re-ranking the sentences of the top retrieved
documents, using the cosine similarity of the question and candidate sentence.
We observed that vectors represented via sBERT have an edge over tf.idf.
BioASQ10b Phase B focuses on finding the specific answers to biomedical
questions. For this task, we followed a data-centric approach. We hypothesised
that the training data of the first BioASQ years might be biased and we
experimented with different subsets of the training data. We observed an
improvement of results when the system was trained on the second half of the
BioASQ10b training data.
- Abstract(参考訳): 本稿では,近年の2つのBioASQ Synergy Tasks(2022年6月現在)とBioASQ10 Task~B(BioASQ10b)へのMacquarie大学参加について述べる。
これらの課題において、参加システムは、複数の文を含む可能性のある生体医学的質問に対する複雑な回答を生成することが期待されている。
クエリに焦点をあてた抽出要約手法を適用する。
特に,質問に関連付けられた各候補文を採点する文分類に基づくアプローチを踏襲し,その答えとして$n$最高スコアの文を返却する。
synergyタスクは、ドキュメントの選択、スニペットの選択、最終回答の検索を必要とするエンドツーエンドシステムに対応するが、トレーニングデータは非常に限られている。
提案手法では,bioasq9bの学習データに基づいて学習したディチルバート/アルベルト分類器を用いて,文書検索とスニペット検索の2段階から候補文を選択し,最終回答を得た。
文書検索は,BioASQオーガナイザが提供した検索APIを用いて,CORD-19データの標準検索として達成し,質問文と候補文の余分な類似性を用いて,上位文書の文を再ランク付けすることで,スニペット検索を実現した。
sBERT で表されるベクトルは tf.idf 上のエッジを持つ。
BioASQ10b フェーズBは、バイオメディカルな疑問に対する具体的な答えを見つけることに焦点を当てている。
このタスクでは、データ中心のアプローチに従いました。
我々は、最初のBioASQ年のトレーニングデータにバイアスがかかる可能性があると仮定し、トレーニングデータの異なるサブセットを実験した。
bioasq10bトレーニングデータの後半にシステムがトレーニングされた際に、結果の改善が観察された。
関連論文リスト
- RAG-ConfusionQA: A Benchmark for Evaluating LLMs on Confusing Questions [52.33835101586687]
会話AIエージェントはRetrieval Augmented Generation(RAG)を使用して、ユーザからの問い合わせに対して検証可能なドキュメント地上応答を提供する。
本稿では,与えられた文書コーパスから,文脈に乱れた多様な質問を効率的に生成する,新しい合成データ生成手法を提案する。
論文 参考訳(メタデータ) (2024-10-18T16:11:29Z) - Using Pretrained Large Language Model with Prompt Engineering to Answer Biomedical Questions [1.0742675209112622]
事前学習型大言語モデル(LLM)に基づく2段階情報検索と質問応答システムを提案する。
テキスト内数ショットの例でプロンプトを構築し、再サンプリングや不正な応答検出などの後処理技術を利用する。
本システムでは,文書検索における0.14 MAPスコア,スニペット検索における0.05 MAPスコア,イエス/ノー質問に対する0.96 F1スコア,ファクトイド質問に対する0.38 MRRスコア,タスク12bにおけるリスト質問に対する0.50 F1スコアを達成した。
論文 参考訳(メタデータ) (2024-07-09T11:48:49Z) - Biomedical Entity Linking as Multiple Choice Question Answering [48.74212158495695]
本稿では,バイオメディカルエンティティリンクを複数問合せ回答として扱う新モデルであるBioELQAを提案する。
まず、高速検索器を用いて候補エンティティを取得し、生成器に参照と候補エンティティを共同で提示し、選択したエンティティに関連付けられた予測シンボルを出力する。
長い尾を持つエンティティの一般化を改善するため、類似したラベル付きトレーニングインスタンスを手がかりとして検索し、ジェネレータの検索インスタンスで入力する。
論文 参考訳(メタデータ) (2024-02-23T08:40:38Z) - Contributions to the Improvement of Question Answering Systems in the
Biomedical Domain [0.951828574518325]
この論文は、生物医学領域における質問応答(QA)の枠組みに該当する。
バイオメディカル領域におけるQAの性能向上のための4つのコントリビューションを提案する。
我々はSemBioNLQAと呼ばれる完全に自動化されたセマンティックバイオメディカルQAシステムを開発した。
論文 参考訳(メタデータ) (2023-07-25T16:31:20Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - Query-Focused Extractive Summarisation for Finding Ideal Answers to
Biomedical and COVID-19 Questions [7.6997148655751895]
マカリー大学はBioASQ Synergy TaskとBioASQ9b Phase Bに参加した。
我々は,BioASQ8bのトレーニングデータセットを用いて,問合せに着目した要約システムを用いた。
システムによって回収された文書やスニペットの質が低かったことを踏まえ,回答の質は適度に良好であった。
論文 参考訳(メタデータ) (2021-08-27T09:19:42Z) - TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and
Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。
本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文 参考訳(メタデータ) (2021-05-17T06:12:06Z) - Transferability of Natural Language Inference to Biomedical Question
Answering [17.38537039378825]
生物医学的質問応答(QA)への自然言語推論(NLI)の知識伝達にBioBERTを適用することに注力する。
NLIデータセットでトレーニングされたBioBERTは、Yes/No(+5.59%)、Factoid(+0.53%)、List type(+13.58%)でより良いパフォーマンスを得る。
第8回 BioASQ Challenge (Phase B) において, 良好に機能するシーケンシャルトランスファー学習法を提案する。
論文 参考訳(メタデータ) (2020-07-01T04:05:48Z) - A Study on Efficiency, Accuracy and Document Structure for Answer
Sentence Selection [112.0514737686492]
本稿では,単語関連エンコーダとともに,原語階の内在的構造を活用すれば,競争的な結果が得られることを論じる。
私たちのモデルはWikiQAデータセットでトレーニングするのに9.5秒かかります。
論文 参考訳(メタデータ) (2020-03-04T22:12:18Z) - Pre-training Tasks for Embedding-based Large-scale Retrieval [68.01167604281578]
本稿では,大規模クエリ文書検索問題について考察する。
クエリ(例えば質問)が与えられたら、関連するドキュメントのセットを大きなドキュメントコーパスから返します。
本稿では, 組込み型トランスフォーマーモデルの学習の鍵となる要素が, 事前学習作業のセットであることを示す。
論文 参考訳(メタデータ) (2020-02-10T16:44:00Z) - UNCC Biomedical Semantic Question Answering Systems. BioASQ: Task-7B,
Phase-B [1.976652238476722]
本稿では,タスク7b,フェーズB,実行解答タスクについて述べる。
これらの質問回答(QA)タスクには、Factoid、Yes/No、List Type Questioningなどが含まれる。
本システムは文脈単語埋め込みモデルに基づく。
論文 参考訳(メタデータ) (2020-02-05T20:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。