論文の概要: Two is Better than Many? Binary Classification as an Effective Approach
to Multi-Choice Question Answering
- arxiv url: http://arxiv.org/abs/2210.16495v1
- Date: Sat, 29 Oct 2022 05:11:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 14:47:09.890393
- Title: Two is Better than Many? Binary Classification as an Effective Approach
to Multi-Choice Question Answering
- Title(参考訳): 二人は人よりマシか?
マルチチョイス質問応答に対する効果的なアプローチとしてのバイナリ分類
- Authors: Deepanway Ghosal, Navonil Majumder, Rada Mihalcea, Soujanya Poria
- Abstract要約: 正のインスタンスと正のインスタンスと負のインスタンスとを分類することは、さまざまなモデルやデータセットにおいて、はるかに効果的であることを示す。
当社のDeBERTaバイナリ分類モデルは、さまざまなタスクのための公開リーダボードの上位あるいは上位に到達します。
- 参考スコア(独自算出の注目度): 43.35258958775454
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose a simple refactoring of multi-choice question answering (MCQA)
tasks as a series of binary classifications. The MCQA task is generally
performed by scoring each (question, answer) pair normalized over all the
pairs, and then selecting the answer from the pair that yield the highest
score. For n answer choices, this is equivalent to an n-class classification
setup where only one class (true answer) is correct. We instead show that
classifying (question, true answer) as positive instances and (question, false
answer) as negative instances is significantly more effective across various
models and datasets. We show the efficacy of our proposed approach in different
tasks -- abductive reasoning, commonsense question answering, science question
answering, and sentence completion. Our DeBERTa binary classification model
reaches the top or close to the top performance on public leaderboards for
these tasks. The source code of the proposed approach is available at
https://github.com/declare-lab/TEAM.
- Abstract(参考訳): 本稿では,二項分類のシリーズとして,MCQAタスクの簡易リファクタリングを提案する。
MCQAタスクは一般に、すべてのペアに対して正規化された各(質問、回答)ペアをスコアリングし、次に最も高いスコアを得るペアから回答を選択する。
n 個の答えの選択に対して、これは 1 つのクラス(真の答え)だけが正しい n クラスの分類設定と等価である。
その代わり、正のインスタンスと正のインスタンスと負のインスタンスとを分類することは、さまざまなモデルやデータセットでかなり効果的であることを示す。
提案手法は, 帰納的推論, 常識的質問応答, 科学的質問応答, 文完成など, 様々なタスクにおいて有効性を示す。
当社のDeBERTaバイナリ分類モデルは,これらのタスクの公開リーダボード上での上位あるいは上位に到達します。
提案されたアプローチのソースコードはhttps://github.com/declare-lab/TEAMで公開されている。
関連論文リスト
- Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。
ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。
本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文 参考訳(メタデータ) (2023-07-08T04:32:17Z) - BUCA: A Binary Classification Approach to Unsupervised Commonsense
Question Answering [11.99004747630325]
非教師付きコモンセンス推論(UCR)は、コモンセンス推論データセットの構築が高価であるため、ますます人気が高まっている。
本稿では、下流の複数選択質問応答タスクを、その妥当性に応じて全ての候補回答をランク付けすることで、より単純な二分分類タスクに変換することを提案する。
論文 参考訳(メタデータ) (2023-05-25T10:59:47Z) - RLAS-BIABC: A Reinforcement Learning-Based Answer Selection Using the
BERT Model Boosted by an Improved ABC Algorithm [6.82469220191368]
回答選択(AS)は、オープンドメイン質問応答(QA)問題の重要なサブタスクである。
本稿では、注意機構に基づく長短期メモリ(LSTM)と、変換器(BERT)ワード埋め込みによる双方向エンコーダ表現に基づいて、ASのためのRLAS-BIABCと呼ばれる手法を提案する。
論文 参考訳(メタデータ) (2023-01-07T08:33:05Z) - Answer Generation for Retrieval-based Question Answering Systems [80.28727681633096]
シーケンス・トゥ・シークエンス・トランスモデルを訓練し、候補集合から解を生成する。
英語のAS2データセットを3つ比較したところ, 精度は32点まで向上した。
論文 参考訳(メタデータ) (2021-06-02T05:45:49Z) - A Semantic-based Method for Unsupervised Commonsense Question Answering [40.18557352036813]
ラベル付きタスクデータに依存しないため、教師なしのコモンセンス質問応答は魅力的である。
教師なしコモンセンス質問応答のためのSemantic-based Question Answering法(SEQA)を提案する。
論文 参考訳(メタデータ) (2021-05-31T08:21:52Z) - Generative Context Pair Selection for Multi-hop Question Answering [60.74354009152721]
マルチホップ質問応答のための生成コンテキスト選択モデルを提案する。
提案した生成経路選択モデルは,対向保留集合上でのより良い性能(ベースラインより4.9%高い)を有する。
論文 参考訳(メタデータ) (2021-04-18T07:00:48Z) - Few-Shot Question Answering by Pretraining Span Selection [58.31911597824848]
私たちは、数百のトレーニング例しか利用できない、より現実的な数ショット設定を探索します。
標準スパン選択モデルの性能が低下していることを示し,現在の事前学習目標が質問応答から遠ざかっていることを浮き彫りにした。
本研究は,事前学習方式とモデルアーキテクチャの注意深い設計が,数ショット設定における性能に劇的な影響を及ぼすことを示唆している。
論文 参考訳(メタデータ) (2021-01-02T11:58:44Z) - Generating Correct Answers for Progressive Matrices Intelligence Tests [88.78821060331582]
Ravenのプログレッシブマトリクス(Progressive Matrices)は、複数選択のインテリジェンステストである。
このテストに対処する以前の試みは、複数の選択肢の中から正しい回答を選択することに集中していました。
この作業では、代わりに、定義によって難しいタスクである選択を見ることなく、グリッドに与えられた正しい回答を生成することに焦点を合わせます。
論文 参考訳(メタデータ) (2020-11-01T13:21:07Z) - Classifier Combination Approach for Question Classification for Bengali
Question Answering System [17.567099458403707]
本研究は, ベンガルの質問分類課題において, 既存の個人モデルよりも, 複数モデルの組み合わせにより, より良い分類性能が得られることを示した。
我々は、QCの精度を高めるために、最先端のマルチモデル組み合わせ技術、すなわちアンサンブル、積み重ね、投票を利用した。
ここで提示されるアプローチは、他のインド・アーリア語やインド語で質問応答システムを開発するために使用することができる。
論文 参考訳(メタデータ) (2020-08-31T13:39:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。