論文の概要: Tradeoffs in Sentence Selection Techniques for Open-Domain Question
Answering
- arxiv url: http://arxiv.org/abs/2009.09120v1
- Date: Fri, 18 Sep 2020 23:39:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 02:59:12.450527
- Title: Tradeoffs in Sentence Selection Techniques for Open-Domain Question
Answering
- Title(参考訳): オープンドメイン質問応答における文選択技法のトレードオフ
- Authors: Shih-Ting Lin and Greg Durrett
- Abstract要約: 文選択のためのモデルの2つのグループについて述べる。QAベースのアプローチは、解答候補を特定するための完全なQAシステムを実行し、検索ベースのモデルは、各質問に特に関連する各節の一部を見つける。
非常に軽量なQAモデルは、このタスクではうまく機能するが、検索ベースモデルは高速である。
- 参考スコア(独自算出の注目度): 54.541952928070344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current methods in open-domain question answering (QA) usually employ a
pipeline of first retrieving relevant documents, then applying strong reading
comprehension (RC) models to that retrieved text. However, modern RC models are
complex and expensive to run, so techniques to prune the space of retrieved
text are critical to allow this approach to scale. In this paper, we focus on
approaches which apply an intermediate sentence selection step to address this
issue, and investigate the best practices for this approach. We describe two
groups of models for sentence selection: QA-based approaches, which run a
full-fledged QA system to identify answer candidates, and retrieval-based
models, which find parts of each passage specifically related to each question.
We examine trade-offs between processing speed and task performance in these
two approaches, and demonstrate an ensemble module that represents a hybrid of
the two. From experiments on Open-SQuAD and TriviaQA, we show that very
lightweight QA models can do well at this task, but retrieval-based models are
faster still. An ensemble module we describe balances between the two and
generalizes well cross-domain.
- Abstract(参考訳): オープンドメイン質問応答(QA)の現在の手法は、通常、関連する文書を検索するパイプラインを使用し、取得したテキストに強力な読解(RC)モデルを適用する。
しかし、現代のRCモデルは複雑で実行に費用がかかるため、検索したテキストの空間を創り出す技術は、このアプローチをスケールするために重要である。
本稿では,この問題に対処するために中間文選択ステップを適用するアプローチに注目し,このアプローチのベストプラクティスを検討する。
文選択のためのモデルの2つのグループについて述べる。QAベースのアプローチは、解答候補を特定するための完全なQAシステムを実行し、検索ベースのモデルは、各質問に特に関連する各節の一部を見つける。
これら2つのアプローチにおいて,処理速度とタスク性能のトレードオフを検証し,この2つのハイブリッドを表すアンサンブルモジュールを実演する。
Open-SQuADとTriviaQAの実験から、非常に軽量なQAモデルがこのタスクでうまく機能することを示したが、検索ベースモデルは高速である。
アンサンブルモジュールは2つのバランスを記述し、よくクロスドメインを一般化する。
関連論文リスト
- Reranking Passages with Coarse-to-Fine Neural Retriever Enhanced by List-Context Information [0.9463895540925061]
本稿では、他の候補からリストコンテキスト情報を取り入れることで、文節表現を増強するリストコンテキストアテンション機構を提案する。
The proposed coarse-to-fine neural retriever address the out-of-Memory limitation of the passage attention mechanism。
粗いランク付けと細かなランク付けを共同最適化プロセスに統合することで、2つのレイヤ間のフィードバックを同時に更新することが可能になる。
論文 参考訳(メタデータ) (2023-08-23T09:29:29Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - Improving Document Representations by Generating Pseudo Query Embeddings
for Dense Retrieval [11.465218502487959]
反復的なクラスタリングプロセスにより,各文書のクエリを模倣する手法を設計する。
また、2段階のスコア計算手順でマッチング関数を最適化する。
いくつかの人気ランキングとQAデータセットに関する実験結果から、私たちのモデルが最先端の結果を達成できることが示された。
論文 参考訳(メタデータ) (2021-05-08T05:28:24Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。