論文の概要: Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight
- arxiv url: http://arxiv.org/abs/2308.04756v1
- Date: Wed, 9 Aug 2023 07:47:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 14:39:55.403871
- Title: Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight
- Title(参考訳): 新しいドメインのための解釈可能で信頼性の高いオープン情報検索ツールの構築
- Authors: Xiaodong Yu, Ben Zhou, Dan Roth
- Abstract要約: 情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 67.03842581848299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Information retrieval (IR) or knowledge retrieval, is a critical component
for many down-stream tasks such as open-domain question answering (QA). It is
also very challenging, as it requires succinctness, completeness, and
correctness. In recent works, dense retrieval models have achieved
state-of-the-art (SOTA) performance on in-domain IR and QA benchmarks by
representing queries and knowledge passages with dense vectors and learning the
lexical and semantic similarity. However, using single dense vectors and
end-to-end supervision are not always optimal because queries may require
attention to multiple aspects and event implicit knowledge. In this work, we
propose an information retrieval pipeline that uses entity/event linking model
and query decomposition model to focus more accurately on different information
units of the query. We show that, while being more interpretable and reliable,
our proposed pipeline significantly improves passage coverages and denotation
accuracies across five IR and QA benchmarks. It will be the go-to system to use
for applications that need to perform IR on a new domain without much dedicated
effort, because of its superior interpretability and cross-domain performance.
- Abstract(参考訳): 情報検索 (IR) または知識検索は、オープンドメイン質問応答 (QA) など、多くのダウンストリームタスクにとって重要な要素である。
簡潔さ、完全性、正確性を必要とするため、非常に難しい。
近年の高密度検索モデルでは、クエリや知識通路を高密度ベクトルで表現し、語彙的および意味的類似性を学習することで、ドメイン内IRおよびQAベンチマーク上でのSOTA(State-of-the-art)性能を実現している。
しかし、クエリは複数の側面やイベントの暗黙の知識に注意を必要とするため、単一の高密度ベクトルとエンドツーエンドの監視が常に最適であるとは限らない。
本研究では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
高い解釈性とクロスドメインパフォーマンスのために、新しいドメインでIRを実行する必要のあるアプリケーションに使用するためのゴーツーシステムである。
関連論文リスト
- REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain
Question Answering [122.62012375722124]
既存の手法では,大規模言語モデル (LLM) は検索した文書の関連性を正確に評価することはできない。
Relevance-Aware Retrieval-augmented approach for open- domain question answering (QA)を提案する。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Spatial-Temporal Enhanced Transformer Towards Multi-Frame 3D Object
Detection [59.03596380773798]
我々は、DETRのようなパラダイムに基づいた、多フレーム3Dオブジェクト検出のための新しいエンドツーエンドフレームワークであるSTEMDを提案する。
具体的には、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
我々は,計算オーバーヘッドをわずかに加えるだけで,難解なシナリオに対処する手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Neural Methods for Effective, Efficient, and Exposure-Aware Information
Retrieval [7.3371176873092585]
情報検索の具体的なニーズと課題に動機づけられた新しいニューラルアーキテクチャと手法を紹介します。
多くの実生活のIRタスクにおいて、検索には数十億のドキュメントを含む商用Web検索エンジンのドキュメントインデックスなど、非常に大規模なコレクションが含まれる。
論文 参考訳(メタデータ) (2020-12-21T21:20:16Z) - Adaptive Attentional Network for Few-Shot Knowledge Graph Completion [16.722373937828117]
Few-shot Knowledge Graph (KG) の完成は、現在の研究の焦点であり、各タスクは、数少ない参照エンティティペアを考えると、関係の見えない事実をクエリすることを目的としている。
最近の試みでは、エンティティと参照の静的表現を学習し、それらの動的特性を無視してこの問題を解決している。
本研究は,適応実体と参照表現を学習することにより,数ショットのKG補完のための適応的注意ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-19T16:27:48Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - Multi-Perspective Semantic Information Retrieval [22.74453301532817]
本研究は,複数の深層学習モデルと従来のIRモデルを組み合わせたマルチパースペクティブIRシステムの概念を導入し,クエリ・セマンス・ペアの関連性をより正確に予測する。
この研究はBioASQ Biomedical IR + QA Challengeで評価されている。
論文 参考訳(メタデータ) (2020-09-03T21:56:38Z) - Linked Credibility Reviews for Explainable Misinformation Detection [1.713291434132985]
本稿では,誤情報検出に協力する分散ボットのネットワーク構築に使用できるCR(Credibility Reviews)のコアコンセプトに基づくアーキテクチャを提案する。
CRは、(i)Webコンテンツのグラフを構成するためのビルディングブロックとして機能し、(ii)既存の信頼性信号 --fact-checked claimsとWebサイトの評判評価 -- を構成し、(iii)自動的に計算されたレビューを生成する。
このアーキテクチャは、.orgへの軽量な拡張と、意味的類似性と姿勢検出のための汎用的なNLPタスクを提供するサービスの上に実装されている。
論文 参考訳(メタデータ) (2020-08-28T16:55:43Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。