論文の概要: Neural Retriever and Go Beyond: A Thesis Proposal
- arxiv url: http://arxiv.org/abs/2205.16005v1
- Date: Tue, 31 May 2022 17:59:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-01 15:11:06.784333
- Title: Neural Retriever and Go Beyond: A Thesis Proposal
- Title(参考訳): Neural Retriever and Go Beyond: テーマ提案
- Authors: Man Luo
- Abstract要約: Information Retriever (IR) は、あるクエリに関連するドキュメントを大規模に検索することを目的としている。
最近のニューラルベースアルゴリズム(ニューラルレトリバーと呼ばれる)は、従来の手法の限界を緩和できるほど注目を集めている。
- 参考スコア(独自算出の注目度): 1.082365064737981
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information Retriever (IR) aims to find the relevant documents (e.g.
snippets, passages, and articles) to a given query at large scale. IR plays an
important role in many tasks such as open domain question answering and
dialogue systems, where external knowledge is needed. In the past, searching
algorithms based on term matching have been widely used. Recently, neural-based
algorithms (termed as neural retrievers) have gained more attention which can
mitigate the limitations of traditional methods. Regardless of the success
achieved by neural retrievers, they still face many challenges, e.g. suffering
from a small amount of training data and failing to answer simple
entity-centric questions. Furthermore, most of the existing neural retrievers
are developed for pure-text query. This prevents them from handling
multi-modality queries (i.e. the query is composed of textual description and
images). This proposal has two goals. First, we introduce methods to address
the abovementioned issues of neural retrievers from three angles, new model
architectures, IR-oriented pretraining tasks, and generating large scale
training data. Second, we identify the future research direction and propose
potential corresponding solution.
- Abstract(参考訳): Information Retriever (IR) は、あるクエリに関連するドキュメント(スニペット、パス、記事など)を大規模に検索することを目的としている。
IRは、外部知識が必要なオープンドメイン質問応答や対話システムなど、多くのタスクにおいて重要な役割を果たす。
これまで,項マッチングに基づく探索アルゴリズムが広く用いられてきた。
近年,ニューラルレトリバーと呼ばれるニューラルベースアルゴリズムが注目され,従来の手法の限界を緩和している。
ニューラルレトリバーの成功にかかわらず、少量のトレーニングデータに苦しむことや、単純なエンティティ中心の質問に答えられないことなど、多くの課題に直面している。
さらに、既存のニューラルレトリバーのほとんどは、純粋テキストクエリのために開発されている。
これにより、マルチモーダルなクエリ(すなわち、クエリはテキスト記述とイメージで構成されている)を扱うことができない。
この提案には2つの目標がある。
まず,3つの角度からのニューラルレトリバー,新しいモデルアーキテクチャ,IR指向事前学習タスク,大規模トレーニングデータの生成といった課題に対処する手法を提案する。
第2に,今後の研究方向を特定し,潜在的な対応策を提案する。
関連論文リスト
- Large Language Models for Information Retrieval: A Survey [57.7992728506871]
情報検索は、項ベースの手法から高度なニューラルモデルとの統合へと進化してきた。
近年の研究では、大規模言語モデル(LLM)を活用してIRシステムの改善が試みられている。
LLMとIRシステムの合流点を探索し、クエリリライト、リトリバー、リランカー、リーダーといった重要な側面を含む。
論文 参考訳(メタデータ) (2023-08-14T12:47:22Z) - Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-09T07:47:17Z) - Multi-Grained Knowledge Retrieval for End-to-End Task-Oriented Dialog [42.088274728084265]
外部データベースから適切なドメイン知識を取得することは、エンドツーエンドのタスク指向の対話システムの中心にある。
既存のシステムの多くは、知識検索と応答生成を融合させ、参照応答からの直接監督でそれらを最適化している。
応答生成から知識検索を分離し,多粒度知識検索システムを提案する。
論文 参考訳(メタデータ) (2023-05-17T12:12:46Z) - Are Deep Neural Networks SMARTer than Second Graders? [85.60342335636341]
6~8歳児を対象としたビジュオ言語パズルの解法において,ニューラルネットワークの抽象化,推論,一般化能力の評価を行った。
我々のデータセットは101のユニークなパズルで構成されており、各パズルは絵の質問で構成されており、それらの解には算術、代数学、空間推論を含むいくつかの基本的なスキルが混在している必要がある。
実験により、強力なディープモデルは教師付き設定でパズルに合理的な性能を与えるが、一般化のために解析するとランダムな精度よりは良くないことが明らかになった。
論文 参考訳(メタデータ) (2022-12-20T04:33:32Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - Improving Biomedical Information Retrieval with Neural Retrievers [30.778569849542837]
本稿では,ニューラルネットワークモデルの学習に活用できるテンプレートベースの質問生成手法を提案する。
第2に、情報検索の下流タスクと密接に一致した2つの新しい事前学習タスクを開発する。
第3に、各コンテキストを複数のコンテキストベクトルにエンコードするPoly-DPR'モデルを導入する。
論文 参考訳(メタデータ) (2022-01-19T17:36:54Z) - End-to-End Training of Neural Retrievers for Open-Domain Question
Answering [32.747113232867825]
ニューラルレトリバーに対して、非監視および監督された方法が最も効果的に使用できるかは不明である。
Inverse Cloze Taskとマスク付きサラエントスパンによる教師なしプリトレーニングのアプローチを提案します。
また,OpenQAモデルにおけるリーダとレシーバコンポーネントのエンドツーエンド教師付きトレーニングのための2つのアプローチについても検討する。
論文 参考訳(メタデータ) (2021-01-02T09:05:34Z) - Multi-task Retrieval for Knowledge-Intensive Tasks [21.725935960568027]
ニューラル検索のためのマルチタスク訓練モデルを提案する。
我々のアプローチは、数ショット設定で過去の手法より優れているだけでなく、ニューラルレトリバーに匹敵する。
レトリバーの助けを借りて、ダウンストリームタスクの既存のモデルを改善し、複数のベンチマークで最先端の技術を密接に一致または改善します。
論文 参考訳(メタデータ) (2021-01-01T00:16:34Z) - Distilling Knowledge from Reader to Retriever for Question Answering [16.942581590186343]
我々は,知識蒸留に触発された下流タスクのレトリバーモデルを学ぶ手法を提案する。
質問応答の方法を評価し,最新の結果を得た。
論文 参考訳(メタデータ) (2020-12-08T17:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。