論文の概要: Domain-specific Question Answering with Hybrid Search
- arxiv url: http://arxiv.org/abs/2412.03736v2
- Date: Sat, 21 Dec 2024 20:28:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 22:39:33.971516
- Title: Domain-specific Question Answering with Hybrid Search
- Title(参考訳): ハイブリッド検索によるドメイン固有の質問応答
- Authors: Dewang Sultania, Zhaoyu Lu, Twisha Naik, Franck Dernoncourt, David Seunghyun Yoon, Sanat Sharma, Trung Bui, Ashok Gupta, Tushar Vatsa, Suhas Suresha, Ishita Verma, Vibha Belavadi, Cheng Chen, Michael Friedrich,
- Abstract要約: 本研究では,細調整された高密度検索器とキーワードベーススパース検索を併用したハイブリッド手法により,性能が著しく向上することを示す。
実験結果から, このハイブリッド方式は, シングルレトリバーシステムより優れていたことが示唆された。
- 参考スコア(独自算出の注目度): 39.85176264551715
- License:
- Abstract: Domain specific question answering is an evolving field that requires specialized solutions to address unique challenges. In this paper, we show that a hybrid approach combining a fine-tuned dense retriever with keyword based sparse search methods significantly enhances performance. Our system leverages a linear combination of relevance signals, including cosine similarity from dense retrieval, BM25 scores, and URL host matching, each with tunable boost parameters. Experimental results indicate that this hybrid method outperforms our single-retriever system, achieving improved accuracy while maintaining robust contextual grounding. These findings suggest that integrating multiple retrieval methodologies with weighted scoring effectively addresses the complexities of domain specific question answering in enterprise settings.
- Abstract(参考訳): ドメイン固有の質問応答は、ユニークな課題に対処する専門的なソリューションを必要とする進化する分野である。
本稿では,細調整された高密度検索器とキーワードベーススパース検索を併用したハイブリッド手法により,性能が著しく向上することを示す。
本システムは,高密度検索によるコサイン類似性,BM25スコア,URLホストマッチングなどの関連信号の線形結合を利用して,それぞれに調整可能なブーストパラメータを付与する。
実験結果から, このハイブリッド方式は, 強靭な文脈的接地を維持しつつ, 精度を向上し, シングルレトリバーシステムより優れていたことが示唆された。
これらの結果から,複数の検索手法と重み付きスコアリングを組み合わせることは,企業環境におけるドメイン固有質問応答の複雑さに効果的に対処できることが示唆された。
関連論文リスト
- Improve Dense Passage Retrieval with Entailment Tuning [22.39221206192245]
検索システムの鍵となるのは、クエリとパスペアの関連スコアを計算することである。
我々は、NLIタスクにおけるエンテーメントの概念と、関連性の主要なクラスが一致していることを観察した。
我々は,高密度レトリバーの埋め込みを改善するために,エンテーメントチューニングと呼ばれる手法を設計する。
論文 参考訳(メタデータ) (2024-10-21T09:18:30Z) - Optimizing Retrieval-Augmented Generation with Elasticsearch for Enhanced Question-Answering Systems [2.4299671488193497]
本研究の目的は,大規模言語モデル(LLM)の精度と品質を,検索型拡張生成(RAG)フレームワークに統合することにより改善することである。
この実験では、テストデータセットとしてSQuAD(Stanford Question Answering dataset)バージョン2.0が使用されている。
論文 参考訳(メタデータ) (2024-10-18T04:17:49Z) - Retrieval with Learned Similarities [2.729516456192901]
最先端の検索アルゴリズムは、学習された類似点に移行した。
そこで本研究では,Mixture-of-Logits (MoL) を実証的に実現し,多様な検索シナリオにおいて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2024-07-22T08:19:34Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - COS-Mix: Cosine Similarity and Distance Fusion for Improved Information Retrieval [0.0]
本研究では,レトリーバル拡張生成(RAG)のための新しいハイブリッド検索手法を提案する。
伝統的なコサイン類似度尺度は、高次元空間におけるベクトル間の類似度を捉えるために広く用いられている。
ベクトル間の相似性を定量化することにより、相補的な視点を提供するためにコサイン距離測度を組み込む。
論文 参考訳(メタデータ) (2024-06-02T06:48:43Z) - Towards Hybrid-grained Feature Interaction Selection for Deep Sparse
Network [18.759101407874507]
深層スパークネットワークにおける特徴場と特徴値の両方を対象とする,ハイブリッドな機能相互作用選択手法を提案する。
そこで我々は,機能フィールドと特徴値の両方から機能相互作用を効率的に選択するoptFeatureという選択アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-23T20:15:30Z) - Hybrid and Collaborative Passage Reranking [144.83902343298112]
本稿では,HybRank(HybRank)手法を提案する。
スパースとシークエンスレトリバーの語彙的および意味的特性を組み込んで再ランク付けする。
HybRankは、既製のレトリバー機能をベースに構築されており、任意のパスリストを拡張できるプラグインリランカである。
論文 参考訳(メタデータ) (2023-05-16T09:38:52Z) - ECO-TR: Efficient Correspondences Finding Via Coarse-to-Fine Refinement [80.94378602238432]
粗大な処理で対応性を見出すことにより、ECO-TR(Correspondence Efficient Transformer)と呼ばれる効率的な構造を提案する。
これを実現するために、複数の変圧器ブロックは段階的に連結され、予測された座標を徐々に洗練する。
種々のスパースタスクと密マッチングタスクの実験は、既存の最先端技術に対する効率性と有効性の両方において、我々の手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-09-25T13:05:33Z) - Multidimensional Assignment Problem for multipartite entity resolution [69.48568967931608]
Multipartiteエンティティ解決は、複数のデータセットから1つのエンティティにレコードを統合することを目的としている。
代入問題を解くために、グリーディアルゴリズムと大規模近傍探索という2つの手順を適用する。
データベースのサイズが大きくなるにつれて、設計ベースのマルチスタートがより効率的であることを示す。
論文 参考訳(メタデータ) (2021-12-06T20:34:55Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。