論文の概要: Question-to-Question Retrieval for Hallucination-Free Knowledge Access: An Approach for Wikipedia and Wikidata Question Answering
- arxiv url: http://arxiv.org/abs/2501.11301v1
- Date: Mon, 20 Jan 2025 07:05:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:25:50.234025
- Title: Question-to-Question Retrieval for Hallucination-Free Knowledge Access: An Approach for Wikipedia and Wikidata Question Answering
- Title(参考訳): 幻覚のない知識アクセスのための質問対質問検索:ウィキペディアとウィキデータによる質問回答へのアプローチ
- Authors: Santhosh Thottingal,
- Abstract要約: 本稿では,ウィキペディアやウィキデータといった知識ベースに対する質問応答のアプローチを紹介する。
命令調整 LLM を用いて,各論理コンテンツ単位に対する包括的質問セットを生成する。
ウィキデータからの構造化事実検索によるマルチメディアコンテンツを含むウィキペディアおよびウィキデータ上での有効性を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper introduces an approach to question answering over knowledge bases like Wikipedia and Wikidata by performing "question-to-question" matching and retrieval from a dense vector embedding store. Instead of embedding document content, we generate a comprehensive set of questions for each logical content unit using an instruction-tuned LLM. These questions are vector-embedded and stored, mapping to the corresponding content. Vector embedding of user queries are then matched against this question vector store. The highest similarity score leads to direct retrieval of the associated article content, eliminating the need for answer generation. Our method achieves high cosine similarity ( > 0.9 ) for relevant question pairs, enabling highly precise retrieval. This approach offers several advantages including computational efficiency, rapid response times, and increased scalability. We demonstrate its effectiveness on Wikipedia and Wikidata, including multimedia content through structured fact retrieval from Wikidata, opening up new pathways for multimodal question answering.
- Abstract(参考訳): 本稿では,ウィキペディアやウィキデータなどの知識ベースに対する質問応答について,密度の高いベクトル埋め込みストアから"クエスト・ツー・クエスト"マッチングと検索を行う手法を提案する。
文書コンテンツを埋め込む代わりに、命令調整 LLM を用いて各論理コンテンツユニットに対して包括的な質問セットを生成する。
これらの質問はベクトル埋め込みされ、保存され、対応するコンテンツにマッピングされる。
ユーザクエリのベクトル埋め込みは、この質問ベクトルストアにマッチする。
最も類似度の高いスコアは、関連記事の直接検索につながり、回答生成の必要性がなくなる。
提案手法は,関係する質問対に対して高いコサイン類似性 ( > 0.9 ) を達成し,高精度な検索を可能にする。
このアプローチには、計算効率、迅速な応答時間、拡張性の向上など、いくつかの利点がある。
ウィキデータからの構造化事実検索によるマルチメディアコンテンツを含むウィキペディアおよびウィキデータ上での有効性を実証し,マルチモーダル質問応答のための新たな経路を開拓する。
関連論文リスト
- Integrating SPARQL and LLMs for Question Answering over Scholarly Data Sources [0.0]
本稿では,SPARQLクエリを合成し,アルゴリズムを分割・征服する手法と,事前学習した抽出質問応答モデルについて述べる。
まずSPARQLクエリからデータを収集し、次に分割と分割を適用してさまざまな質問タイプとソースを管理し、モデルを使用して個人的な著者の質問を処理する。
Exact MatchとFスコアのメトリクスで評価されたこの手法は、学術的な文脈におけるQAの精度と効率を改善することを約束している。
論文 参考訳(メタデータ) (2024-09-11T14:50:28Z) - HOLMES: Hyper-Relational Knowledge Graphs for Multi-hop Question Answering using LLMs [9.559336828884808]
大規模言語モデル(LLM)は、単純な(シングルホップ)質問に答えるには適しています。
質問の複雑さが増すにつれて、LLMの性能は低下する。
最近の手法では、構造化知識三重項を原文に組み込むことで、この負担を軽減しようとしている。
本稿では,知識グラフ(KG)を用いてコンテキスト認識し,クエリ関連情報を含むように蒸留する手法を提案する。
論文 参考訳(メタデータ) (2024-06-10T05:22:49Z) - Fine-tuned LLMs Know More, Hallucinate Less with Few-Shot
Sequence-to-Sequence Semantic Parsing over Wikidata [6.716263690738313]
本稿では,Wikidataの質の高い質問応答ベンチマークであるWikiWebQuestionsを提案する。
現実世界のデータとSPARQLで構成されている。
IDの代わりにユニークなドメイン名とプロパティ名を使用するように、SPARQLを修正します。
論文 参考訳(メタデータ) (2023-05-23T16:20:43Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Enhanced vectors for top-k document retrieval in Question Answering [0.0]
本稿では,証拠文書を効率よく正確に検索する別の手法を提案する。
私たちは、それぞれのドキュメント(または私たちの場合のパス)をユニークな識別子に割り当て、それらを使って密度の高いベクトルを生成することで、そうします。
このアプローチにより、リアルタイムクエリベクトルを4ミリ秒で効率的に作成できる。
論文 参考訳(メタデータ) (2022-10-08T07:44:24Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - A Benchmark for Generalizable and Interpretable Temporal Question
Answering over Knowledge Bases [67.33560134350427]
TempQA-WDは時間的推論のためのベンチマークデータセットである。
Wikidataは、最も頻繁にキュレーションされ、公開されている知識ベースである。
論文 参考訳(メタデータ) (2022-01-15T08:49:09Z) - HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions [38.89150764309989]
We build HopRetriever that retrieves hops over Wikipedia to answer complex questions。
また,本手法は証拠収集過程の定量的解釈ももたらしている。
論文 参考訳(メタデータ) (2020-12-31T10:36:01Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z) - Open-Domain Question Answering with Pre-Constructed Question Spaces [70.13619499853756]
オープンドメインの質問応答は、大量の文書の集合の中でユーザ生成した質問に対する回答を見つけるという課題を解決することを目的としている。
ソリューションには、レトリバーリーダーとナレッジグラフベースのアプローチの2つのファミリーがある。
本稿では,両家系と異なるリーダ・リトリバー構造を持つ新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-02T04:31:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。