論文の概要: TableQnA: Answering List Intent Queries With Web Tables
- arxiv url: http://arxiv.org/abs/2001.04828v1
- Date: Fri, 10 Jan 2020 01:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 22:54:54.345021
- Title: TableQnA: Answering List Intent Queries With Web Tables
- Title(参考訳): tableqna: webテーブルでリストインテントクエリに応答する
- Authors: Kaushik Chakrabarti, Zhimin Chen, Siamak Shakeri, Guihong Cao, Surajit
Chaudhuri
- Abstract要約: 我々は、HTMLテーブルでクエリの2つのクラスに答えることに集中する。
既存のアプローチでは、候補者から回答を選択するために機械学習モデルを訓練している。
構造認識マッチングを計算し、機械学習モデルを訓練する新機能を開発した。
- 参考スコア(独自算出の注目度): 12.941073798838167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The web contains a vast corpus of HTML tables. They can be used to provide
direct answers to many web queries. We focus on answering two classes of
queries with those tables: those seeking lists of entities (e.g., `cities in
california') and those seeking superlative entities (e.g., `largest city in
california'). The main challenge is to achieve high precision with significant
coverage. Existing approaches train machine learning models to select the
answer from the candidates; they rely on textual match features between the
query and the content of the table along with features capturing table
quality/importance. These features alone are inadequate for achieving the above
goals. Our main insight is that we can improve precision by (i) first
extracting intent (structured information) from the query for the above query
classes and (ii) then performing structure-aware matching (instead of just
textual matching) between the extracted intent and the candidates to select the
answer. We model (i) as a sequence tagging task. We leverage state-of-the-art
deep neural network models with word embeddings. The model requires large scale
training data which is expensive to obtain via manual labeling; we therefore
develop a novel method to automatically generate the training data. For (ii),
we develop novel features to compute structure-aware match and train a machine
learning model. Our experiments on real-life web search queries show that (i)
our intent extractor for list and superlative intent queries has significantly
higher precision and coverage compared with baseline approaches and (ii) our
table answer selector significantly outperforms the state-of-the-art baseline
approach. This technology has been used in production by Microsoft's Bing
search engine since 2016.
- Abstract(参考訳): web には膨大な html テーブルのコーパスがある。
多くのWebクエリに対する直接的な回答を提供するために使用できる。
私たちはこれらのテーブルでクエリの2つのクラスに答えることに集中しています。エンティティのリストを求めるもの(例:カリフォルニアのシティ)と最上級のエンティティを求めるもの(例:カリフォルニア最大の都市)です。
主な課題は、かなりのカバレッジで高精度を達成することです。
既存のアプローチでは、候補からの回答を選択するために機械学習モデルをトレーニングしている。クエリとテーブルの内容のテキストマッチング機能と、テーブルの品質/インポータンスをキャプチャする機能に依存している。
これらの特徴だけでは、上記の目標を達成するには不十分です。
主な洞察は 精度を向上できることです
i) 上記クエリクラスに対するクエリから最初にインテント(構造化情報)を抽出し、
(ii)次に、抽出した意図と回答を選択する候補との間に構造認識マッチング(単にテキストマッチングではなく)を行う。
私たちは
(i)シーケンスタグ付けタスクとして。
単語埋め込みによる最先端のディープニューラルネットワークモデルを活用する。
本モデルでは,手作業によるラベリングで取得に費用がかかる大規模トレーニングデータを必要とするため,トレーニングデータを自動的に生成する新しい手法を開発した。
のために
(II) 構造認識マッチングを計算し, 機械学習モデルを訓練する新機能を開発する。
実生活におけるweb検索クェリの実験から
i) リストおよび最上級のインテントクエリのインテント抽出器は,ベースラインアプローチに比べて精度とカバレッジが有意に高い。
(ii)我々の表回答セレクタは,最先端のベースラインアプローチを著しく上回っている。
この技術は、MicrosoftのBing検索エンジンで2016年から生産されている。
関連論文リスト
- LIST: Learning to Index Spatio-Textual Data for Embedding based Spatial Keyword Queries [53.843367588870585]
リスト K-kNN 空間キーワードクエリ (TkQ) は、空間的およびテキスト的関連性の両方を考慮したランキング関数に基づくオブジェクトのリストを返す。
効率的かつ効率的な指標、すなわち高品質なラベルの欠如とバランスの取れない結果を構築する上で、大きな課題が2つある。
この2つの課題に対処する新しい擬似ラベル生成手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T05:32:33Z) - FeatAug: Automatic Feature Augmentation From One-to-Many Relationship Tables [4.058220332950672]
1対多の関係テーブルの機能強化は、MLモデル開発において重要な問題であるが、難しい問題である。
本稿では,1対多の関係テーブルから述語クエリを自動的に抽出する機能拡張フレームワークFEATAUGを提案する。
FeatAugがFeattoolsよりも効果的な特徴を抽出できることを実世界の4つのデータセットで実証した。
論文 参考訳(メタデータ) (2024-03-11T01:44:14Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - Improving Content Retrievability in Search with Controllable Query
Generation [5.450798147045502]
マシンが学習した検索エンジンは高い検索可能性バイアスを持ち、クエリの大部分が同じエンティティを返す。
そこで我々はCtrlQGenを提案する。CtrlQGenは、選択したインテントナローあるいは広義のクエリを生成する方法である。
音楽,ポッドキャスト,書籍の各分野のデータセットから得られた結果から,高密度検索モデルの検索可能性バイアスを著しく低減できることがわかった。
論文 参考訳(メタデータ) (2023-03-21T07:46:57Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z) - Deep Search Query Intent Understanding [17.79430887321982]
本稿では,検索の異なる段階における問合せ意図をモデル化するための総合的な学習フレームワークの提供を目的とする。
我々は,1) 文字レベルモデルを用いたタイプアヘッド検索において,入力したユーザの意図をオンザフライで予測すること,2) 完全クエリのための正確な単語レベルの意図予測モデルに焦点をあてる。
論文 参考訳(メタデータ) (2020-08-15T18:19:56Z) - Efficient Neural Query Auto Completion [17.58784759652327]
クエリオートコンプリートシステムでは,3つの大きな課題が報告されている。
従来のQACシステムは、検索ログのクエリ候補頻度などの手作り機能に依存している。
本稿では,これらの課題を克服するために,効果的なコンテキストモデリングを用いた効率的なニューラルネットワークQACシステムを提案する。
論文 参考訳(メタデータ) (2020-08-06T21:28:36Z) - Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。
当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文 参考訳(メタデータ) (2020-01-10T01:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。