論文の概要: MIMICS: A Large-Scale Data Collection for Search Clarification
- arxiv url: http://arxiv.org/abs/2006.10174v1
- Date: Wed, 17 Jun 2020 21:54:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 20:09:01.921247
- Title: MIMICS: A Large-Scale Data Collection for Search Clarification
- Title(参考訳): MIMICS: 検索の明確化のための大規模データ収集
- Authors: Hamed Zamani, Gord Lueck, Everest Chen, Rodolfo Quispe, Flint Luu,
Nick Craswell
- Abstract要約: MIMICSは、Bingクエリログからサンプリングされた実際のWeb検索クエリのための検索明確化データセットの集合である。
MIMICSの各明解は、Bing生成アルゴリズムによって生成され、明確化された質問と最大5つの候補解からなる。
- 参考スコア(独自算出の注目度): 22.357771849483026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Search clarification has recently attracted much attention due to its
applications in search engines. It has also been recognized as a major
component in conversational information seeking systems. Despite its
importance, the research community still feels the lack of a large-scale data
for studying different aspects of search clarification. In this paper, we
introduce MIMICS, a collection of search clarification datasets for real web
search queries sampled from the Bing query logs. Each clarification in MIMICS
is generated by a Bing production algorithm and consists of a clarifying
question and up to five candidate answers. MIMICS contains three datasets: (1)
MIMICS-Click includes over 400k unique queries, their associated clarification
panes, and the corresponding aggregated user interaction signals (i.e.,
clicks). (2) MIMICS-ClickExplore is an exploration data that includes
aggregated user interaction signals for over 60k unique queries, each with
multiple clarification panes. (3) MIMICS-Manual includes over 2k unique real
search queries. Each query-clarification pair in this dataset has been manually
labeled by at least three trained annotators. It contains graded quality labels
for the clarifying question, the candidate answer set, and the landing result
page for each candidate answer.
MIMICS is publicly available for research purposes, thus enables researchers
to study a number of tasks related to search clarification, including
clarification generation and selection, user engagement prediction for
clarification, click models for clarification, and analyzing user interactions
with search clarification.
- Abstract(参考訳): 近年,検索エンジンへの応用により,検索の明確化が注目されている。
また、会話情報探索システムの主要な構成要素として認識されている。
その重要性にもかかわらず、調査コミュニティは検索の明確化のさまざまな側面を研究するための大規模なデータがないと感じている。
本稿では,Bing クエリログからサンプリングした実Web 検索クエリの検索明確化データセットである MIMICS について紹介する。
模倣のそれぞれの明確化はbing生成アルゴリズムによって生成され、明確化質問と最大5つの候補回答からなる。
MIMICS-Clickには、400k以上のユニークなクエリ、関連する明確化パネル、および対応する集約されたユーザインタラクション信号(クリック)の3つのデータセットが含まれている。
2) MIMICS-ClickExploreは,60k以上のユニークなクエリに対するユーザインタラクション信号を集約した探索データである。
(3) mimics-manual は、2k 以上のユニークな実検索クエリを含む。
このデータセットの各クエリを明確にするペアは、少なくとも3つのトレーニング済みアノテーションによって手動でラベル付けされている。
明快な質問のための等級別品質ラベル、候補回答セット、候補回答毎のランディング結果ページを含む。
MIMICSは、研究目的のために公開されており、研究者は、明確化の生成と選択、明確化のためのユーザエンゲージメント予測、明確化のためのクリックモデル、検索明確化によるユーザインタラクションの分析など、検索明確化に関連する多くのタスクを研究できる。
関連論文リスト
- QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval [12.543590253664492]
我々は、$textitQueryBuilder$という、インタラクティブな新しいシステムを提示します。
初心者の英語を話すユーザは、少量の労力でクエリを作成できる。
ユーザの情報要求に応じた言語間情報検索クエリを迅速に開発する。
論文 参考訳(メタデータ) (2024-09-07T00:46:58Z) - CLARINET: Augmenting Language Models to Ask Clarification Questions for Retrieval [52.134133938779776]
CLARINETは,回答が正しい候補の確実性を最大化する質問を選択することで,情報的明確化を問うシステムである。
提案手法は,大規模言語モデル(LLM)を検索分布の条件付きで拡張し,各ターンで真の候補のランクを最大化する問題を生成する。
論文 参考訳(メタデータ) (2024-04-28T18:21:31Z) - Asking Multimodal Clarifying Questions in Mixed-Initiative
Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。
マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。
質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。
クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文 参考訳(メタデータ) (2024-02-12T16:04:01Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - MIRA: Leveraging Multi-Intention Co-click Information in Web-scale
Document Retrieval using Deep Neural Networks [5.963438927897287]
産業Web検索におけるディープリコールモデルの問題について検討する。
ウェブスケールのマルチインテンション共同クリック文書グラフを提案する。
また,Bertとグラフアテンションネットワークに基づく符号化フレームワークMIRAを提案する。
論文 参考訳(メタデータ) (2020-07-03T06:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。