論文の概要: Wizard of Search Engine: Access to Information Through Conversations
with Search Engines
- arxiv url: http://arxiv.org/abs/2105.08301v1
- Date: Tue, 18 May 2021 06:35:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-19 13:56:56.276788
- Title: Wizard of Search Engine: Access to Information Through Conversations
with Search Engines
- Title(参考訳): 検索エンジンの魔法:検索エンジンとの会話を通して情報にアクセスする
- Authors: Pengjie Ren, Zhongkun Liu, Xiaomeng Song, Hongtao Tian, Zhumin Chen,
Zhaochun Ren and Maarten de Rijke
- Abstract要約: 我々は3つの側面からCISの研究を促進するために努力している。
目的検出(ID)、キーフレーズ抽出(KE)、行動予測(AP)、クエリ選択(QS)、通過選択(PS)、応答生成(RG)の6つのサブタスクでCIS用のパイプラインを定式化する。
検索エンジンのウィザード(WISE)と呼ばれるベンチマークデータセットをリリースし、CISのすべての側面について包括的かつ詳細な調査を可能にします。
- 参考スコア(独自算出の注目度): 58.53420685514819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversational information seeking (CIS) is playing an increasingly important
role in connecting people to information. Due to the lack of suitable resource,
previous studies on CIS are limited to the study of theoretical/conceptual
frameworks, laboratory-based user studies, or a particular aspect of CIS (e.g.,
asking clarifying questions). In this work, we make efforts to facilitate
research on CIS from three aspects. (1) We formulate a pipeline for CIS with
six sub-tasks: intent detection (ID), keyphrase extraction (KE), action
prediction (AP), query selection (QS), passage selection (PS), and response
generation (RG). (2) We release a benchmark dataset, called wizard of search
engine (WISE), which allows for comprehensive and in-depth research on all
aspects of CIS. (3) We design a neural architecture capable of training and
evaluating both jointly and separately on the six sub-tasks, and devise a
pre-train/fine-tune learning scheme, that can reduce the requirements of WISE
in scale by making full use of available data. We report some useful
characteristics of CIS based on statistics of WISE. We also show that our best
performing model variant isable to achieve effective CIS as indicated by
several metrics. We release the dataset, the code, as well as the evaluation
scripts to facilitate future research by measuring further improvements in this
important research direction.
- Abstract(参考訳): 会話情報探索(CIS)は、人々を情報に結びつける上でますます重要な役割を担っている。
適切なリソースが不足しているため、CISに関する以前の研究は理論・概念的枠組み、実験室ベースのユーザー研究、あるいはCISの特定の側面(例えば、質問を明確にすること)の研究に限られている。
本研究では,3つの側面からCISの研究を促進するために努力する。
1) 意図検出(ID)、キーフレーズ抽出(KE)、行動予測(AP)、クエリ選択(QS)、通過選択(PS)、応答生成(RG)の6つのサブタスクでCIS用のパイプラインを定式化する。
2) cisのすべての側面に関する包括的かつ詳細な調査を可能にする,ウィザード・オブ・検索エンジン(wise)と呼ばれるベンチマークデータセットをリリースする。
(3)6つのサブタスクを共同で個別にトレーニングし、評価できるニューラルネットワークを設計し、利用可能なデータを完全に活用することでWISEの要求を大規模に削減できる事前訓練/微調整学習方式を考案する。
WISE統計に基づくCISの有用な特徴について報告する。
また、いくつかの指標で示されるような効果的なCISを実現するために、最良のモデル変種が可能であることを示す。
我々は、この重要な研究方向性のさらなる改善を計測し、将来の研究を促進するためのデータセット、コード、および評価スクリプトをリリースする。
関連論文リスト
- SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers [43.18330795060871]
SPIQAは、科学研究論文の文脈内で複雑な図形や表を解釈するために設計されたデータセットである。
データセット作成には自動および手動のキュレーションを使用します。
SPIQAは270Kの質問をトレーニング、検証、3つの異なる評価分割に分割する。
論文 参考訳(メタデータ) (2024-07-12T16:37:59Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - RethinkingTMSC: An Empirical Study for Target-Oriented Multimodal
Sentiment Classification [70.9087014537896]
目的指向型マルチモーダル感性分類(TMSC)は,学者の間でも注目されている。
この問題の原因を明らかにするために,データセットの広範な実験的評価と詳細な分析を行う。
論文 参考訳(メタデータ) (2023-10-14T14:52:37Z) - AVIS: Autonomous Visual Information Seeking with Large Language Model
Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。
本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。
AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-06-13T20:50:22Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - Investigating Neural Architectures by Synthetic Dataset Design [14.317837518705302]
近年、多くの新しいニューラルネットワーク構造(アーキテクチャと層)が出現している。
アドホックな合成データセットを設計することにより,各構造がネットワーク能力に与える影響を測定する手法をスケッチする。
本稿では,以下の3つのネットワーク特性のそれぞれを評価するために,3つのデータセットを構築した手法について述べる。
論文 参考訳(メタデータ) (2022-04-23T10:50:52Z) - RPT: Toward Transferable Model on Heterogeneous Researcher Data via
Pre-Training [19.987304448524043]
マルチタスク型自己教師型学習ベース研究者データ事前学習モデル RPT を提案する。
研究者のデータをセマンティックドキュメントセットとコミュニティグラフに分割する。
モデル全体を学習するための3つの自己教師型学習目標を提案する。
論文 参考訳(メタデータ) (2021-10-08T03:42:09Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z) - A New Perspective on Learning Context-Specific Independence [18.273290530700567]
文脈依存独立(CSI)のような局所構造は確率的グラフィカルモデル(PGM)の文献で注目されている。
本稿では,データからCSIを学習する方法について,新たな視点を提供する。
論文 参考訳(メタデータ) (2020-06-12T01:11:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。