論文の概要: Conversations with Search Engines: SERP-based Conversational Response
Generation
- arxiv url: http://arxiv.org/abs/2004.14162v2
- Date: Tue, 18 May 2021 06:40:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 14:18:46.104048
- Title: Conversations with Search Engines: SERP-based Conversational Response
Generation
- Title(参考訳): 検索エンジンとの会話:serpベースの会話応答生成
- Authors: Pengjie Ren, Zhumin Chen, Zhaochun Ren, Evangelos Kanoulas, Christof
Monz, and Maarten de Rijke
- Abstract要約: 我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
- 参考スコア(独自算出の注目度): 77.1381159789032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of answering complex information needs
by conversing conversations with search engines, in the sense that users can
express their queries in natural language, and directly receivethe information
they need from a short system response in a conversational manner. Recently,
there have been some attempts towards a similar goal, e.g., studies on
Conversational Agents (CAs) and Conversational Search (CS). However, they
either do not address complex information needs, or they are limited to the
development of conceptual frameworks and/or laboratory-based user studies.
We pursue two goals in this paper: (1) the creation of a suitable dataset,
the Search as a Conversation (SaaC) dataset, for the development of pipelines
for conversations with search engines, and (2) the development of
astate-of-the-art pipeline for conversations with search engines, the
Conversations with Search Engines (CaSE), using this dataset. SaaC is built
based on a multi-turn conversational search dataset, where we further employ
workers from a crowdsourcing platform to summarize each relevant passage into a
short, conversational response. CaSE enhances the state-of-the-art by
introducing a supporting token identification module and aprior-aware pointer
generator, which enables us to generate more accurate responses.
We carry out experiments to show that CaSE is able to outperform strong
baselines. We also conduct extensive analyses on the SaaC dataset to show where
there is room for further improvement beyond CaSE. Finally, we release the SaaC
dataset and the code for CaSE and all models used for comparison to facilitate
future research on this topic.
- Abstract(参考訳): 本稿では,ユーザが自然言語でクエリを表現できるという意味で,検索エンジンと会話することで複雑な情報要求に答える問題に対処し,短いシステム応答から必要な情報を会話形式で直接受信する。
近年、会話エージェント(cas)や会話検索(cs)の研究など、同様の目標に向けた試みがいくつか行われている。
しかし、複雑な情報のニーズに対処しないか、あるいは概念フレームワークや実験室ベースのユーザリサーチの開発に限られている。
本稿では,(1)適切なデータセットの作成,(2)会話用パイプラインの開発のためのsaac(search as a conversation)データセット,(2)検索エンジンとの会話のための最先端パイプラインの開発,(2)このデータセットを用いた検索エンジンとの対話(case)という2つの目標を追求する。
SaaCはマルチターンの会話検索データセットに基づいて構築されており、クラウドソーシングプラットフォームから労働者を雇い、関連する各項目を短い会話応答にまとめる。
caseは、サポート対象のトークン識別モジュールとaprior-awareポインタジェネレータを導入することで、最先端の処理を強化します。
我々は,CaSEが強いベースラインより優れていることを示す実験を行った。
また、CaSE以外のさらなる改善の余地があるかを示すために、SaaCデータセットの広範な分析を行う。
最後に、我々は、CaSEのSaaCデータセットとコードと、このトピックに関する今後の研究を促進するために使用されるすべてのモデルをリリースする。
関連論文リスト
- Toward Conversational Agents with Context and Time Sensitive Long-term Memory [8.085414868117917]
最近まで、RAGに関するほとんどの研究は、ウィキペディアのような巨大なテキストデータベースからの情報検索に重点を置いてきた。
我々は,静的なデータベース検索と比較して,長文の対話データからの効果的な検索は2つの問題に直面していると論じる。
我々は、最近の長文でシミュレートされた会話のデータセットの上に構築された、あいまいで時間に基づく質問の新しいデータセットを生成する。
論文 参考訳(メタデータ) (2024-05-29T18:19:46Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - CONVERSER: Few-Shot Conversational Dense Retrieval with Synthetic Data
Generation [32.10366004426449]
対話型高密度検索のためのフレームワークであるConVERSERを提案する。
我々は,大言語モデルのテキスト内学習機能を利用して,検索コーパスの文節に与えられた会話クエリを生成する。
対話型検索ベンチマークOR-QuACとTREC CAsT 19の実験結果から,提案したConverSERは完全教師付きモデルに匹敵する性能を示した。
論文 参考訳(メタデータ) (2023-09-13T06:40:24Z) - SSP: Self-Supervised Post-training for Conversational Search [63.28684982954115]
本稿では,対話型検索モデルを効率的に初期化するための3つの自己教師型タスクを備えた学習後パラダイムであるフルモデル(モデル)を提案する。
提案手法の有効性を検証するために,CAsT-19 と CAsT-20 の2つのベンチマークデータセットを用いて,会話検索タスクにモデルにより訓練後の会話エンコーダを適用した。
論文 参考訳(メタデータ) (2023-07-02T13:36:36Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - Open-Retrieval Conversational Question Answering [62.11228261293487]
オープン検索型対話型質問応答 (ORConvQA) の設定を導入する。
ORConvQAのエンド・ツー・エンドシステムを構築し,レトリバー,リランカ,およびすべてトランスフォーマーをベースとしたリーダを特徴とする。
論文 参考訳(メタデータ) (2020-05-22T19:39:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。