論文の概要: Zero-shot Clarifying Question Generation for Conversational Search
- arxiv url: http://arxiv.org/abs/2301.12660v1
- Date: Mon, 30 Jan 2023 04:43:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:46:07.141100
- Title: Zero-shot Clarifying Question Generation for Conversational Search
- Title(参考訳): 会話検索のためのゼロショット明確化質問生成
- Authors: Zhenduo Wang, Yuancheng Tu, Corby Rosset, Nick Craswell, Ming Wu,
Qingyao Ai
- Abstract要約: 本稿では,質問テンプレートとクエリファセットの両方を用いて,効果的かつ正確な質問生成を導く制約付き質問生成システムを提案する。
実験の結果,提案手法は既存のゼロショットベースラインよりも大きなマージンで優れていた。
- 参考スコア(独自算出の注目度): 25.514678546942754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A long-standing challenge for search and conversational assistants is query
intention detection in ambiguous queries. Asking clarifying questions in
conversational search has been widely studied and considered an effective
solution to resolve query ambiguity. Existing work have explored various
approaches for clarifying question ranking and generation. However, due to the
lack of real conversational search data, they have to use artificial datasets
for training, which limits their generalizability to real-world search
scenarios. As a result, the industry has shown reluctance to implement them in
reality, further suspending the availability of real conversational search
interaction data. The above dilemma can be formulated as a cold start problem
of clarifying question generation and conversational search in general.
Furthermore, even if we do have large-scale conversational logs, it is not
realistic to gather training data that can comprehensively cover all possible
queries and topics in open-domain search scenarios. The risk of fitting bias
when training a clarifying question retrieval/generation model on
incomprehensive dataset is thus another important challenge.
In this work, we innovatively explore generating clarifying questions in a
zero-shot setting to overcome the cold start problem and we propose a
constrained clarifying question generation system which uses both question
templates and query facets to guide the effective and precise question
generation. The experiment results show that our method outperforms existing
state-of-the-art zero-shot baselines by a large margin. Human annotations to
our model outputs also indicate our method generates 25.2\% more natural
questions, 18.1\% more useful questions, 6.1\% less unnatural and 4\% less
useless questions.
- Abstract(参考訳): 検索と会話アシスタントの長年の課題は、あいまいなクエリにおけるクエリ意図の検出である。
会話探索における質問の明確化は広く研究されており,問合せの曖昧さを解決する有効な解決策であると考えられる。
既存の研究は、質問のランク付けと生成を明確にするための様々なアプローチを検討してきた。
しかし、実際の会話型検索データがないため、トレーニングに人工データセットを使用する必要があり、実世界の検索シナリオへの一般化が制限される。
その結果、業界は現実的な実装に消極的であり、実際の対話型検索データの利用をさらに停止させた。
上記のジレンマは、質問生成と会話探索を一般に明らかにするコールドスタート問題として定式化することができる。
さらに、大規模な会話ログがあるとしても、すべての可能なクエリやトピックをオープンドメイン検索シナリオで包括的にカバーできるトレーニングデータを集めることは現実的ではない。
包括的データセットを用いた質問検索・生成モデルの学習におけるバイアスの適合のリスクも重要な課題である。
本研究では,ゼロショット環境での明確化問題の生成を革新的に検討し,質問テンプレートと問合せファセットの両方を用いて,効果的かつ正確な質問生成を導く制約付き明確化質問生成システムを提案する。
実験の結果,本手法は既存のゼロショットベースラインよりも高いマージンを示した。
モデル出力に対する人間のアノテーションは、我々の方法が25.2\%、有用な18.1\%、不自然でない6.1\%、役に立たない4.%の質問を生成することを示している。
関連論文リスト
- Analyzing Human Questioning Behavior and Causal Curiosity through Natural Queries [91.70689724416698]
NatQuest(ナットクエスト)は、3つの異なるソースから自然発生の質問13,500件のコレクションである。
分析の結果,データセット内には因果的疑問(最大42%)が有意な存在であることが判明した。
論文 参考訳(メタデータ) (2024-05-30T17:55:28Z) - CLARINET: Augmenting Language Models to Ask Clarification Questions for Retrieval [52.134133938779776]
CLARINETは,回答が正しい候補の確実性を最大化する質問を選択することで,情報的明確化を問うシステムである。
提案手法は,大規模言語モデル(LLM)を検索分布の条件付きで拡張し,各ターンで真の候補のランクを最大化する問題を生成する。
論文 参考訳(メタデータ) (2024-04-28T18:21:31Z) - Qsnail: A Questionnaire Dataset for Sequential Question Generation [76.616068047362]
質問紙作成作業に特化して構築された最初のデータセットについて述べる。
我々はQsnailの実験を行い、その結果、検索モデルと従来の生成モデルが与えられた研究トピックや意図と完全に一致していないことが明らかとなった。
チェーン・オブ・シークレット・プロンプトと微調整による改善にもかかわらず、言語モデルによるアンケートは、人間の手書きのアンケートには及ばない。
論文 参考訳(メタデータ) (2024-02-22T04:14:10Z) - Asking Multimodal Clarifying Questions in Mixed-Initiative
Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。
マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。
質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。
クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文 参考訳(メタデータ) (2024-02-12T16:04:01Z) - ZeQR: Zero-shot Query Reformulation for Conversational Search [11.644235288057123]
本稿では,対話型検索データからの監視を必要とせずに,従来の対話コンテキストに基づいてクエリを再構成する,ゼロショットクエリ再構成(あるいはクエリ書き換え)フレームワークを提案する。
具体的には、機械読解タスク用に設計された言語モデルを用いて、コア参照と省略という2つの共通の曖昧さを生クエリで明示的に解決する。
さらに、あいまいさが明確かつ積極的に解決されているため、説明可能性も向上し、クエリ意図の理解を効果的に強化する。
論文 参考訳(メタデータ) (2023-07-18T16:05:25Z) - Evaluating Mixed-initiative Conversational Search Systems via User
Simulation [9.066817876491053]
このような検索システムの自動評価のための対話型ユーザシミュレータUSiを提案する。
Ui が生成した応答は,その基盤となる情報要求と同等であり,人間による回答に匹敵するものであることを示す。
論文 参考訳(メタデータ) (2022-04-17T16:27:33Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z) - Guided Transformer: Leveraging Multiple External Sources for
Representation Learning in Conversational Search [36.64582291809485]
あいまいなクエリやフェースドクエリに対する質問を明確にすることは,様々な情報検索システムにおいて有用な手法として認識されている。
本稿では,トランスフォーマーネットワークが学習した表現を,外部情報ソースからの新たなアテンション機構を用いて強化する。
実験では,検索の明確化のための公開データセットを用いて,競合するベースラインと比較して大きな改善点を示した。
論文 参考訳(メタデータ) (2020-06-13T03:24:53Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。