論文の概要: Backtracing: Retrieving the Cause of the Query
- arxiv url: http://arxiv.org/abs/2403.03956v1
- Date: Wed, 6 Mar 2024 18:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 13:54:42.684400
- Title: Backtracing: Retrieving the Cause of the Query
- Title(参考訳): バックトレーシング:クエリーの原因を検索する
- Authors: Rose E. Wang, Pawan Wirawarn, Omar Khattab, Noah Goodman, Dorottya
Demszky
- Abstract要約: 本稿では,ユーザクエリを最も引き起こす可能性のあるテキストセグメントをシステムで検索する,バックトラシングのタスクを紹介する。
人気情報検索手法と言語モデリング手法のゼロショット性能を評価する。
以上の結果から,後方追跡には改善の余地があり,新たな検索手法が必要であることが示唆された。
- 参考スコア(独自算出の注目度): 7.715089044732362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many online content portals allow users to ask questions to supplement their
understanding (e.g., of lectures). While information retrieval (IR) systems may
provide answers for such user queries, they do not directly assist content
creators -- such as lecturers who want to improve their content -- identify
segments that _caused_ a user to ask those questions. We introduce the task of
backtracing, in which systems retrieve the text segment that most likely caused
a user query. We formalize three real-world domains for which backtracing is
important in improving content delivery and communication: understanding the
cause of (a) student confusion in the Lecture domain, (b) reader curiosity in
the News Article domain, and (c) user emotion in the Conversation domain. We
evaluate the zero-shot performance of popular information retrieval methods and
language modeling methods, including bi-encoder, re-ranking and
likelihood-based methods and ChatGPT. While traditional IR systems retrieve
semantically relevant information (e.g., details on "projection matrices" for a
query "does projecting multiple times still lead to the same point?"), they
often miss the causally relevant context (e.g., the lecturer states "projecting
twice gets me the same answer as one projection"). Our results show that there
is room for improvement on backtracing and it requires new retrieval
approaches. We hope our benchmark serves to improve future retrieval systems
for backtracing, spawning systems that refine content generation and identify
linguistic triggers influencing user queries. Our code and data are
open-sourced: https://github.com/rosewang2008/backtracing.
- Abstract(参考訳): 多くのオンラインコンテンツポータルでは、ユーザーは自分の理解を補うために質問することができる(講義など)。
情報検索(ir)システムは、そのようなユーザークエリに対する回答を提供するが、コンテンツ作成者(例えば、コンテンツを改善したい講師)が、ユーザーが質問をするために_ caused_するセグメントを識別するのを直接支援しない。
本稿では,ユーザクエリの原因となるであろうテキストセグメントを検索する,バックトレースのタスクを紹介する。
我々は、コンテンツ配信とコミュニケーションを改善する上でバックトラッキングが重要である3つの現実世界ドメインを定式化する。
(a)講義領域における学生の混乱
(b)ニュース記事領域の読者好奇心
(c)会話領域におけるユーザの感情
そこで本研究では,bi-encoder,re-grade,plath-based method,chatgptなど,一般的な情報検索手法と言語モデリング手法のゼロショット性能を評価する。
従来のirシステムは意味的に関連のある情報を検索する(例えば、"プロジェクション行列"の詳細は"複数回投影しても同じポイントになってしまうか?")が、しばしば因果関係のコンテキストを見逃す(例えば、講師は"プロジェクションは2回同じ回答を1つのプロジェクションと同じ回答を得る")。
以上の結果から,バックトレッキングの改善の余地があり,新たな検索手法が求められている。
当社のベンチマークは,ユーザクエリに影響を与えるコンテンツ生成と言語トリガの識別を改良した,バックトレッキングのための将来の検索システムの改善に役立てることを願っている。
コードとデータはオープンソースです。 https://github.com/rosewang2008/backtracing。
関連論文リスト
- Open Domain Question Answering with Conflicting Contexts [55.739842087655774]
あいまいでオープンなドメインの質問の25%は、Google Searchを使って検索すると、コンフリクトのあるコンテキストにつながります。
我々はアノテータに正しい回答の選択についての説明を依頼する。
論文 参考訳(メタデータ) (2024-10-16T07:24:28Z) - QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval [12.543590253664492]
我々は、$textitQueryBuilder$という、インタラクティブな新しいシステムを提示します。
初心者の英語を話すユーザは、少量の労力でクエリを作成できる。
ユーザの情報要求に応じた言語間情報検索クエリを迅速に開発する。
論文 参考訳(メタデータ) (2024-09-07T00:46:58Z) - Redefining Information Retrieval of Structured Database via Large Language Models [10.117751707641416]
本稿では,ChatLRと呼ばれる新しい検索拡張フレームワークを提案する。
主に、Large Language Models (LLM) の強力な意味理解能力を用いて、正確かつ簡潔な情報検索を実現する。
実験の結果、ChatLRがユーザクエリに対処する効果を示し、全体の情報検索精度は98.8%を超えた。
論文 参考訳(メタデータ) (2024-05-09T02:37:53Z) - Selecting Query-bag as Pseudo Relevance Feedback for Information-seeking Conversations [76.70349332096693]
情報検索対話システムは電子商取引システムで広く利用されている。
クエリバッグに基づくPseudo Relevance Feedback framework(QB-PRF)を提案する。
関連クエリを備えたクエリバッグを構築し、擬似シグナルとして機能し、情報検索の会話をガイドする。
論文 参考訳(メタデータ) (2024-03-22T08:10:32Z) - Towards Self-Contained Answers: Entity-Based Answer Rewriting in
Conversational Search [19.147174273221452]
本稿では,利用者が外部サービスや情報源を使わずに理解できるように,CISで回答を書き換える方法について検討する。
最初のコントリビューションとして、正当性のためのエンティティに注釈付けされた会話のデータセットを作成しました。
第2のコントリビューションとして,CIS全体のユーザエクスペリエンス向上を目的とした2つの回答書き直し戦略を提案する。
論文 参考訳(メタデータ) (2024-03-04T05:52:41Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Social Commonsense-Guided Search Query Generation for Open-Domain
Knowledge-Powered Conversations [66.16863141262506]
本稿では,ソーシャルコモンセンスによってガイドされたインターネット検索クエリ生成に焦点を当てた新しいアプローチを提案する。
提案フレームワークは,トピックトラッキング,コモンセンス応答生成,命令駆動クエリ生成を統合することで,受動的ユーザインタラクションに対処する。
論文 参考訳(メタデータ) (2023-10-22T16:14:56Z) - Multi-Grained Knowledge Retrieval for End-to-End Task-Oriented Dialog [42.088274728084265]
外部データベースから適切なドメイン知識を取得することは、エンドツーエンドのタスク指向の対話システムの中心にある。
既存のシステムの多くは、知識検索と応答生成を融合させ、参照応答からの直接監督でそれらを最適化している。
応答生成から知識検索を分離し,多粒度知識検索システムを提案する。
論文 参考訳(メタデータ) (2023-05-17T12:12:46Z) - Guided Transformer: Leveraging Multiple External Sources for
Representation Learning in Conversational Search [36.64582291809485]
あいまいなクエリやフェースドクエリに対する質問を明確にすることは,様々な情報検索システムにおいて有用な手法として認識されている。
本稿では,トランスフォーマーネットワークが学習した表現を,外部情報ソースからの新たなアテンション機構を用いて強化する。
実験では,検索の明確化のための公開データセットを用いて,競合するベースラインと比較して大きな改善点を示した。
論文 参考訳(メタデータ) (2020-06-13T03:24:53Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z) - IART: Intent-aware Response Ranking with Transformers in
Information-seeking Conversation Systems [80.0781718687327]
我々は、情報探索会話におけるユーザ意図パターンを分析し、意図認識型ニューラルレスポンスランキングモデル「IART」を提案する。
IARTは、ユーザ意図モデリングと言語表現学習とTransformerアーキテクチャの統合の上に構築されている。
論文 参考訳(メタデータ) (2020-02-03T05:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。