論文の概要: Backtracing: Retrieving the Cause of the Query
- arxiv url: http://arxiv.org/abs/2403.03956v1
- Date: Wed, 6 Mar 2024 18:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 13:54:42.684400
- Title: Backtracing: Retrieving the Cause of the Query
- Title(参考訳): バックトレーシング:クエリーの原因を検索する
- Authors: Rose E. Wang, Pawan Wirawarn, Omar Khattab, Noah Goodman, Dorottya
Demszky
- Abstract要約: 本稿では,ユーザクエリを最も引き起こす可能性のあるテキストセグメントをシステムで検索する,バックトラシングのタスクを紹介する。
人気情報検索手法と言語モデリング手法のゼロショット性能を評価する。
以上の結果から,後方追跡には改善の余地があり,新たな検索手法が必要であることが示唆された。
- 参考スコア(独自算出の注目度): 7.715089044732362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many online content portals allow users to ask questions to supplement their
understanding (e.g., of lectures). While information retrieval (IR) systems may
provide answers for such user queries, they do not directly assist content
creators -- such as lecturers who want to improve their content -- identify
segments that _caused_ a user to ask those questions. We introduce the task of
backtracing, in which systems retrieve the text segment that most likely caused
a user query. We formalize three real-world domains for which backtracing is
important in improving content delivery and communication: understanding the
cause of (a) student confusion in the Lecture domain, (b) reader curiosity in
the News Article domain, and (c) user emotion in the Conversation domain. We
evaluate the zero-shot performance of popular information retrieval methods and
language modeling methods, including bi-encoder, re-ranking and
likelihood-based methods and ChatGPT. While traditional IR systems retrieve
semantically relevant information (e.g., details on "projection matrices" for a
query "does projecting multiple times still lead to the same point?"), they
often miss the causally relevant context (e.g., the lecturer states "projecting
twice gets me the same answer as one projection"). Our results show that there
is room for improvement on backtracing and it requires new retrieval
approaches. We hope our benchmark serves to improve future retrieval systems
for backtracing, spawning systems that refine content generation and identify
linguistic triggers influencing user queries. Our code and data are
open-sourced: https://github.com/rosewang2008/backtracing.
- Abstract(参考訳): 多くのオンラインコンテンツポータルでは、ユーザーは自分の理解を補うために質問することができる(講義など)。
情報検索(ir)システムは、そのようなユーザークエリに対する回答を提供するが、コンテンツ作成者(例えば、コンテンツを改善したい講師)が、ユーザーが質問をするために_ caused_するセグメントを識別するのを直接支援しない。
本稿では,ユーザクエリの原因となるであろうテキストセグメントを検索する,バックトレースのタスクを紹介する。
我々は、コンテンツ配信とコミュニケーションを改善する上でバックトラッキングが重要である3つの現実世界ドメインを定式化する。
(a)講義領域における学生の混乱
(b)ニュース記事領域の読者好奇心
(c)会話領域におけるユーザの感情
そこで本研究では,bi-encoder,re-grade,plath-based method,chatgptなど,一般的な情報検索手法と言語モデリング手法のゼロショット性能を評価する。
従来のirシステムは意味的に関連のある情報を検索する(例えば、"プロジェクション行列"の詳細は"複数回投影しても同じポイントになってしまうか?")が、しばしば因果関係のコンテキストを見逃す(例えば、講師は"プロジェクションは2回同じ回答を1つのプロジェクションと同じ回答を得る")。
以上の結果から,バックトレッキングの改善の余地があり,新たな検索手法が求められている。
当社のベンチマークは,ユーザクエリに影響を与えるコンテンツ生成と言語トリガの識別を改良した,バックトレッキングのための将来の検索システムの改善に役立てることを願っている。
コードとデータはオープンソースです。 https://github.com/rosewang2008/backtracing。
関連論文リスト
- Towards Self-Contained Answers: Entity-Based Answer Rewriting in
Conversational Search [19.147174273221452]
本稿では,利用者が外部サービスや情報源を使わずに理解できるように,CISで回答を書き換える方法について検討する。
最初のコントリビューションとして、正当性のためのエンティティに注釈付けされた会話のデータセットを作成しました。
第2のコントリビューションとして,CIS全体のユーザエクスペリエンス向上を目的とした2つの回答書き直し戦略を提案する。
論文 参考訳(メタデータ) (2024-03-04T05:52:41Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Social Commonsense-Guided Search Query Generation for Open-Domain
Knowledge-Powered Conversations [66.16863141262506]
本稿では,ソーシャルコモンセンスによってガイドされたインターネット検索クエリ生成に焦点を当てた新しいアプローチを提案する。
提案フレームワークは,トピックトラッキング,コモンセンス応答生成,命令駆動クエリ生成を統合することで,受動的ユーザインタラクションに対処する。
論文 参考訳(メタデータ) (2023-10-22T16:14:56Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - Query Rewriting for Retrieval-Augmented Large Language Models [139.242907155883]
大規模言語モデル(LLM)は、検索対象のパイプラインで強力なブラックボックスリーダーを動作させる。
この作業では、検索拡張LDMに対する以前の検索テーマ読み込みの代わりに、新しいフレームワークであるRewrite-Retrieve-Readを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:27:50Z) - Multi-Grained Knowledge Retrieval for End-to-End Task-Oriented Dialog [42.088274728084265]
外部データベースから適切なドメイン知識を取得することは、エンドツーエンドのタスク指向の対話システムの中心にある。
既存のシステムの多くは、知識検索と応答生成を融合させ、参照応答からの直接監督でそれらを最適化している。
応答生成から知識検索を分離し,多粒度知識検索システムを提案する。
論文 参考訳(メタデータ) (2023-05-17T12:12:46Z) - Learning to Retrieve Engaging Follow-Up Queries [12.380514998172199]
ユーザが持つ可能性のある次の質問を予測するための検索ベースシステムと関連するデータセットを提案する。
このようなシステムは,ユーザの知識探索を積極的に支援することで,より活発な対話を実現する。
論文 参考訳(メタデータ) (2023-02-21T20:26:23Z) - Multi-stage Clarification in Conversational AI: The case of
Question-Answering Dialogue Systems [0.27998963147546135]
対話型質問応答や会話型検索など,様々な情報検索タスクにおいて,明確化の解決が重要な役割を担っている。
そこで本稿では,質問応答対話システムのコンテキストにおいて,質問の明確化とクエリ選択を促すための多段階的明確化機構を提案する。
提案手法は,ユーザエクスペリエンス全体の改善と,競合するベースラインを2つのデータセットで比較する。
論文 参考訳(メタデータ) (2021-10-28T15:45:44Z) - Guided Transformer: Leveraging Multiple External Sources for
Representation Learning in Conversational Search [36.64582291809485]
あいまいなクエリやフェースドクエリに対する質問を明確にすることは,様々な情報検索システムにおいて有用な手法として認識されている。
本稿では,トランスフォーマーネットワークが学習した表現を,外部情報ソースからの新たなアテンション機構を用いて強化する。
実験では,検索の明確化のための公開データセットを用いて,競合するベースラインと比較して大きな改善点を示した。
論文 参考訳(メタデータ) (2020-06-13T03:24:53Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z) - IART: Intent-aware Response Ranking with Transformers in
Information-seeking Conversation Systems [80.0781718687327]
我々は、情報探索会話におけるユーザ意図パターンを分析し、意図認識型ニューラルレスポンスランキングモデル「IART」を提案する。
IARTは、ユーザ意図モデリングと言語表現学習とTransformerアーキテクチャの統合の上に構築されている。
論文 参考訳(メタデータ) (2020-02-03T05:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。