論文の概要: Automated Query Reformulation for Efficient Search based on Query Logs
From Stack Overflow
- arxiv url: http://arxiv.org/abs/2102.00826v1
- Date: Mon, 1 Feb 2021 13:31:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-03 16:29:42.158428
- Title: Automated Query Reformulation for Efficient Search based on Query Logs
From Stack Overflow
- Title(参考訳): スタックオーバーフローからのクエリログに基づく効率的な検索のための自動クエリリフォーマレーション
- Authors: Kaibo Cao (1), Chunyang Chen (2), Sebastian Baltes (3), Christoph
Treude (3), Xiang Chen (4) ((1) Software Institute, Nanjing University,
China, (2) Faculty of Information Technology, Monash University, Australia,
(3) School of Computer Science, University of Adelaide, Australia, (4) School
of Information Science and Technology, Nantong University, China)
- Abstract要約: 本稿では,ディープラーニングに基づくソフトウェア固有のクエリ再構成手法を提案する。
我々は,クエリとそれに対応するクエリを含む大規模クエリ再構成コーパスを構築した。
提案手法では,ユーザが元のクエリを入力した場合に,候補変更クエリを自動的に生成するトランスフォーマーモデルを訓練する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As a popular Q&A site for programming, Stack Overflow is a treasure for
developers. However, the amount of questions and answers on Stack Overflow make
it difficult for developers to efficiently locate the information they are
looking for. There are two gaps leading to poor search results: the gap between
the user's intention and the textual query, and the semantic gap between the
query and the post content. Therefore, developers have to constantly
reformulate their queries by correcting misspelled words, adding limitations to
certain programming languages or platforms, etc. As query reformulation is
tedious for developers, especially for novices, we propose an automated
software-specific query reformulation approach based on deep learning. With
query logs provided by Stack Overflow, we construct a large-scale query
reformulation corpus, including the original queries and corresponding
reformulated ones. Our approach trains a Transformer model that can
automatically generate candidate reformulated queries when given the user's
original query. The evaluation results show that our approach outperforms five
state-of-the-art baselines, and achieves a 5.6% to 33.5% boost in terms of
$\mathit{ExactMatch}$ and a 4.8% to 14.4% boost in terms of $\mathit{GLEU}$.
- Abstract(参考訳): プログラミングのq&aサイトとして人気があるstack overflowは、開発者にとって宝物だ。
しかしながら、stack overflowの質問や回答の量によって、開発者が探している情報を効率的に見つけることが難しくなる。
検索結果の貧弱化につながる2つのギャップは、ユーザの意図とテキストクエリの間のギャップ、クエリとポストコンテンツの間の意味的ギャップである。
そのため開発者は、ミススペルされた単語を訂正し、特定のプログラミング言語やプラットフォームに制限を加えることで、クエリを常に修正する必要がある。
クエリの改定は、特に初心者にとっては面倒であるので、ディープラーニングに基づく自動ソフトウェア固有のクエリの改定手法を提案する。
Stack Overflowが提供するクエリログを用いて,クエリとそれに対応するクエリを含む大規模クエリ再構成コーパスを構築する。
提案手法では,ユーザが元のクエリを入力した場合に,候補変更クエリを自動的に生成するトランスフォーマーモデルを訓練する。
評価の結果、我々のアプローチは5つの最先端ベースラインを上回り、$\mathit{exactmatch}$で5.6%から33.5%、$\mathit{gleu}$で4.8%から14.4%向上した。
関連論文リスト
- Adaptive Query Rewriting: Aligning Rewriters through Marginal Probability of Conversational Answers [66.55612528039894]
AdaQRは、シードデータセットからの限定的な書き直しアノテーションと完全にパスラベルのないクエリ書き換えモデルをトレーニングするフレームワークである。
会話クエリに条件付き回答の確率を用いて,これらの候補に対する検索者の嗜好を評価する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T16:09:05Z) - CLARINET: Augmenting Language Models to Ask Clarification Questions for Retrieval [52.134133938779776]
CLARINETは,回答が正しい候補の確実性を最大化する質問を選択することで,情報的明確化を問うシステムである。
提案手法は,大規模言語モデル(LLM)を検索分布の条件付きで拡張し,各ターンで真の候補のランクを最大化する問題を生成する。
論文 参考訳(メタデータ) (2024-04-28T18:21:31Z) - Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。
ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。
本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文 参考訳(メタデータ) (2023-07-08T04:32:17Z) - Self-Supervised Query Reformulation for Code Search [6.415583252034772]
本稿では,並列クエリコーパスに依存しない自己教師型クエリ再構成手法であるSSQRを提案する。
事前訓練されたモデルにインスパイアされたSSQRは、クエリ再構成をマスキング言語モデリングタスクとして扱う。
論文 参考訳(メタデータ) (2023-07-01T08:17:23Z) - ConvGQR: Generative Query Reformulation for Conversational Search [37.54018632257896]
ConvGQRは、生成事前訓練された言語モデルに基づいて会話クエリを再構成する新しいフレームワークである。
本稿では,クエリ再構成と検索の両方を最適化する知識注入機構を提案する。
論文 参考訳(メタデータ) (2023-05-25T01:45:06Z) - Answer ranking in Community Question Answering: a deep learning approach [0.0]
本研究は, 地域質問回答の回答ランキングを, 深層学習のアプローチで進めることによって, 技術の現状を推し進めるものである。
Stack OverflowのWebサイトにポストされた質問と回答の大規模なデータセットを作成しました。
我々は,高密度埋め込みとLSTMネットワークの自然言語処理機能を利用して,受理された応答属性の予測を行った。
論文 参考訳(メタデータ) (2022-10-16T18:47:41Z) - Query Expansion and Entity Weighting for Query Reformulation Retrieval
in Voice Assistant Systems [6.590172620606211]
Alexa、Siri、Google Assistantといった音声アシスタントは世界中で人気が高まっている。
言語的変化, 音声パターンの変動, 環境音響条件, その他の要因は, ユーザのクエリを誤解釈するアシスタントと相関することが多い。
Retrieval based query reformulation (QR) システムは、これらの誤解釈されたユーザクエリを再構成するために広く利用されている。
論文 参考訳(メタデータ) (2022-02-22T23:03:29Z) - A Systematic Review of Automated Query Reformulations in Source Code
Search [12.234169944475537]
我々は,2,970の候補研究から,問合せの改定に関する70の研究を選定した。
本稿では,検索クエリの改定における研究状況を改善するためのベストプラクティスと今後の機会について論じる。
論文 参考訳(メタデータ) (2021-08-22T05:47:10Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Brain-inspired Search Engine Assistant based on Knowledge Graph [53.89429854626489]
developerbotは脳にインスパイアされた、knowledge graphの名前の検索エンジンアシスタントだ。
複雑なマルチ制約クエリを複数の順序制約に分割することで、多層クエリグラフを構築する。
次に、制約推論プロセスを認知科学の拡散活性化モデルに触発されたサブグラフ探索プロセスとしてモデル化する。
論文 参考訳(メタデータ) (2020-12-25T06:36:11Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。