論文の概要: Synthesizing Conjunctive Queries for Code Search
- arxiv url: http://arxiv.org/abs/2305.04316v2
- Date: Thu, 11 May 2023 15:02:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 12:05:42.634134
- Title: Synthesizing Conjunctive Queries for Code Search
- Title(参考訳): コード検索のための連結クエリの合成
- Authors: Chengpeng Wang, Peisen Yao, Wensheng Tang, Gang Fan, and Charles Zhang
- Abstract要約: Squidは、ターゲットパターンでコードを探すための新しい結合型クエリアルゴリズムである。
Squidは全てのタスクの接続クエリをうまく合成し、平均で2.56秒しかかからない。
- 参考スコア(独自算出の注目度): 9.146394499214672
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents Squid, a new conjunctive query synthesis algorithm for
searching code with target patterns. Given positive and negative examples along
with a natural language description, Squid analyzes the relations derived from
the examples by a Datalog-based program analyzer and synthesizes a conjunctive
query expressing the search intent. The synthesized query can be further used
to search for desired grammatical constructs in the editor. To achieve high
efficiency, we prune the huge search space by removing unnecessary relations
and enumerating query candidates via refinement. We also introduce two
quantitative metrics for query prioritization to select the queries from
multiple candidates, yielding desired queries for code search. We have
evaluated Squid on over thirty code search tasks. It is shown that Squid
successfully synthesizes the conjunctive queries for all the tasks, taking only
2.56 seconds on average.
- Abstract(参考訳): 本稿では,対象パターンを探索する新しい結合型クエリ合成アルゴリズムであるSquidを提案する。
自然言語記述と負の例が与えられたsquidは、データログベースのプログラムアナライザによって例から派生した関係を分析し、検索意図を表す結合クエリを合成する。
合成されたクエリは、エディタで所望の文法構造を探すためにさらに使用できる。
高効率を実現するため,不必要な関係を取り除き,クエリ候補を列挙することで,膨大な検索空間を創出する。
また、クエリ優先順位付けのための2つの定量的メトリクスを導入し、複数の候補からクエリを選択し、コード検索に望ましいクエリを得る。
我々は30以上のコード検索タスクでSquidを評価した。
Squidは全てのタスクの接続クエリをうまく合成し、平均2.56秒で処理できることが示されている。
関連論文リスト
- Aligning Query Representation with Rewritten Query and Relevance Judgments in Conversational Search [32.35446999027349]
我々は、より優れたクエリ表現モデルをトレーニングするために、リライトされたクエリと会話検索データの関連判断の両方を活用する。
提案したモデル --Query Representation Alignment Conversational Retriever(QRACDR)は、8つのデータセットでテストされる。
論文 参考訳(メタデータ) (2024-07-29T17:14:36Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z) - CoSQA+: Enhancing Code Search Dataset with Matching Code [27.10957318333608]
CoSQA+は、複数の適切なコードで高品質なクエリをペアリングする。
CoSQA+はCoSQAよりも優れた品質を示している。
我々は1対Nのコード検索性能を評価するための新しい指標を提案する。
論文 参考訳(メタデータ) (2024-06-17T14:34:14Z) - Decoding a Neural Retriever's Latent Space for Query Suggestion [28.410064376447718]
本稿では,有意なクエリをその潜在表現から復号することが可能であること,また,潜在空間の正しい方向に移動すると,関連する段落を検索するクエリを復号することができることを示す。
クエリデコーダを用いて、MSMarcoのクエリ再構成の大規模な合成データセットを生成する。
このデータに基づいて、クエリー提案の適用のために擬似関連フィードバック(PRF)T5モデルを訓練する。
論文 参考訳(メタデータ) (2022-10-21T16:19:31Z) - Query-Response Interactions by Multi-tasks in Semantic Search for
Chatbot Candidate Retrieval [12.615150401073711]
本稿では,マルチタスクに基づくセマンティックサーチニューラルネットワーク(MSSNN)を提案する。
この方法はSeq2Seqモデリングタスクを使用して、優れたクエリエンコーダを学習し、応答埋め込みを構築するために単語予測タスクを実行し、最終的に単純なマッチングモデルを実行し、ドット積スコアラを形成する。
論文 参考訳(メタデータ) (2022-08-23T15:07:35Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - How to Query An Oracle? Efficient Strategies to Label Data [59.89900843097016]
機械学習におけるデータセットのラベル付けに専門家の託宣を照会する際の基本的な問題について考察する。
本稿では,サンプルをラベル付けするために,ラウンド・バイ・ラウンドでランダム化されたバッチアルゴリズムを提案し,クエリレートが$O(fracNk2)$であることを示す。
さらに,適応型グリージークエリ方式を提案し,三重項クエリを用いたサンプルあたり平均$approx 0.2N$クエリを実現する。
論文 参考訳(メタデータ) (2021-10-05T20:15:35Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。