論文の概要: Larch: Learned Query Optimization for Semantic Predicates
- arxiv url: http://arxiv.org/abs/2606.07923v1
- Date: Sat, 06 Jun 2026 01:16:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.536385
- Title: Larch: Learned Query Optimization for Semantic Predicates
- Title(参考訳): Larch: セマンティックな述語のためのクエリ最適化を学ぶ
- Authors: Fuheng Zhao, Pawel Liskowski, Zihan Li, Benjamin Han, Puxuan Yu, Varich Boonsanong, Dimitris Tsirogiannis, Anupam Datta,
- Abstract要約: 本稿では,AISQLクエリにおけるセマンティックフィルタの実行を最適化するフレームワークであるLarchを紹介する。
2つの重要な観測に基づいて、Larch-A2CとLarch-Selの2つの変種を示す。
我々の結果は、Larchがさまざまなワークロードで堅牢であることを示し、PalimpzestやQuestと比較してトークン全体のコストオーバーヘッドを3倍19倍削減しています。
- 参考スコア(独自算出の注目度): 16.10994668093723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advent of Large Language Models (LLMs), many database systems introduced semantic operators that enabled analytical queries over unstructured data (e.g. text, images, videos). Semantic operators typically incur high inference costs and latencies making semantic (AI) SQL queries challenging to apply on large scale datasets. At the same time, their semantic nature leads database engines to treat them as black boxes, making AISQL queries difficult to optimize. In this paper, we introduce Larch, a framework for optimizing the execution of semantic filters in AI SQL queries. Larch was inspired by two key observations: i) the high latency of semantic operators leaves significant room for computationally-heavy runtime optimization techniques, ii) unstructured data are typically accompanied by semantic information in the form of embeddings allowing for efficient semantic comparisons between AI_FILTER prompts and data values. Based on these two key observations, we present two Larch variants: Larch-A2C and Larch-Sel. Larch-A2C encodes arbitrary semantic filters expression tree using an embedding-augmented Gated Graph Neural Network and formulates the filter evaluation order as a Markov decision process. In contrast, Larch-Sel leverages a supervised learning model to predict filter selectivities, subsequently applying dynamic programming to find a near-optimal evaluation order for each input row. Evaluated across diverse real-world datasets and comprehensive synthetic workloads, both Larch variants always outperform existing semantic filter optimization techniques in terms of token usage. Our results demonstrate that Larch is robust across diverse workloads, reducing total token cost overhead by 3x-19x compared to Palimpzest and Quest.
- Abstract(参考訳): LLM(Large Language Models)の出現に伴い、多くのデータベースシステムは、構造化されていないデータ(テキスト、画像、ビデオなど)に対する分析クエリを可能にするセマンティック演算子を導入した。
セマンティック演算子は一般的に高い推論コストと遅延を発生させ、セマンティック(AI)SQLクエリを大規模データセットに適用することは困難である。
同時に、セマンティックな性質によってデータベースエンジンはブラックボックスとして扱うことができ、AISQLクエリの最適化が困難になる。
本稿では,AISQLクエリにおけるセマンティックフィルタの実行を最適化するフレームワークであるLarchを紹介する。
ラカルトは2つの重要な観察に触発された。
一 セマンティック演算子の高レイテンシは、計算量の多い実行時最適化手法に十分な余地を残している。
i)非構造化データは、一般的に、AI_FILTERプロンプトとデータ値の効率的なセマンティック比較を可能にする埋め込み形式のセマンティック情報を伴う。
これら2つの重要な観測に基づいて、Larch-A2C と Larch-Sel の2つの変種を示す。
Larch-A2Cは、埋め込み強化グラフニューラルネットワークを用いて任意のセマンティックフィルタ表現ツリーを符号化し、フィルタ評価順序をマルコフ決定プロセスとして定式化する。
対照的に、Larch-Selは教師付き学習モデルを利用してフィルタの選択性を予測し、その後動的プログラミングを適用して各入力行に対してほぼ最適評価順序を求める。
さまざまな現実世界のデータセットと包括的な合成ワークロードで評価され、どちらもLarchの変種であり、トークン使用率の観点から既存のセマンティックフィルタの最適化テクニックを常に上回っている。
我々の結果は、Larchがさまざまなワークロードで堅牢であることを示し、PalimpzestやQuestと比較してトークン全体のコストオーバーヘッドを3倍19倍削減しています。
関連論文リスト
- ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering [55.55968342644846]
テーブルのシリアライゼーションは、複雑なテーブル質問応答において、LLM(Large Language Models)にとって重要なボトルネックであり続けている。
既存のシリアライゼーションメソッドは明示的な階層をキャプチャできず、スキーマの柔軟性が欠如している。
本稿では,AdaSTRとDuTRの2つの主要モジュールを含むASTRA(Adaptive Semantic Tree Reasoning Architecture)を提案する。
複雑なテーブルベンチマーク実験により,本手法がSOTA(State-of-the-art)性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-10T06:09:41Z) - Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm [17.52767415071768]
Clustering-Sampling-Voting(CSV)は、エラー保証を提供しながら、呼び出しをサブ線形の複雑さに還元するフレームワークである。
CSVはセマンティッククラスタをセマンティッククラスタに組み込み、評価のために小さなサブセットをサンプリングし、2つの投票戦略を通じてクラスタレベルのラベルを推論する。
論文 参考訳(メタデータ) (2026-03-05T04:37:15Z) - Filtered Approximate Nearest Neighbor Search in Vector Databases: System Design and Performance Analysis [0.5249805590164902]
Filtered Approximate Nearest Neighbor Search (FANNS) は、セマンティック検索とメタデータの制約を組み合わせるために用いられる。
本研究では,フィルタリング戦略の分類を体系化し,それらのベクトルへの統合性を評価する。
実験の結果,エンジン内のアルゴリズム適応がしばしば生のインデックス性能を上回ることがわかった。
論文 参考訳(メタデータ) (2026-02-11T23:40:26Z) - LLM-based Semantic Search for Conversational Queries in E-commerce [1.3645712130536118]
会話クエリからユーザ意図をキャプチャするLLMベースのセマンティック検索フレームワークを提案する。
本フレームワークは,実世界のデータセットのベースラインアプローチと比較して,様々な設定において高い精度とリコールを実現する。
論文 参考訳(メタデータ) (2026-01-23T06:35:28Z) - Automatic Prompt Optimization for Knowledge Graph Construction: Insights from an Empirical Study [8.482898222291206]
テキストからのトリプル(オブジェクト-リレーショナルオブジェクト)抽出は、KG構築の基本的な構成要素である。
NLPタスク(例えば自律生成)における最近の作業では、この課題に対処するために自動的なプロンプト最適化/エンジニアリングを使用している。
我々は、(a)プロンプト戦略、(b)プロンプト最適化とタスク実行に使用されるLLM、(c)スキーマにおける標準関係の数、(d)入力テキストの長さと多様性、(e)プロンプト最適化に使用されるメトリック、および(f)トレーニングとテストに使用されるデータセットを変更することで異なる設定を評価する。
論文 参考訳(メタデータ) (2025-06-24T16:38:49Z) - Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。