論文の概要: Cortex AISQL: A Production SQL Engine for Unstructured Data
- arxiv url: http://arxiv.org/abs/2511.07663v2
- Date: Wed, 19 Nov 2025 13:22:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 13:41:21.05239
- Title: Cortex AISQL: A Production SQL Engine for Unstructured Data
- Title(参考訳): Cortex AISQL: 構造化されていないデータのためのプロダクションSQLエンジン
- Authors: Paweł Liskowski, Benjamin Han, Paritosh Aggarwal, Bowei Chen, Boxin Jiang, Nitish Jindal, Zihan Li, Aaron Lin, Kyle Schmaus, Jay Tayade, Weicheng Zhao, Anupam Datta, Nathan Wiegand, Dimitris Tsirogiannis,
- Abstract要約: AIはSnowflakeで本番環境にデプロイされ、分析、検索、コンテンツ理解にまたがるさまざまな顧客のワークロードに電力を供給する。
本稿では、AI対応クエリ最適化が、AI推論コストを第一級最適化目標として扱う方法を示す。
第二に、適応モデルカスケードは、高速プロキシモデルを通じてほとんどの行をルーティングすることで、推論コストを削減する。
第三に、セマンティックなジョインクエリの書き換えは、ジョイン操作の二次的な時間の複雑さを線形に下げる。
- 参考スコア(独自算出の注目度): 11.480345698642006
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Snowflake's Cortex AISQL is a production SQL engine that integrates native semantic operations directly into SQL. This integration allows users to write declarative queries that combine relational operations with semantic reasoning, enabling them to query both structured and unstructured data effortlessly. However, making semantic operations efficient at production scale poses fundamental challenges. Semantic operations are more expensive than traditional SQL operations, possess distinct latency and throughput characteristics, and their cost and selectivity are unknown during query compilation. Furthermore, existing query engines are not designed to optimize semantic operations. The AISQL query execution engine addresses these challenges through three novel techniques informed by production deployment data from Snowflake customers. First, AI-aware query optimization treats AI inference cost as a first-class optimization objective, reasoning about large language model (LLM) cost directly during query planning to achieve 2-8$\times$ speedups. Second, adaptive model cascades reduce inference costs by routing most rows through a fast proxy model while escalating uncertain cases to a powerful oracle model, achieving 2-6$\times$ speedups while maintaining 90-95% of oracle model quality. Third, semantic join query rewriting lowers the quadratic time complexity of join operations to linear through reformulation as multi-label classification tasks, achieving 15-70$\times$ speedups with often improved prediction quality. AISQL is deployed in production at Snowflake, where it powers diverse customer workloads across analytics, search, and content understanding.
- Abstract(参考訳): SnowflakeのCortex AISQLは、SQLに直接ネイティブセマンティック操作を統合する、プロダクションSQLエンジンである。
この統合により、ユーザーは、リレーショナル操作とセマンティック推論を組み合わせた宣言型クエリを書くことができ、構造化データと非構造化データの両方を懸命にクエリすることができる。
しかし、本番環境でのセマンティック操作を効率化することは、根本的な課題となる。
セマンティック操作は従来のSQL操作よりも高価で、レイテンシとスループットの特徴が異なる。
さらに、既存のクエリエンジンはセマンティック操作を最適化するために設計されていない。
AISQLクエリ実行エンジンは、Snowflakeユーザの運用デプロイメントデータから通知される3つの新しいテクニックを通じて、これらの課題に対処する。
まず、AI対応クエリ最適化は、AI推論コストを第一級最適化目標として扱い、2-8$\times$スピードアップを達成するためのクエリ計画中に、大きな言語モデル(LLM)コストを直接考慮する。
第二に、適応モデルカスケードは、高速なプロキシモデルを通してほとんどの行をルーティングし、不確実なケースを強力なオラクルモデルにエスカレートし、90-95%のオラクルモデル品質を維持しながら2-6$\times$スピードアップを達成することで、推論コストを削減する。
第3に、セマンティックなジョインクエリの書き換えにより、ジョイン操作の二次的な時間的複雑さを減らし、複数ラベルの分類タスクとして再編成し、15-70$\times$のスピードアップを実現し、予測品質が向上する。
AISQLはSnowflakeで本番環境にデプロイされ、分析、検索、コンテンツ理解にまたがるさまざまな顧客のワークロードに電力を供給する。
関連論文リスト
- SQLBarber: A System Leveraging Large Language Models to Generate Customized and Realistic SQL Workloads [18.665946271507117]
sqlBarberはLarge Language Models(LLM)に基づくシステムで、カスタマイズされたリアルなsqlワークロードを生成する。
クエリ生成時間を1~3桁に短縮し、ターゲットのコスト分布との整合性を大幅に改善する。
我々は、SnowflakeとAmazon Redshiftの実際の統計に基づいて、さまざまな難易度とクエリコスト分布の10のベンチマークを構築し、オープンソース化する。
論文 参考訳(メタデータ) (2025-07-08T17:20:34Z) - HI-SQL: Optimizing Text-to-SQL Systems through Dynamic Hint Integration [1.3927943269211591]
テキスト・ツー・ジェネレーションは自然言語とデータベースのギャップを埋め、ユーザーは専門知識を必要とせずにデータをクエリできる。
履歴クエリログを利用した新しいヒント生成機構を組み込んだパイプラインHI-theを提案する。
先行クエリを解析することにより、マルチテーブルおよびネストされた操作の複雑さを扱うことに焦点を当てたコンテキストヒントを生成する。
提案手法は,LCM生成クエリのクエリ精度を大幅に向上し,呼び出しやレイテンシの面で効率性を確保した。
論文 参考訳(メタデータ) (2025-06-11T12:07:55Z) - A Learned Cost Model-based Cross-engine Optimizer for SQL Workloads [3.7960472831772765]
Lakehouseシステムでは、同じデータを複数の実行エンジンでクエリすることができる。
学習コストモデルを用いて,多様なクエリに対するエンジン選択を自動化するクロスエンジンを提案する。
コスト推定にクエリ最適化された論理的計画を用いることで、最適化されていない計画を入力として使用することで、平均Qエラーを12.6%も削減できることを示す。
論文 参考訳(メタデータ) (2025-06-03T12:32:56Z) - Weaver: Interweaving SQL and LLM for Table Reasoning [62.55797244714265]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットで、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - Query and Conquer: Execution-Guided SQL Generation [2.07180164747172]
本稿では,テキスト・ツー・タスクの精度を大幅に向上させる複雑な出力を生成する新しい手法を提案する。
提案手法は,複数の候補から最もセマンティックに一貫性のあるクエリを選択するために,実行結果を活用する。
論文 参考訳(メタデータ) (2025-03-31T17:43:36Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。