論文の概要: SQLFlow: A Bridge between SQL and Machine Learning
- arxiv url: http://arxiv.org/abs/2001.06846v1
- Date: Sun, 19 Jan 2020 15:19:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 12:44:59.843079
- Title: SQLFlow: A Bridge between SQL and Machine Learning
- Title(参考訳): SQLFlow:SQLと機械学習の橋渡し
- Authors: Yi Wang, Yang Yang, Weiguo Zhu, Yi Wu, Xu Yan, Yongfeng Liu, Yu Wang,
Liang Xie, Ziyao Gao, Wenjing Zhu, Xiang Chen, Wei Yan, Mingjie Tang, Yuan
Tang
- Abstract要約: 典型的なビジネスインテリジェンスシステムには、多くのオンラインマイクロサービスとオフラインジョブが含まれる。
このような効率的なインスクフローを開発するためのqlFlowについて説明する。
この拡張は,教師付き学習と教師なし学習,深層ネットワークとツリーモデル,学習と予測に加えて視覚モデルの説明,データ処理と特徴抽出をMLに加えることで実現されている。
- 参考スコア(独自算出の注目度): 21.589684708148592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial AI systems are mostly end-to-end machine learning (ML) workflows.
A typical recommendation or business intelligence system includes many online
micro-services and offline jobs. We describe SQLFlow for developing such
workflows efficiently in SQL. SQL enables developers to write short programs
focusing on the purpose (what) and ignoring the procedure (how). Previous
database systems extended their SQL dialect to support ML. SQLFlow
(https://sqlflow.org/sqlflow ) takes another strategy to work as a bridge over
various database systems, including MySQL, Apache Hive, and Alibaba MaxCompute,
and ML engines like TensorFlow, XGBoost, and scikit-learn. We extended SQL
syntax carefully to make the extension working with various SQL dialects. We
implement the extension by inventing a collaborative parsing algorithm. SQLFlow
is efficient and expressive to a wide variety of ML techniques -- supervised
and unsupervised learning; deep networks and tree models; visual model
explanation in addition to training and prediction; data processing and feature
extraction in addition to ML. SQLFlow compiles a SQL program into a
Kubernetes-native workflow for fault-tolerable execution and on-cloud
deployment. Current industrial users include Ant Financial, DiDi, and Alibaba
Group.
- Abstract(参考訳): 産業用AIシステムは、主にエンドツーエンドの機械学習(ML)ワークフローである。
典型的なレコメンデーションまたはビジネスインテリジェンスシステムには、多くのオンラインマイクロサービスとオフラインジョブが含まれる。
このようなワークフローをSQLで効率的に開発するためのSQLFlowについて説明する。
SQLを使うことで、開発者は目的(何)と手順(方法)を無視した短いプログラムを書くことができる。
以前のデータベースシステムは、MLをサポートするためにSQL方言を拡張した。
SQLFlow(https://sqlflow.org/sqlflow )は、MySQL、Apache Hive、Alibaba MaxCompute、TensorFlow、XGBoost、Scikit-learnといったMLエンジンなど、さまざまなデータベースシステムのブリッジとして機能する別の戦略を採用している。
SQLの構文を慎重に拡張して、さまざまなSQL方言で拡張を動作させました。
我々は,協調構文解析アルゴリズムを考案して拡張を実装した。
SQLFlowは、教師付き、教師なしの学習、深いネットワークとツリーモデル、トレーニングと予測に加えて視覚モデルの説明、MLに加えてデータ処理と機能抽出など、さまざまなMLテクニックに対して効率的で表現力がある。
SQLFlowは、フォールトトレラントな実行とオンプレミスデプロイメントのために、SQLプログラムをKubernetesネイティブワークフローにコンパイルする。
現在の産業ユーザはAnt Financial、DiDi、Alibaba Groupなどだ。
関連論文リスト
- Blar-SQL: Faster, Stronger, Smaller NL2SQL [0.0]
データベースの理解とクエリ生成において,タスクの分解が大規模言語モデル(LLM)に大きな利益をもたらすことを示す。
我々は、より多くの情報を限られたコンテキストに適合させるために、スキーマをチャンクに分割する新しいフレームワークを提案する。
その結果,GPT-4はGPT-4の135倍,90倍,100倍以上の速さであった。
論文 参考訳(メタデータ) (2024-01-04T16:50:52Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [48.523327752786585]
我々は,新しいテキスト・ツー・データベース・ベースのマルチエージェント・コラボレーティブ・フレームワークであるMACを紹介する。
本フレームワークは,テキスト・ツー・ジェネレーションのためのコア・デコンポーザ・エージェントと,数発のチェーン・オブ・シークレット・推論を備える。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、GPT-4のようにCode 7Bを活用して、オープンソースの命令フォローモデルsql-Llamaを微調整する。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - ACT-SQL: In-Context Learning for Text-to-SQL with
Automatically-Generated Chain-of-Thought [24.1320473171017]
大規模言語モデル(LLM)は、様々なドメインやタスクにおいて強力な能力を持つことが証明されている。
我々は、スキーマリンクに類似した方法で、チェーン・オブ・シンクレット(CoT)プロンプトを設計する。
我々は、テキストからテキストへのマルチターンタスクにコンテキスト内学習手法を拡張した。
論文 参考訳(メタデータ) (2023-10-26T12:16:25Z) - Natural language to SQL in low-code platforms [0.0]
自然言語(NL)クエリを記述可能なパイプラインを提案する。
OutSystemsユーザによって最も頻繁に実行されるクエリをカバーするデータを収集、ラベル付け、検証します。
パイプライン全体について説明します。フィードバックループによって,運用データの迅速な収集が可能になります。
論文 参考訳(メタデータ) (2023-08-29T11:59:02Z) - Improved NL2SQL based on Multi-layer Expert Network [5.921227229250013]
本研究では,マルチタスク階層型ネットワークを利用したMulti-Layer Expert Generate SQL (MLEG-)という新しい手法を提案する。
ネットワークの下位層は自然言語文のセマンティックな特徴を抽出し、上位層は特定の分類タスクのための専門的なシステムを構築する。
この階層的なアプローチは、異なるタスクの競合に起因するパフォーマンス低下を緩和します。
論文 参考訳(メタデータ) (2023-06-30T15:16:52Z) - XRICL: Cross-lingual Retrieval-Augmented In-Context Learning for
Cross-lingual Text-to-SQL Semantic Parsing [70.40401197026925]
大規模言語モデルを用いたインコンテキスト学習は、最近セマンティック解析タスクの驚くべき結果を示している。
この研究は、あるクエリに対して関連する英語の例を検索する学習を行うXRICLフレームワークを導入している。
また、大規模言語モデルの翻訳プロセスを容易にするために、対象言語に対するグローバルな翻訳例も含んでいる。
論文 参考訳(メタデータ) (2022-10-25T01:33:49Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Forecasting SQL Query Cost at Twitter [2.124552987084511]
Serviceは、履歴クエリ要求ログからモデルをトレーニングするために、機械学習技術を使用している。
モデルはCPU使用率予測の97.9%、メモリ使用率予測の97%の精度を達成することができる。
論文 参考訳(メタデータ) (2022-04-12T05:08:30Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。