論文の概要: The Duck's Brain: Training and Inference of Neural Networks in Modern
Database Engines
- arxiv url: http://arxiv.org/abs/2312.17355v1
- Date: Thu, 28 Dec 2023 20:45:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-02 14:27:30.799243
- Title: The Duck's Brain: Training and Inference of Neural Networks in Modern
Database Engines
- Title(参考訳): duck's brain: 現代のデータベースエンジンにおけるニューラルネットワークのトレーニングと推論
- Authors: Maximilian E. Sch\"ule and Thomas Neumann and Alfons Kemper
- Abstract要約: ニューラルネットワークのinsqlをトレーニングするための関係表現にデータを変換する方法を示す。
実行時およびメモリ消費の観点からの評価は、行列代数に対する現代のデータベースシステムの適合性を証明している。
- 参考スコア(独自算出の注目度): 9.450046371705927
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Although database systems perform well in data access and manipulation, their
relational model hinders data scientists from formulating machine learning
algorithms in SQL. Nevertheless, we argue that modern database systems perform
well for machine learning algorithms expressed in relational algebra. To
overcome the barrier of the relational model, this paper shows how to transform
data into a relational representation for training neural networks in SQL: We
first describe building blocks for data transformation, model training and
inference in SQL-92 and their counterparts using an extended array data type.
Then, we compare the implementation for model training and inference using
array data types to the one using a relational representation in SQL-92 only.
The evaluation in terms of runtime and memory consumption proves the
suitability of modern database systems for matrix algebra, although specialised
array data types perform better than matrices in relational representation.
- Abstract(参考訳): データベースシステムはデータアクセスと操作でうまく機能するが、リレーショナルモデルはデータサイエンティストがsqlで機械学習アルゴリズムを作成するのを妨げている。
それにもかかわらず、現代のデータベースシステムは関係代数学で表現された機械学習アルゴリズムでうまく機能していると主張する。
本稿では,SQL-92におけるデータ変換,モデルトレーニング,推論のためのビルディングブロックを,拡張配列データ型を用いて記述する。
次に、配列データ型を用いたモデルトレーニングと推論の実装を、sql-92のみのリレーショナル表現を用いた実装と比較する。
実行時およびメモリ消費の観点から評価すると、行列代数に対する現代のデータベースシステムの適合性が証明されるが、特殊化された配列データ型は関係表現の行列よりも優れている。
関連論文リスト
- In-Database Data Imputation [0.6157028677798809]
データの欠落は多くの領域で広く問題となり、データ分析と意思決定の課題を生み出します。
不完全なレコードを除外したり、単純な見積もりを示唆するといった、欠落したデータを扱う従来の手法は、計算的に効率的であるが、バイアスを導入し、変数の関係を乱す可能性がある。
モデルベースの計算手法は、データの変動性と関係を保存し、より堅牢なソリューションを提供するが、彼らは計算時間をはるかに多く要求する。
この作業は、広く使われているMICE方式を用いて、データベースシステム内の効率的で高品質でスケーラブルなデータ計算を可能にする。
論文 参考訳(メタデータ) (2024-01-07T01:57:41Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-04T16:54:40Z) - Retrieval-Based Transformer for Table Augmentation [14.460363647772745]
我々は、自動データラングリングに対する新しいアプローチを導入する。
本研究の目的は,行数や列数,データ計算などのテーブル拡張タスクに対処することである。
我々のモデルは、教師付き統計手法と最先端のトランスフォーマーベースモデルの両方より一貫して、実質的に優れています。
論文 参考訳(メタデータ) (2023-06-20T18:51:21Z) - Neural RELAGGS [7.690774882108066]
マルチリレーショナルデータベースは、今日の科学や産業において、最も統合されたデータ収集の基盤となっている。
命題化アルゴリズムは、マルチリレーショナルデータベースを命題データセットに変換する。
本稿では,学習可能な複合集合関数を用いたRELAGGSを用いたニューラルネットワークに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T10:42:21Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Learning Contextual Representations for Semantic Parsing with
Generation-Augmented Pre-Training [86.91380874390778]
本稿では,生成モデルを活用して事前学習データを生成することで,自然言語発話と表スキーマの表現を共同で学習するGAPを提案する。
実験結果に基づいて、GAP MODELを利用するニューラルセマンティクスは、SPIDERとCRITERIA-to-generationベンチマークの両方で最新の結果を得る。
論文 参考訳(メタデータ) (2020-12-18T15:53:50Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - Supervised Learning on Relational Databases with Graph Neural Networks [10.279748604797911]
リレーショナルデータベースに格納されたデータに対する機械学習モデルのトレーニングには、重要なデータ抽出と機能エンジニアリングの努力が必要である。
グラフニューラルネットワークを用いてこれらの課題を克服する手法を提案する。
提案手法は,3つのデータセットのうち2つに対して,最先端の機能工学手法より優れている。
論文 参考訳(メタデータ) (2020-02-06T00:57:39Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。