論文の概要: Functional Collection Programming with Semi-Ring Dictionaries
- arxiv url: http://arxiv.org/abs/2103.06376v1
- Date: Wed, 10 Mar 2021 22:54:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:35:23.864470
- Title: Functional Collection Programming with Semi-Ring Dictionaries
- Title(参考訳): 半環辞書を用いた関数型コレクションプログラミング
- Authors: Amir Shaikhha, Mathieu Huot, Jaclyn Smith, Dan Olteanu
- Abstract要約: 我々は,セミリング辞書を中心とした静的型付け言語SDQLを開発した。
これらの辞書の背後にある半環代数構造のおかげで、SDQLはデータベースや線形代数でよく使われる幅広い最適化を統一する。
- 参考スコア(独自算出の注目度): 5.2815265055792215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces semi-ring dictionaries, a powerful class of
compositional and purely functional collections that subsume other collection
types such as sets, multisets, arrays, vectors, and matrices. We develop SDQL,
a statically typed language centered around semi-ring dictionaries, that can
encode expressions in relational algebra with aggregations, functional
collections, and linear algebra. Furthermore, thanks to the semi-ring algebraic
structures behind these dictionaries, SDQL unifies a wide range of
optimizations commonly used in databases and linear algebra. As a result, SDQL
enables efficient processing of hybrid database and linear algebra workloads,
by putting together optimizations that are otherwise confined to either
database systems or linear algebra frameworks. Through experimental results, we
show that a handful of relational and linear algebra workloads can take
advantage of the SDQL language and optimizations. Overall, we observe that SDQL
achieves competitive performance to Typer and Tectorwise, which are
state-of-the-art in-memory systems for (flat, not nested) relational data, and
achieves an average 2x speedup over SciPy for linear algebra workloads.
Finally, for hybrid workloads involving linear algebra processing over nested
biomedical data, SDQL can give up to one order of magnitude speedup over
Trance, a state-of-the-art nested relational engine.
- Abstract(参考訳): 本稿では, 集合, 多重集合, 配列, ベクトル, 行列などの他のコレクション型をサブスクライブする, 合成および純粋関数型コレクションの強力なクラスであるセミリング辞書を紹介する。
そこで我々は,半環辞書を中心とした静的型付け言語SDQLを開発し,アグリゲーションや関数コレクション,線形代数といった関係代数学の表現をエンコードする。
さらに、これらの辞書の背後にある半環代数構造のおかげで、SDQLはデータベースや線形代数でよく使われる幅広い最適化を統一する。
その結果、SDQLは、データベースシステムまたは線形代数フレームワークに限られる最適化をまとめることで、ハイブリッドデータベースと線形代数ワークロードの効率的な処理を可能にします。
実験結果から,少数のリレーショナルおよびリニア代数のワークロードがSDQL言語と最適化を活用できることが示唆された。
全体として、sdqlは(ネストしない、フラットな)リレーショナルデータのための最先端のインメモリシステムであるtyperとtectorwiseの競合性能を達成し、線形代数ワークロードのscipyに対する平均2倍のスピードアップを達成している。
最後に、ネストしたバイオメディカルデータに対する線形代数処理を含むハイブリッドワークロードの場合、sdqlは最先端のネストリレーショナルエンジンであるtransnce上で最大1桁のスピードアップを行うことができる。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for
enhanced binary classification [75.90957645766676]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
我々のアプローチは、クラス間の平均距離を最大化し、クラス内の分散を最小化する能力を確立する形式的な証明によって裏付けられている。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - CoLA: Exploiting Compositional Structure for Automatic and Efficient
Numerical Linear Algebra [62.37017125812101]
機械学習における大規模線形代数問題に対して, CoLA という, 単純だが汎用的なフレームワークを提案する。
線形演算子抽象と合成ディスパッチルールを組み合わせることで、CoLAはメモリと実行時の効率的な数値アルゴリズムを自動的に構築する。
偏微分方程式,ガウス過程,同変モデル構築,教師なし学習など,幅広い応用で有効性を示す。
論文 参考訳(メタデータ) (2023-09-06T14:59:38Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - ALT: Breaking the Wall between Graph and Operator Level Optimizations
for Deep Learning Compilation [38.8918502461244]
ALTはディープモデルのためのグラフと演算子レベルの共同最適化を行うコンパイラである。
JOGは、単一の演算子の性能とエンドツーエンドの推論性能の両方の観点から、最先端のコンパイラ(例えばAnsor)よりも大幅に優れている。
論文 参考訳(メタデータ) (2022-10-22T11:09:36Z) - String-net construction of RCFT correlators [3.803664831016232]
弦-ネットモデルを用いて、有理共形場理論の相関子への直接的、純粋に2次元のアプローチを実現する。
我々は、下層のモジュラー融合圏のシリンダー圏における等等式の観点から、バルク場と境界場を記述する対象に対して等等式を導出する。
また、ブレイド圏の内部のエックマン・ヒルトン関係を導出し、ブレイドテンソル圏の代数を理解するための弦網の有用性を示す。
論文 参考訳(メタデータ) (2021-12-23T16:57:26Z) - Highly Parallel Autoregressive Entity Linking with Discriminative
Correction [51.947280241185]
自己回帰リンクを全ての潜在的な言及に対して並列化する,非常に効率的な手法を提案する。
我々のモデルは以前の生成法より70倍高速で精度が高い。
論文 参考訳(メタデータ) (2021-09-08T17:28:26Z) - Learning Aggregation Functions [78.47770735205134]
任意の濃度の集合に対する学習可能なアグリゲータであるLAF(Learning Aggregation Function)を紹介する。
半合成および実データを用いて,LAFが最先端の和(max-)分解アーキテクチャより優れていることを示す実験を報告する。
論文 参考訳(メタデータ) (2020-12-15T18:28:53Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。