論文の概要: Functional Collection Programming with Semi-Ring Dictionaries
- arxiv url: http://arxiv.org/abs/2103.06376v1
- Date: Wed, 10 Mar 2021 22:54:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:35:23.864470
- Title: Functional Collection Programming with Semi-Ring Dictionaries
- Title(参考訳): 半環辞書を用いた関数型コレクションプログラミング
- Authors: Amir Shaikhha, Mathieu Huot, Jaclyn Smith, Dan Olteanu
- Abstract要約: 我々は,セミリング辞書を中心とした静的型付け言語SDQLを開発した。
これらの辞書の背後にある半環代数構造のおかげで、SDQLはデータベースや線形代数でよく使われる幅広い最適化を統一する。
- 参考スコア(独自算出の注目度): 5.2815265055792215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces semi-ring dictionaries, a powerful class of
compositional and purely functional collections that subsume other collection
types such as sets, multisets, arrays, vectors, and matrices. We develop SDQL,
a statically typed language centered around semi-ring dictionaries, that can
encode expressions in relational algebra with aggregations, functional
collections, and linear algebra. Furthermore, thanks to the semi-ring algebraic
structures behind these dictionaries, SDQL unifies a wide range of
optimizations commonly used in databases and linear algebra. As a result, SDQL
enables efficient processing of hybrid database and linear algebra workloads,
by putting together optimizations that are otherwise confined to either
database systems or linear algebra frameworks. Through experimental results, we
show that a handful of relational and linear algebra workloads can take
advantage of the SDQL language and optimizations. Overall, we observe that SDQL
achieves competitive performance to Typer and Tectorwise, which are
state-of-the-art in-memory systems for (flat, not nested) relational data, and
achieves an average 2x speedup over SciPy for linear algebra workloads.
Finally, for hybrid workloads involving linear algebra processing over nested
biomedical data, SDQL can give up to one order of magnitude speedup over
Trance, a state-of-the-art nested relational engine.
- Abstract(参考訳): 本稿では, 集合, 多重集合, 配列, ベクトル, 行列などの他のコレクション型をサブスクライブする, 合成および純粋関数型コレクションの強力なクラスであるセミリング辞書を紹介する。
そこで我々は,半環辞書を中心とした静的型付け言語SDQLを開発し,アグリゲーションや関数コレクション,線形代数といった関係代数学の表現をエンコードする。
さらに、これらの辞書の背後にある半環代数構造のおかげで、SDQLはデータベースや線形代数でよく使われる幅広い最適化を統一する。
その結果、SDQLは、データベースシステムまたは線形代数フレームワークに限られる最適化をまとめることで、ハイブリッドデータベースと線形代数ワークロードの効率的な処理を可能にします。
実験結果から,少数のリレーショナルおよびリニア代数のワークロードがSDQL言語と最適化を活用できることが示唆された。
全体として、sdqlは(ネストしない、フラットな)リレーショナルデータのための最先端のインメモリシステムであるtyperとtectorwiseの競合性能を達成し、線形代数ワークロードのscipyに対する平均2倍のスピードアップを達成している。
最後に、ネストしたバイオメディカルデータに対する線形代数処理を含むハイブリッドワークロードの場合、sdqlは最先端のネストリレーショナルエンジンであるtransnce上で最大1桁のスピードアップを行うことができる。
関連論文リスト
- Hyperdimensional Vector Tsetlin Machines with Applications to Sequence Learning and Generation [0.0]
我々は,バニラ・テトリンマシンと競合する高速かつ高速な逐次データを学習し,生成するための2層モデルを構築した。
提案手法は,予測,新しいシーケンス生成,分類の2分野に適用する。
後者については、UCR Time Series Archiveの全結果から導出し、標準ベンチマークと比較して、時系列分類において、その手法がいかに優れているかを確認する。
論文 参考訳(メタデータ) (2024-08-29T15:28:01Z) - Optimal Matrix-Mimetic Tensor Algebras via Variable Projection [0.0]
行列緩和性(Matrix mimeticity)は、テンソルを、行列に類似した乗算、分解、解析が可能な作用素として解釈することから生じる。
我々は、データの事前の知識に頼ることなく、最適線形写像と対応するテンソル表現を学習する。
可変射影型アルゴリズムの変換と収束解析の独創性理論を提供する。
論文 参考訳(メタデータ) (2024-06-11T04:52:23Z) - Blended RAG: Improving RAG (Retriever-Augmented Generation) Accuracy with Semantic Search and Hybrid Query-Based Retrievers [0.0]
Retrieval-Augmented Generation (RAG) は、大規模言語モデル (LLM) で文書のプライベートな知識基盤を注入し、生成的Q&A (Question-Answering) システムを構築するための一般的なアプローチである。
本稿では,Vector インデックスや Sparse インデックスなどのセマンティック検索手法をハイブリッドクエリ手法と組み合わせた 'Blended RAG' 手法を提案する。
本研究は,NQ や TREC-COVID などの IR (Information Retrieval) データセットの検索結果の改善と,新たなベンチマーク設定を行う。
論文 参考訳(メタデータ) (2024-03-22T17:13:46Z) - CoLA: Exploiting Compositional Structure for Automatic and Efficient
Numerical Linear Algebra [62.37017125812101]
機械学習における大規模線形代数問題に対して, CoLA という, 単純だが汎用的なフレームワークを提案する。
線形演算子抽象と合成ディスパッチルールを組み合わせることで、CoLAはメモリと実行時の効率的な数値アルゴリズムを自動的に構築する。
偏微分方程式,ガウス過程,同変モデル構築,教師なし学習など,幅広い応用で有効性を示す。
論文 参考訳(メタデータ) (2023-09-06T14:59:38Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - String-net construction of RCFT correlators [3.803664831016232]
弦-ネットモデルを用いて、有理共形場理論の相関子への直接的、純粋に2次元のアプローチを実現する。
我々は、下層のモジュラー融合圏のシリンダー圏における等等式の観点から、バルク場と境界場を記述する対象に対して等等式を導出する。
また、ブレイド圏の内部のエックマン・ヒルトン関係を導出し、ブレイドテンソル圏の代数を理解するための弦網の有用性を示す。
論文 参考訳(メタデータ) (2021-12-23T16:57:26Z) - Highly Parallel Autoregressive Entity Linking with Discriminative
Correction [51.947280241185]
自己回帰リンクを全ての潜在的な言及に対して並列化する,非常に効率的な手法を提案する。
我々のモデルは以前の生成法より70倍高速で精度が高い。
論文 参考訳(メタデータ) (2021-09-08T17:28:26Z) - Learning Aggregation Functions [78.47770735205134]
任意の濃度の集合に対する学習可能なアグリゲータであるLAF(Learning Aggregation Function)を紹介する。
半合成および実データを用いて,LAFが最先端の和(max-)分解アーキテクチャより優れていることを示す実験を報告する。
論文 参考訳(メタデータ) (2020-12-15T18:28:53Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。