論文の概要: Tradeoffs in Processing Queries and Supporting Updates over an ML-Enhanced R-tree
- arxiv url: http://arxiv.org/abs/2502.09937v1
- Date: Fri, 14 Feb 2025 06:16:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 18:06:36.173225
- Title: Tradeoffs in Processing Queries and Supporting Updates over an ML-Enhanced R-tree
- Title(参考訳): ML強化Rツリーにおけるクエリ処理のトレードオフと更新サポート
- Authors: Abdullah Al-Mamun, Ch. Md. Rakin Haider, Jianguo Wang, Walid G. Aref,
- Abstract要約: 本稿では,R木多次元インデックス構造に着目し,多次元データのインデックス化に広く利用されている。
R-treeは機械学習モデルで強化され、R-treeのパフォーマンスが向上した。
AI+R-treeは、従来のディスクベースのR-treeをMLモデルで拡張し、R-treeのクエリ処理性能を向上させるML強化R-treeインデックス構造である。
- 参考スコア(独自算出の注目度): 5.13844201935498
- License:
- Abstract: Machine Learning (ML) techniques have been successfully applied to design various learned database index structures for both the one- and multi-dimensional spaces. Particularly, a class of traditional multi-dimensional indexes has been augmented with ML models to design ML-enhanced variants of their traditional counterparts. This paper focuses on the R-tree multi-dimensional index structure as it is widely used for indexing multi-dimensional data. The R-tree has been augmented with machine learning models to enhance the R-tree performance. The AI+R-tree is an ML-enhanced R-tree index structure that augments a traditional disk-based R-tree with an ML model to enhance the R-tree's query processing performance, mainly, to avoid navigating the overlapping branches of the R-tree that do not yield query results, e.g., in the presence of high-overlap among the rectangles of the R-tree nodes. We investigate the empirical tradeoffs in processing dynamic query workloads and in supporting updates over the AI+R-tree. Particularly, we investigate the impact of the choice of ML models over the AI+R-tree query processing performance. Moreover, we present a case study of designing a custom loss function for a neural network model tailored to the query processing requirements of the AI+R-tree. Furthermore, we present the design tradeoffs for adopting various strategies for supporting dynamic inserts, updates, and deletes with the vision of realizing a mutable AI+R-tree. Experiments on real datasets demonstrate that the AI+R-tree can enhance the query processing performance of a traditional R-tree for high-overlap range queries by up to 5.4X while achieving up to 99% average query recall.
- Abstract(参考訳): 機械学習(ML)技術は、一次元空間と多次元空間の両方において、様々な学習されたデータベースインデックス構造の設計に成功している。
特に、従来の多次元インデックスのクラスはMLモデルで拡張され、従来のML拡張型を設計している。
本稿では,R木多次元インデックス構造に着目し,多次元データのインデックス化に広く利用されている。
R-treeは機械学習モデルで強化され、R-treeのパフォーマンスが向上した。
AI+Rツリーは、従来のディスクベースのRツリーをMLモデルで強化し、Rツリーのクエリ処理性能を高めるためのML強化Rツリーインデックス構造である。
動的クエリ処理の処理における経験的トレードオフと,AI+Rツリーの更新サポートについて検討する。
特に,AI+R木クエリ処理性能に対するMLモデル選択の影響について検討する。
さらに,AI+Rツリーのクエリ処理要求に合わせて,ニューラルネットワークモデルのカスタム損失関数を設計するケーススタディを提案する。
さらに、動的挿入、更新、削除をサポートする様々な戦略を採用するための設計上のトレードオフを、可変AI+Rツリーの実現というビジョンとともに提示する。
実際のデータセットの実験では、AI+Rツリーが従来のRツリーのクエリ処理性能を最大5.4倍向上し、平均99%のクエリリコールを実現している。
関連論文リスト
- ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文 参考訳(メタデータ) (2025-02-11T21:35:13Z) - Autoregressive Generation of Static and Growing Trees [49.93294993975928]
本稿では,ツリー生成のためのトランスフォーマーアーキテクチャとトレーニング戦略を提案する。
アーキテクチャはデータを複数の解像度で処理し、1時間ガラスの形状を持ち、中間層は外側層よりも少ないトークンを処理する。
我々は,この手法を拡張して,イメージ・ツー・ツリーとポイント・クラウド・ツー・ツリー条件生成を行い,木の成長過程をシミュレートし,4D木を生成する。
論文 参考訳(メタデータ) (2025-02-07T08:51:14Z) - Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.241569810013836]
本稿では,大規模言語モデル(LLM)を用いて,効率的な特徴生成ルールを同定するフレームワークを提案する。
我々は、自然言語で容易に表現できるため、この推論情報を伝達するために決定木を使用します。
OCTreeは様々なベンチマークで様々な予測モデルの性能を継続的に向上させる。
論文 参考訳(メタデータ) (2024-06-12T08:31:34Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Constructing Tree-based Index for Efficient and Effective Dense
Retrieval [26.706985694158384]
JTRは、TReeベースのインデックスとクエリエンコーディングの合同最適化の略である。
我々は、木に基づくインデックスとクエリエンコーダをエンドツーエンドにトレーニングするために、新しい統合されたコントラスト学習損失を設計する。
実験結果から,JTRは高いシステム効率を維持しつつ,検索性能が向上することが示された。
論文 参考訳(メタデータ) (2023-04-24T09:25:39Z) - SETAR-Tree: A Novel and Accurate Tree Algorithm for Global Time Series
Forecasting [7.206754802573034]
本稿では,TARモデルと回帰木との密接な関係について検討する。
本研究では,葉のグローバルプール回帰(PR)モデルをトレーニングする,予測固有木アルゴリズムを提案する。
本評価では, 提案した樹木モデルと森林モデルを用いて, 最先端の樹木モデルよりも精度の高い木モデルを提案する。
論文 参考訳(メタデータ) (2022-11-16T04:30:42Z) - The "AI+R"-tree: An Instance-optimized R-tree [8.645596995409647]
本稿では,空間指標の性能向上に機械学習技術を活用することを提案する。
本稿では,Rツリーの探索操作を多ラベル分類タスクに変換するAIツリーを提案する。
実際のデータセットの実験では、"AI+R"ツリーが従来のRツリーのクエリ性能を最大500%向上できることが示されている。
論文 参考訳(メタデータ) (2022-07-01T17:08:17Z) - Reinforcement Learning for Branch-and-Bound Optimisation using
Retrospective Trajectories [72.15369769265398]
機械学習は分岐のための有望なパラダイムとして登場した。
分岐のための単純かつ効果的なRLアプローチであるレトロ分岐を提案する。
我々は現在最先端のRL分岐アルゴリズムを3~5倍に上回り、500の制約と1000の変数を持つMILP上での最高のILメソッドの性能の20%以内である。
論文 参考訳(メタデータ) (2022-05-28T06:08:07Z) - Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner [56.08919422452905]
我々はIRGR(Iterative Retrieval-Generation Reasoner)と呼ばれるアーキテクチャを提案する。
本モデルでは,テキストの前提からステップバイステップの説明を体系的に生成することにより,与えられた仮説を説明することができる。
前提条件の検索と細分化木の生成に関する既存のベンチマークを上回り、全体の正しさはおよそ300%向上した。
論文 参考訳(メタデータ) (2022-05-18T21:52:11Z) - The RLR-Tree: A Reinforcement Learning Based R-Tree for Spatial Data [33.26284196513858]
B-Treeのような古典的なインデックス構造を機械学習(ML)モデルに置き換えるための学習インデックスが提案されている。
構造やクエリ処理アルゴリズムを変更することなく、従来のR-Treeのクエリ性能を向上させるために、ML技術を使用する根本的に異なる方法を提案します。
論文 参考訳(メタデータ) (2021-03-08T04:29:58Z) - FREEtree: A Tree-based Approach for High Dimensional Longitudinal Data
With Correlated Features [2.00191482700544]
FREEtreeは高次元長手データと相関する特徴を持つ木に基づく手法である。
重み付き相関ネットワーク分析を用いて、まずそれらをクラスタリングすることで、特徴のネットワーク構造を利用する。
次に、各機能のクラスタ内でスクリーニングステップを実行し、残る機能の中から選択ステップを実行します。
論文 参考訳(メタデータ) (2020-06-17T07:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。