論文の概要: The "AI+R"-tree: An Instance-optimized R-tree
- arxiv url: http://arxiv.org/abs/2207.00550v1
- Date: Fri, 1 Jul 2022 17:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 14:54:52.198598
- Title: The "AI+R"-tree: An Instance-optimized R-tree
- Title(参考訳): AI+R-tree:インスタンス最適化R-tree
- Authors: Abdullah-Al-Mamun, Ch. Md. Rakin Haider, Jianguo Wang, Walid G. Aref
- Abstract要約: 本稿では,空間指標の性能向上に機械学習技術を活用することを提案する。
本稿では,Rツリーの探索操作を多ラベル分類タスクに変換するAIツリーを提案する。
実際のデータセットの実験では、"AI+R"ツリーが従来のRツリーのクエリ性能を最大500%向上できることが示されている。
- 参考スコア(独自算出の注目度): 8.645596995409647
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The emerging class of instance-optimized systems has shown potential to
achieve high performance by specializing to a specific data and query
workloads. Particularly, Machine Learning (ML) techniques have been applied
successfully to build various instance-optimized components (e.g., learned
indexes). This paper investigates to leverage ML techniques to enhance the
performance of spatial indexes, particularly the R-tree, for a given data and
query workloads. As the areas covered by the R-tree index nodes overlap in
space, upon searching for a specific point in space, multiple paths from root
to leaf may potentially be explored. In the worst case, the entire R-tree could
be searched. In this paper, we define and use the overlap ratio to quantify the
degree of extraneous leaf node accesses required by a range query. The goal is
to enhance the query performance of a traditional R-tree for high-overlap range
queries as they tend to incur long running-times. We introduce a new AI-tree
that transforms the search operation of an R-tree into a multi-label
classification task to exclude the extraneous leaf node accesses. Then, we
augment a traditional R-tree to the AI-tree to form a hybrid "AI+R"-tree. The
"AI+R"-tree can automatically differentiate between the high- and low-overlap
queries using a learned model. Thus, the "AI+R"-tree processes high-overlap
queries using the AI-tree, and the low-overlap queries using the R-tree.
Experiments on real datasets demonstrate that the "AI+R"-tree can enhance the
query performance over a traditional R-tree by up to 500%.
- Abstract(参考訳): インスタンス最適化システムの新たなクラスは、特定のデータやクエリワークロードに特化することで、ハイパフォーマンスを実現する可能性を示している。
特に機械学習(ML)技術は、様々なインスタンス最適化コンポーネント(学習インデックスなど)の構築に成功している。
本稿では,与えられたデータおよびクエリ処理に対する空間インデックス,特にR木の性能向上にML手法を活用することを検討する。
r-木インデックスノードがカバーする領域は空間で重なり合うため、空間内の特定の点を探索すると、ルートからリーフまでの複数の経路が探索される可能性がある。
最悪の場合、Rツリー全体を検索することができる。
本稿では,範囲問合せで要求される外部リーフノードアクセスの程度を定量化するために,重なり比を定義し,使用する。
目標は、長い実行時間を消費する傾向があるため、高オーバーラップ範囲のクエリに対して、従来のRツリーのクエリパフォーマンスを向上させることである。
本稿では,r-treeの探索操作をマルチラベル分類タスクに変換し,外部リーフノードのアクセスを除外する新しいai-treeを提案する。
そして、従来のRツリーをAIツリーに拡張し、AI+Rツリーをハイブリッド化する。
AI+R"ツリーは学習モデルを用いて,ハイオーバーラップクエリとローオーバーラップクエリを自動的に区別することができる。
したがって、AI+R-treeはAI-treeを用いたハイオーバーラップクエリとR-treeを用いた低オーバーラップクエリを処理する。
実際のデータセットの実験では、"AI+R"ツリーが従来のRツリーのクエリ性能を最大500%向上できることが示されている。
関連論文リスト
- Tradeoffs in Processing Queries and Supporting Updates over an ML-Enhanced R-tree [5.13844201935498]
本稿では,R木多次元インデックス構造に着目し,多次元データのインデックス化に広く利用されている。
R-treeは機械学習モデルで強化され、R-treeのパフォーマンスが向上した。
AI+R-treeは、従来のディスクベースのR-treeをMLモデルで拡張し、R-treeのクエリ処理性能を向上させるML強化R-treeインデックス構造である。
論文 参考訳(メタデータ) (2025-02-14T06:16:26Z) - ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文 参考訳(メタデータ) (2025-02-11T21:35:13Z) - LiteSearch: Efficacious Tree Search for LLM [70.29796112457662]
本研究では,動的ノード選択とノードレベルの探索予算を備えた新しいガイド付き木探索アルゴリズムを提案する。
GSM8KおよびTabMWPデータセットを用いて行った実験により,本手法はベースライン法に比べて計算コストが大幅に低いことを示した。
論文 参考訳(メタデータ) (2024-06-29T05:14:04Z) - Deterministic Iteratively Built KD-Tree with KNN Search for Exact
Applications [2.7325238096808318]
K-Nearest Neighbors (KNN)サーチは、ロボット工学や自動運転車に応用された人工知能ソフトウェアの基本アルゴリズムである。
二分木と同様に、kd-treesはオンラインアプリケーションに新しいデータが付加され、木が再構築されない限り、検索性能が急速に低下する可能性があるため、不均衡になる。
クエリ結果の正確さを損なうことなく、ツリー再構築の回数を減らす「インターバルkd-treesのフォレスト」を提示する。
論文 参考訳(メタデータ) (2021-06-07T17:09:22Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - The RLR-Tree: A Reinforcement Learning Based R-Tree for Spatial Data [33.26284196513858]
B-Treeのような古典的なインデックス構造を機械学習(ML)モデルに置き換えるための学習インデックスが提案されている。
構造やクエリ処理アルゴリズムを変更することなく、従来のR-Treeのクエリ性能を向上させるために、ML技術を使用する根本的に異なる方法を提案します。
論文 参考訳(メタデータ) (2021-03-08T04:29:58Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - FREEtree: A Tree-based Approach for High Dimensional Longitudinal Data
With Correlated Features [2.00191482700544]
FREEtreeは高次元長手データと相関する特徴を持つ木に基づく手法である。
重み付き相関ネットワーク分析を用いて、まずそれらをクラスタリングすることで、特徴のネットワーク構造を利用する。
次に、各機能のクラスタ内でスクリーニングステップを実行し、残る機能の中から選択ステップを実行します。
論文 参考訳(メタデータ) (2020-06-17T07:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。