論文の概要: A Survey of Learned Indexes for the Multi-dimensional Space
- arxiv url: http://arxiv.org/abs/2403.06456v1
- Date: Mon, 11 Mar 2024 06:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 20:13:07.736114
- Title: A Survey of Learned Indexes for the Multi-dimensional Space
- Title(参考訳): 多次元空間における学習指標の検討
- Authors: Abdullah Al-Mamun, Hao Wu, Qiyang He, Jianguo Wang, Walid G. Aref
- Abstract要約: 本調査は学習した多次元インデックス構造に焦点を当てる。
本稿では,各学習した多次元指標を分類・分類する分類法を提案する。
我々は、この新興かつ活発な分野における、いくつかのオープンな課題と今後の研究方向性を強調します。
- 参考スコア(独自算出の注目度): 7.574538354949901
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A recent research trend involves treating database index structures as
Machine Learning (ML) models. In this domain, single or multiple ML models are
trained to learn the mapping from keys to positions inside a data set. This
class of indexes is known as "Learned Indexes." Learned indexes have
demonstrated improved search performance and reduced space requirements for
one-dimensional data. The concept of one-dimensional learned indexes has
naturally been extended to multi-dimensional (e.g., spatial) data, leading to
the development of "Learned Multi-dimensional Indexes". This survey focuses on
learned multi-dimensional index structures. Specifically, it reviews the
current state of this research area, explains the core concepts behind each
proposed method, and classifies these methods based on several well-defined
criteria. We present a taxonomy that classifies and categorizes each learned
multi-dimensional index, and survey the existing literature on learned
multi-dimensional indexes according to this taxonomy. Additionally, we present
a timeline to illustrate the evolution of research on learned indexes. Finally,
we highlight several open challenges and future research directions in this
emerging and highly active field.
- Abstract(参考訳): 最近の研究トレンドは、データベースインデックス構造を機械学習(ML)モデルとして扱うことである。
このドメインでは、単一または複数のMLモデルを使用して、データセット内のキーから位置へのマッピングを学習する。
このインデックスのクラスは"Learned Indexes"として知られている。
学習インデックスは検索性能の向上と1次元データの空間要求の低減を実証している。
一次元学習指標の概念は自然に多次元データ(例えば空間データ)に拡張され、「学習された多次元指標」の開発に繋がった。
本調査は学習した多次元インデックス構造に焦点を当てる。
具体的には,本研究領域の現状を概観し,提案手法の背景にある中核概念を説明し,いくつかの明確な基準に基づいてこれらの手法を分類する。
本稿では,各学習された多次元指標を分類・分類し,この分類法に従って学習された多次元指標に関する既存の文献を調査した。
さらに,学習指標の研究の進展を示すタイムラインを提示する。
最後に,この新興かつ高度に活発な分野における,いくつかのオープンチャレンジと今後の研究方向性について紹介する。
関連論文リスト
- Taxonomy-guided Semantic Indexing for Academic Paper Search [51.07749719327668]
TaxoIndexは学術論文検索のためのセマンティックインデックスフレームワークである。
学術分類学によって導かれる意味指標として、論文から重要な概念を整理する。
既存の高密度レトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-10-25T00:00:17Z) - End-to-End Learning to Index and Search in Large Output Spaces [95.16066833532396]
Extreme Multi-label Classification (XMC) は現実世界の問題を解決するための一般的なフレームワークである。
本稿では,木系インデックスを特殊重み付きグラフベースインデックスに緩和する新しい手法を提案する。
ELIASは、数百万のラベルを持つ大規模極端分類ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-10-16T01:34:17Z) - An Assessment Tool for Academic Research Managers in the Third World [125.99533416395765]
一方のベースにあるデータが、もう一方のインデックスを推測するためにどのように使用できるかを示す。
SCOPUSの情報はWebから自由に取り除くことができるので、このアプローチは出版物のインパクトファクターを自由に推論することができる。
論文 参考訳(メタデータ) (2022-09-07T14:59:25Z) - Bridging the Gap Between Indexing and Retrieval for Differentiable
Search Index with Query Generation [98.02743096197402]
Differentiable Search Index (DSI) は情報検索の新たなパラダイムである。
そこで我々は, DSI-QG と呼ばれる, DSI のための簡易かつ効果的な索引付けフレームワークを提案する。
DSI-QG が元の DSI モデルより有意に優れていたことを示す。
論文 参考訳(メタデータ) (2022-06-21T06:21:23Z) - A Learned Index for Exact Similarity Search in Metric Spaces [25.330353637669386]
LIMSは、学習したインデックスを構築するために、データクラスタリングとピボットベースのデータ変換技術を使用することが提案されている。
機械学習モデルはディスク上の各データレコードの位置を近似するために開発された。
実世界のデータセットと合成データセットに関する大規模な実験は、従来の指標と比較してLIMSの優位性を示している。
論文 参考訳(メタデータ) (2022-04-21T11:24:55Z) - Learned Sorted Table Search and Static Indexes in Small Space:
Methodological and Practical Insights via an Experimental Study [0.0]
Sorted Table Search プロシージャはクインテシデントなクエリ検索ツールだが,それでも非常に有用だ。
検索するテーブルに関して、小さな追加スペースでそれらをスピードアップすることは、依然として非常に大きな成果である。
一定あるいはほぼ一定の追加空間を使用しながら、学習のスピードアップをどの程度楽しむことができるかは、大きな疑問である。
論文 参考訳(メタデータ) (2021-07-19T16:06:55Z) - A Pluggable Learned Index Method via Sampling and Gap Insertion [48.900186573181735]
データベースインデックスは、データ検索を促進し、現実世界のシステムにおける幅広いアプリケーションに役立つ。
近年,隠れて有用なデータ分布を学習するために,learning indexという新しいインデックスが提案されている。
学習指標の学習効率と学習効率を高めるための2つの一般的なテクニックとプラグイン可能なテクニックを研究します。
論文 参考訳(メタデータ) (2021-01-04T07:17:23Z) - The Case for Learned Spatial Indexes [62.88514422115702]
我々は、空間範囲の問合せに答えるために、最先端の学習した多次元インデックス構造(すなわちFlood)から提案した手法を用いる。
i) パーティション内の機械学習検索は、1次元でフィルタリングを使用する場合の2進探索よりも11.79%速く、39.51%高速であることを示す。
また、2次元でフィルタする最も近い競合相手の1.23倍から1.83倍の速さで機械学習インデックスを精査する。
論文 参考訳(メタデータ) (2020-08-24T12:09:55Z) - Tsunami: A Learned Multi-dimensional Index for Correlated Data and
Skewed Workloads [29.223401893397714]
我々は,既存の学習した多次元インデックスよりも最大6倍高速なクエリ性能と最大8倍のインデックスサイズを実現する綱見を紹介した。
論文 参考訳(メタデータ) (2020-06-23T19:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。