論文の概要: CARMI: A Cache-Aware Learned Index with a Cost-based Construction
Algorithm
- arxiv url: http://arxiv.org/abs/2103.00858v1
- Date: Mon, 1 Mar 2021 09:20:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 15:54:09.565058
- Title: CARMI: A Cache-Aware Learned Index with a Cost-based Construction
Algorithm
- Title(参考訳): CARMI:コストベース構築アルゴリズムを用いたキャッシュ対応学習指標
- Authors: Jiaoyi Zhang and Yihan Gao
- Abstract要約: Recursive Model Index (RMI) フレームワークの効率を改善するために,キャッシュ認識型学習インデックス (CARMI) の設計を提案する。
学習指標の最適設計を最適化問題として探索する問題を定式化し,それを解くための動的プログラミングアルゴリズムを提案する。
実験の結果,ベースラインよりも高い性能でインデックスを構築することができることがわかった。
- 参考スコア(独自算出の注目度): 1.9798034349981157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned indexes, which use machine learning models to replace traditional
index structures, have shown promising results in recent studies. However, our
understanding of this new type of index structure is still at an early stage
with many details that need to be carefully examined and improved. In this
paper, we propose a cache-aware learned index (CARMI) design to improve the
efficiency of the Recursive Model Index (RMI) framework proposed by Kraska et
al. and a cost-based construction algorithm to construct the optimal indexes in
a wide variety of application scenarios. We formulate the problem of finding
the optimal design of a learned index as an optimization problem and propose a
dynamic programming algorithm for solving it and a partial greedy step to speed
up. Experiments show that our index construction strategy can construct indexes
with significantly better performance compared to baselines under various data
distribution and workload requirements. Among them, CARMI can obtain an average
of 2.52X speedup compared to B-tree, while using only about 0.56X memory space
of B-tree on average.
- Abstract(参考訳): 従来のインデックス構造を置き換えるために機械学習モデルを使用する学習インデックスは、最近の研究で有望な結果を示している。
しかし、この新しいタイプのインデックス構造に対する我々の理解は、まだ初期段階にあり、多くの詳細を慎重に検討し改善する必要がある。
本論文では,Kraskaらによって提案された再帰モデルインデックス(RMI)フレームワークの効率を改善するキャッシュ認識学習インデックス(CARMI)の設計を提案する。
そして、さまざまなアプリケーションシナリオで最適なインデックスを構築するためのコストベースの構築アルゴリズム。
本稿では,学習インデックスの最適設計を最適化問題として求める問題を定式化し,それを解決する動的プログラミングアルゴリズムと,高速化のための部分的欲望ステップを提案する。
実験により, 各種データ分散およびワークロード要求下でのベースラインに比べて, 性能が著しく向上したインデックス構築戦略が得られた。
CARMIはBツリーに比べて平均2.52倍のスピードアップが得られるが、Bツリーのメモリ空間は平均0.56倍である。
関連論文リスト
- Semi-Parametric Retrieval via Binary Token Index [71.78109794895065]
Semi-parametric Vocabulary Disentangled Retrieval (SVDR) は、新しい半パラメトリック検索フレームワークである。
既存のニューラル検索手法に似た、高い有効性のための埋め込みベースのインデックスと、従来の用語ベースの検索に似た、迅速かつ費用対効果の高いセットアップを可能にするバイナリトークンインデックスの2つのタイプをサポートする。
埋め込みベースインデックスを使用する場合の高密度検索器DPRよりも3%高いトップ1検索精度と、バイナリトークンインデックスを使用する場合のBM25よりも9%高いトップ1検索精度を実現する。
論文 参考訳(メタデータ) (2024-05-03T08:34:13Z) - Flexible Channel Dimensions for Differentiable Architecture Search [50.33956216274694]
本稿では,効率的な動的チャネル割当アルゴリズムを用いた新しい微分可能なニューラルアーキテクチャ探索法を提案する。
提案するフレームワークは,タスク精度と推論遅延において,従来の手法と等価なDNNアーキテクチャを見つけることができることを示す。
論文 参考訳(メタデータ) (2023-06-13T15:21:38Z) - Constructing Tree-based Index for Efficient and Effective Dense
Retrieval [26.706985694158384]
JTRは、TReeベースのインデックスとクエリエンコーディングの合同最適化の略である。
我々は、木に基づくインデックスとクエリエンコーダをエンドツーエンドにトレーニングするために、新しい統合されたコントラスト学習損失を設計する。
実験結果から,JTRは高いシステム効率を維持しつつ,検索性能が向上することが示された。
論文 参考訳(メタデータ) (2023-04-24T09:25:39Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - Cascaded Fast and Slow Models for Efficient Semantic Code Search [46.53530668938728]
本稿では,高速かつ低速なモデルを用いた効率的かつ高精度な意味コード検索フレームワークを提案する。
提案したカスケードアプローチは効率的でスケーラブルなだけでなく,最先端の結果も達成している。
論文 参考訳(メタデータ) (2021-10-15T02:23:35Z) - Micro-architectural Analysis of a Learned Index [0.0]
ALEXはツリーベースのインメモリインデックス構造であり、機械学習モデルの階層構造で構成されている。
その結果、ALEXはストールを少なくし、異なるワークロードにまたがるインストラクションあたりのサイクル値が低いことがわかった。
一方、ALEXのアウト・オブ・バウンド・インサートを扱うのに必要な命令の量は、リクエスト毎の命令を著しく増加させる(10X)。
論文 参考訳(メタデータ) (2021-09-17T12:13:06Z) - Learning to Hash Robustly, with Guarantees [79.68057056103014]
本稿では,理論的アルゴリズムと本質的に一致する最悪ケース保証を持つハミング空間のためのNSアルゴリズムを設計する。
理論的にも実用的にも、与えられたデータセットに対してアルゴリズムが最適化できる能力を評価する。
我々のアルゴリズムは、MNISTおよびImageNetデータセットに対する最悪のパフォーマンスのクエリを、1.8倍と2.1倍の精度でリコールする。
論文 参考訳(メタデータ) (2021-08-11T20:21:30Z) - iDARTS: Differentiable Architecture Search with Stochastic Implicit
Gradients [75.41173109807735]
微分可能なArchiTecture Search(DARTS)は先日,ニューラルアーキテクチャサーチ(NAS)の主流になった。
暗黙の関数定理に基づいてDARTSの過次計算に取り組む。
提案手法であるiDARTSのアーキテクチャ最適化は,定常点に収束することが期待される。
論文 参考訳(メタデータ) (2021-06-21T00:44:11Z) - The Case for Learned Spatial Indexes [62.88514422115702]
我々は、空間範囲の問合せに答えるために、最先端の学習した多次元インデックス構造(すなわちFlood)から提案した手法を用いる。
i) パーティション内の機械学習検索は、1次元でフィルタリングを使用する場合の2進探索よりも11.79%速く、39.51%高速であることを示す。
また、2次元でフィルタする最も近い競合相手の1.23倍から1.83倍の速さで機械学習インデックスを精査する。
論文 参考訳(メタデータ) (2020-08-24T12:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。