論文の概要: Learning from Data to Speed-up Sorted Table Search Procedures:
Methodology and Practical Guidelines
- arxiv url: http://arxiv.org/abs/2007.10237v3
- Date: Thu, 30 Jul 2020 11:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 13:12:44.009435
- Title: Learning from Data to Speed-up Sorted Table Search Procedures:
Methodology and Practical Guidelines
- Title(参考訳): データから高速な表検索への学習:方法論と実践的ガイドライン
- Authors: Domenico Amato, Giosu\'e Lo Bosco, Raffaele Giancarlo
- Abstract要約: 機械学習技術の拡張が、このようなスピードアップにどのような貢献をできるかを調査する。
我々は、CPUおよびGPUコンピューティングの両方を考慮して、後者が前者に対して利益を上げることができるシナリオを特徴づける。
実際、ここで提案した学習表検索手順を自然に補完するアルゴリズム的パラダイムを定式化し、既知の学習表検索手順の大部分を、単純な線形回帰を近似した「学習フェーズ」を持つものとして特徴付ける。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sorted Table Search Procedures are the quintessential query-answering tool,
with widespread usage that now includes also Web Applications, e.g, Search
Engines (Google Chrome) and ad Bidding Systems (AppNexus). Speeding them up, at
very little cost in space, is still a quite significant achievement. Here we
study to what extend Machine Learning Techniques can contribute to obtain such
a speed-up via a systematic experimental comparison of known efficient
implementations of Sorted Table Search procedures, with different Data Layouts,
and their Learned counterparts developed here. We characterize the scenarios in
which those latter can be profitably used with respect to the former,
accounting for both CPU and GPU computing. Our approach contributes also to the
study of Learned Data Structures, a recent proposal to improve the time/space
performance of fundamental Data Structures, e.g., B-trees, Hash Tables, Bloom
Filters. Indeed, we also formalize an Algorithmic Paradigm of Learned
Dichotomic Sorted Table Search procedures that naturally complements the
Learned one proposed here and that characterizes most of the known Sorted Table
Search Procedures as having a "learning phase" that approximates Simple Linear
Regression.
- Abstract(参考訳): ソートされたテーブル検索プロシージャは、クエリ処理ツールとして必須であり、現在、検索エンジン(google chrome)や広告入札システム(appnexus)など、webアプリケーションを含む広く利用されている。
スピードアップは、宇宙でのコストが極めて少ないが、それでも非常に大きな成果だ。
本稿では,データレイアウトの異なるソートテーブル探索手順の既知の効率的な実装と,そこで開発された学習対象の体系的比較を通じて,機械学習技術がどのような速度向上に寄与するかについて検討する。
我々は、CPUおよびGPUコンピューティングの両方を考慮して、後者が前者に対して利益を上げることができるシナリオを特徴づける。
我々のアプローチは、B木、ハッシュテーブル、ブルームフィルタといった基本データ構造の性能を改善するための最近の提案である学習データ構造の研究にも貢献する。
実際、我々は、ここで提案する学習済みのテーブル探索手順を自然に補完し、既知のソートされたテーブル探索手順のほとんどを単純な線形回帰に近似する「学習段階」を持つことを特徴付ける学習ディコトミックソートテーブル探索手順のアルゴリズムパラダイムを定式化する。
関連論文リスト
- Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes? [62.57689536630933]
本稿では,オープンソースのLucene検索ライブラリを用いたBEIRデータセットの実験結果について述べる。
本研究は,高密度かつ疎密なレトリバーの設計空間を理解するための,今日の検索実践者へのガイダンスを提供する。
論文 参考訳(メタデータ) (2024-09-10T12:46:23Z) - LIST: Learning to Index Spatio-Textual Data for Embedding based Spatial Keyword Queries [53.843367588870585]
リスト K-kNN 空間キーワードクエリ (TkQ) は、空間的およびテキスト的関連性の両方を考慮したランキング関数に基づくオブジェクトのリストを返す。
効率的かつ効率的な指標、すなわち高品質なラベルの欠如とバランスの取れない結果を構築する上で、大きな課題が2つある。
この2つの課題に対処する新しい擬似ラベル生成手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T05:32:33Z) - Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - From Specific to Generic Learned Sorted Set Dictionaries: A
Theoretically Sound Paradigm Yelding Competitive Data Structural Boosters in
Practice [0.0]
我々は学習されたセット辞書に焦点をあてる。
我々は、既知の専門用語を補完する新しいパラダイムを提案し、任意のSorted Set Dictionaryの学習版を作成できる。
論文 参考訳(メタデータ) (2023-09-02T13:52:53Z) - A Learned Index for Exact Similarity Search in Metric Spaces [25.330353637669386]
LIMSは、学習したインデックスを構築するために、データクラスタリングとピボットベースのデータ変換技術を使用することが提案されている。
機械学習モデルはディスク上の各データレコードの位置を近似するために開発された。
実世界のデータセットと合成データセットに関する大規模な実験は、従来の指標と比較してLIMSの優位性を示している。
論文 参考訳(メタデータ) (2022-04-21T11:24:55Z) - CrossBeam: Learning to Search in Bottom-Up Program Synthesis [51.37514793318815]
ボトムアップ合成のためのハンズオン検索ポリシーを学習するためのニューラルネットワークのトレーニングを提案する。
私たちのアプローチは、CrossBeamと呼ばれ、ニューラルモデルを使用して、以前に探索されたプログラムを新しいプログラムに組み合わせる方法を選択します。
我々はCrossBeamが効率的に検索することを学び、最先端技術と比較してプログラム空間のより小さな部分を探索する。
論文 参考訳(メタデータ) (2022-03-20T04:41:05Z) - Standard Vs Uniform Binary Search and Their Variants in Learned Static
Indexing: The Case of the Searching on Sorted Data Benchmarking Software
Platform [0.0]
学習者にとって、bf SOSDソフトウェアに関して、標準ルーチンの使用はUniformよりも優れていることを示す。
実験の結果,一様二項探索とk-ary Searchは学習空間の節約に有用であることが示唆された。
論文 参考訳(メタデータ) (2022-01-05T11:46:16Z) - Ranking Cost: Building An Efficient and Scalable Circuit Routing Planner
with Evolution-Based Optimization [49.207538634692916]
そこで我々は、効率よくトレーニング可能なルータを形成するための新しい回路ルーティングアルゴリズム、Randing Costを提案する。
提案手法では,A*ルータが適切な経路を見つけるのに役立つコストマップと呼ばれる新しい変数群を導入する。
我々のアルゴリズムはエンドツーエンドで訓練されており、人工データや人間の実演は一切使用しない。
論文 参考訳(メタデータ) (2021-10-08T07:22:45Z) - Learned Sorted Table Search and Static Indexes in Small Space:
Methodological and Practical Insights via an Experimental Study [0.0]
Sorted Table Search プロシージャはクインテシデントなクエリ検索ツールだが,それでも非常に有用だ。
検索するテーブルに関して、小さな追加スペースでそれらをスピードアップすることは、依然として非常に大きな成果である。
一定あるいはほぼ一定の追加空間を使用しながら、学習のスピードアップをどの程度楽しむことができるかは、大きな疑問である。
論文 参考訳(メタデータ) (2021-07-19T16:06:55Z) - ReliefE: Feature Ranking in High-dimensional Spaces via Manifold
Embeddings [0.0]
リリーフ・ファミリのアルゴリズムは、最も重要で無関係なインスタンスを反復的に計算することで、機能に重要性を割り当てる。
最近の埋め込みベース手法はコンパクトな低次元表現を学習する。
ReliefEアルゴリズムは高速で、機能ランキングが向上する可能性がある。
論文 参考訳(メタデータ) (2021-01-23T20:23:31Z) - Progressively Pretrained Dense Corpus Index for Open-Domain Question
Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。
本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文 参考訳(メタデータ) (2020-04-30T18:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。