論文の概要: Learning from Data to Speed-up Sorted Table Search Procedures:
Methodology and Practical Guidelines
- arxiv url: http://arxiv.org/abs/2007.10237v3
- Date: Thu, 30 Jul 2020 11:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 13:12:44.009435
- Title: Learning from Data to Speed-up Sorted Table Search Procedures:
Methodology and Practical Guidelines
- Title(参考訳): データから高速な表検索への学習:方法論と実践的ガイドライン
- Authors: Domenico Amato, Giosu\'e Lo Bosco, Raffaele Giancarlo
- Abstract要約: 機械学習技術の拡張が、このようなスピードアップにどのような貢献をできるかを調査する。
我々は、CPUおよびGPUコンピューティングの両方を考慮して、後者が前者に対して利益を上げることができるシナリオを特徴づける。
実際、ここで提案した学習表検索手順を自然に補完するアルゴリズム的パラダイムを定式化し、既知の学習表検索手順の大部分を、単純な線形回帰を近似した「学習フェーズ」を持つものとして特徴付ける。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sorted Table Search Procedures are the quintessential query-answering tool,
with widespread usage that now includes also Web Applications, e.g, Search
Engines (Google Chrome) and ad Bidding Systems (AppNexus). Speeding them up, at
very little cost in space, is still a quite significant achievement. Here we
study to what extend Machine Learning Techniques can contribute to obtain such
a speed-up via a systematic experimental comparison of known efficient
implementations of Sorted Table Search procedures, with different Data Layouts,
and their Learned counterparts developed here. We characterize the scenarios in
which those latter can be profitably used with respect to the former,
accounting for both CPU and GPU computing. Our approach contributes also to the
study of Learned Data Structures, a recent proposal to improve the time/space
performance of fundamental Data Structures, e.g., B-trees, Hash Tables, Bloom
Filters. Indeed, we also formalize an Algorithmic Paradigm of Learned
Dichotomic Sorted Table Search procedures that naturally complements the
Learned one proposed here and that characterizes most of the known Sorted Table
Search Procedures as having a "learning phase" that approximates Simple Linear
Regression.
- Abstract(参考訳): ソートされたテーブル検索プロシージャは、クエリ処理ツールとして必須であり、現在、検索エンジン(google chrome)や広告入札システム(appnexus)など、webアプリケーションを含む広く利用されている。
スピードアップは、宇宙でのコストが極めて少ないが、それでも非常に大きな成果だ。
本稿では,データレイアウトの異なるソートテーブル探索手順の既知の効率的な実装と,そこで開発された学習対象の体系的比較を通じて,機械学習技術がどのような速度向上に寄与するかについて検討する。
我々は、CPUおよびGPUコンピューティングの両方を考慮して、後者が前者に対して利益を上げることができるシナリオを特徴づける。
我々のアプローチは、B木、ハッシュテーブル、ブルームフィルタといった基本データ構造の性能を改善するための最近の提案である学習データ構造の研究にも貢献する。
実際、我々は、ここで提案する学習済みのテーブル探索手順を自然に補完し、既知のソートされたテーブル探索手順のほとんどを単純な線形回帰に近似する「学習段階」を持つことを特徴付ける学習ディコトミックソートテーブル探索手順のアルゴリズムパラダイムを定式化する。
関連論文リスト
- Efficient Retrieval with Learned Similarities [2.729516456192901]
最先端の検索アルゴリズムは、学習された類似点に移行した。
筆者らは,Mixture-of-Logits (MoL) が普遍近似であり,学習された類似度関数を全て表現できることを示した。
MoLはレコメンデーション検索タスクに新たな最先端結果を設定し、学習した類似性を持つ近似トップk検索は、最大2桁のレイテンシでベースラインを上回ります。
論文 参考訳(メタデータ) (2024-07-22T08:19:34Z) - Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.241569810013836]
大規模言語モデル(LLM)と決定木推論(OCTree)に基づく新しいフレームワークを提案する。
私たちのキーとなるアイデアは、LLMの推論機能を活用して、手動で検索スペースを指定せずに優れた特徴生成ルールを見つけることです。
実験の結果、この単純なフレームワークは様々な予測モデルの性能を一貫して向上させることが示された。
論文 参考訳(メタデータ) (2024-06-12T08:31:34Z) - Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - From Specific to Generic Learned Sorted Set Dictionaries: A
Theoretically Sound Paradigm Yelding Competitive Data Structural Boosters in
Practice [0.0]
我々は学習されたセット辞書に焦点をあてる。
我々は、既知の専門用語を補完する新しいパラダイムを提案し、任意のSorted Set Dictionaryの学習版を作成できる。
論文 参考訳(メタデータ) (2023-09-02T13:52:53Z) - A Learned Index for Exact Similarity Search in Metric Spaces [25.330353637669386]
LIMSは、学習したインデックスを構築するために、データクラスタリングとピボットベースのデータ変換技術を使用することが提案されている。
機械学習モデルはディスク上の各データレコードの位置を近似するために開発された。
実世界のデータセットと合成データセットに関する大規模な実験は、従来の指標と比較してLIMSの優位性を示している。
論文 参考訳(メタデータ) (2022-04-21T11:24:55Z) - CrossBeam: Learning to Search in Bottom-Up Program Synthesis [51.37514793318815]
ボトムアップ合成のためのハンズオン検索ポリシーを学習するためのニューラルネットワークのトレーニングを提案する。
私たちのアプローチは、CrossBeamと呼ばれ、ニューラルモデルを使用して、以前に探索されたプログラムを新しいプログラムに組み合わせる方法を選択します。
我々はCrossBeamが効率的に検索することを学び、最先端技術と比較してプログラム空間のより小さな部分を探索する。
論文 参考訳(メタデータ) (2022-03-20T04:41:05Z) - Standard Vs Uniform Binary Search and Their Variants in Learned Static
Indexing: The Case of the Searching on Sorted Data Benchmarking Software
Platform [0.0]
学習者にとって、bf SOSDソフトウェアに関して、標準ルーチンの使用はUniformよりも優れていることを示す。
実験の結果,一様二項探索とk-ary Searchは学習空間の節約に有用であることが示唆された。
論文 参考訳(メタデータ) (2022-01-05T11:46:16Z) - Ranking Cost: Building An Efficient and Scalable Circuit Routing Planner
with Evolution-Based Optimization [49.207538634692916]
そこで我々は、効率よくトレーニング可能なルータを形成するための新しい回路ルーティングアルゴリズム、Randing Costを提案する。
提案手法では,A*ルータが適切な経路を見つけるのに役立つコストマップと呼ばれる新しい変数群を導入する。
我々のアルゴリズムはエンドツーエンドで訓練されており、人工データや人間の実演は一切使用しない。
論文 参考訳(メタデータ) (2021-10-08T07:22:45Z) - Learned Sorted Table Search and Static Indexes in Small Space:
Methodological and Practical Insights via an Experimental Study [0.0]
Sorted Table Search プロシージャはクインテシデントなクエリ検索ツールだが,それでも非常に有用だ。
検索するテーブルに関して、小さな追加スペースでそれらをスピードアップすることは、依然として非常に大きな成果である。
一定あるいはほぼ一定の追加空間を使用しながら、学習のスピードアップをどの程度楽しむことができるかは、大きな疑問である。
論文 参考訳(メタデータ) (2021-07-19T16:06:55Z) - The Case for Learned Spatial Indexes [62.88514422115702]
我々は、空間範囲の問合せに答えるために、最先端の学習した多次元インデックス構造(すなわちFlood)から提案した手法を用いる。
i) パーティション内の機械学習検索は、1次元でフィルタリングを使用する場合の2進探索よりも11.79%速く、39.51%高速であることを示す。
また、2次元でフィルタする最も近い競合相手の1.23倍から1.83倍の速さで機械学習インデックスを精査する。
論文 参考訳(メタデータ) (2020-08-24T12:09:55Z) - Progressively Pretrained Dense Corpus Index for Open-Domain Question
Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。
本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文 参考訳(メタデータ) (2020-04-30T18:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。