論文の概要: kANNolo: Sweet and Smooth Approximate k-Nearest Neighbors Search
- arxiv url: http://arxiv.org/abs/2501.06121v1
- Date: Fri, 10 Jan 2025 17:19:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:25:59.819915
- Title: kANNolo: Sweet and Smooth Approximate k-Nearest Neighbors Search
- Title(参考訳): kANNolo: Sweet and Smooth Approximate k-Nearest Neighbors Search
- Authors: Leonardo Delfino, Domenico Erriquez, Silvio Martinico, Franco Maria Nardini, Cosimo Rulli, Rossano Venturini,
- Abstract要約: ANN(Approximate Nearest Neighbors)検索は、レコメンダシステムや情報検索など、いくつかのアプリケーションにおいて重要なタスクである。
現在の最先端のANNライブラリはパフォーマンス指向だが、モジュール化と使いやすさに欠けることが多い。
我々は、Rustで書かれた新しい研究指向のANNライブラリであるkANNoloを紹介し、ユーザビリティとパフォーマンスを効果的に組み合わせるように明示的に設計した。
- 参考スコア(独自算出の注目度): 5.394883109521642
- License:
- Abstract: Approximate Nearest Neighbors (ANN) search is a crucial task in several applications like recommender systems and information retrieval. Current state-of-the-art ANN libraries, although being performance-oriented, often lack modularity and ease of use. This translates into them not being fully suitable for easy prototyping and testing of research ideas, an important feature to enable. We address these limitations by introducing kANNolo, a novel research-oriented ANN library written in Rust and explicitly designed to combine usability with performance effectively. kANNolo is the first ANN library that supports dense and sparse vector representations made available on top of different similarity measures, e.g., euclidean distance and inner product. Moreover, it also supports vector quantization techniques, e.g., Product Quantization, on top of the indexing strategies implemented. These functionalities are managed through Rust traits, allowing shared behaviors to be handled abstractly. This abstraction ensures flexibility and facilitates an easy integration of new components. In this work, we detail the architecture of kANNolo and demonstrate that its flexibility does not compromise performance. The experimental analysis shows that kANNolo achieves state-of-the-art performance in terms of speed-accuracy trade-off while allowing fast and easy prototyping, thus making kANNolo a valuable tool for advancing ANN research. Source code available on GitHub: https://github.com/TusKANNy/kannolo.
- Abstract(参考訳): ANN(Approximate Nearest Neighbors)検索は、レコメンダシステムや情報検索など、いくつかのアプリケーションにおいて重要なタスクである。
現在の最先端のANNライブラリはパフォーマンス指向だが、モジュール化と使いやすさに欠けることが多い。
これは、研究アイデアのプロトタイプ作成やテストに完全には適していないことを意味します。
これはRustで書かれた新しい研究指向のANNライブラリで、ユーザビリティとパフォーマンスを効果的に組み合わせるように設計されています。
kANNoloは、例えばユークリッド距離と内積の異なる類似度尺度で利用可能な密度とスパースベクトル表現をサポートする最初のANNライブラリである。
さらに、実装されたインデックス化戦略の上に、例えば製品量子化(Product Quantization)といったベクトル量子化技術もサポートしています。
これらの機能はRustのトレイトを通じて管理され、共有された振る舞いを抽象的に処理できる。
この抽象化により、柔軟性が保証され、新しいコンポーネントの容易な統合が容易になる。
本稿では,kANNoloのアーキテクチャを詳述し,その柔軟性が性能を損なうものではないことを実証する。
実験により,kANNoloは高速かつ容易なプロトタイピングが可能でありながら,速度精度のトレードオフの観点から最先端の性能を達成でき,これによりkANNoloはANN研究を進展させる貴重なツールとなることが示された。
GitHubで公開されているソースコードは、https://github.com/TusKANNy/kannolo。
関連論文リスト
- Practice with Graph-based ANN Algorithms on Sparse Data: Chi-square
Two-tower model, HNSW, Sign Cauchy Projections [17.542394573133777]
グラフベースのANNアルゴリズムを用いてスパースデータの効率的な探索を探索する。
広告ターゲティングでは、標準のコサイン2-tower'モデルで埋め込みを訓練する。
また,Chi-square two-tower' モデルも開発している。
論文 参考訳(メタデータ) (2023-06-13T08:05:30Z) - Towards Better Dynamic Graph Learning: New Architecture and Unified
Library [29.625205125350313]
DyGFormerは、動的グラフ学習のためのTransformerベースのアーキテクチャである。
DyGLibは、標準のトレーニングパイプラインとコーディングインターフェースを備えた統一ライブラリである。
論文 参考訳(メタデータ) (2023-03-23T05:27:32Z) - NASiam: Efficient Representation Learning using Neural Architecture
Search for Siamese Networks [76.8112416450677]
シームズネットワークは、自己教師付き視覚表現学習(SSL)を実現するための最も傾向のある方法の1つである。
NASiamは、初めて微分可能なNASを使用して、多層パーセプトロンプロジェクタと予測器(エンコーダ/予測器ペア)を改善する新しいアプローチである。
NASiamは、小規模(CIFAR-10/CIFAR-100)と大規模(画像Net)画像分類データセットの両方で競合性能を達成し、わずか数GPU時間しかかからない。
論文 参考訳(メタデータ) (2023-01-31T19:48:37Z) - Searching a High-Performance Feature Extractor for Text Recognition
Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。
空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。
本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T03:49:04Z) - NAS-Bench-Graph: Benchmarking Graph Neural Architecture Search [55.75621026447599]
NAS-Bench-Graphは、GraphNASの統一的、再現可能、効率的な評価をサポートする調整されたベンチマークである。
具体的には,26,206のユニークなグラフニューラルネットワーク(GNN)アーキテクチャを網羅した,統一的で表現力のあるコンパクトな検索空間を構築する。
提案したベンチマークに基づいて,GNNアーキテクチャの性能を検索テーブルから直接取得できるが,それ以上の計算は行わない。
論文 参考訳(メタデータ) (2022-06-18T10:17:15Z) - Sionna: An Open-Source Library for Next-Generation Physical Layer
Research [64.77840557164266]
Sionnaは、レイカーネルに基づいたリンクレベルシミュレーションのためのGPUアクセラレーションされたオープンソースライブラリである。
Sionnaは、ベンチマークやエンドツーエンドのパフォーマンス評価に使用できる、注意深くテストされた最先端のアルゴリズムを幅広く実装している。
論文 参考訳(メタデータ) (2022-03-22T16:31:44Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - FuncNN: An R Package to Fit Deep Neural Networks Using Generalized Input
Spaces [0.0]
関数型ニューラルネットワーク(FuncNN)ライブラリは、あらゆるプログラミング言語で最初のパッケージである。
本稿では,モデルの構築や予測,クロスバリデーションの実行を容易にする機能を紹介する。
論文 参考訳(メタデータ) (2020-09-18T22:32:29Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。