論文の概要: STABLE: Efficient Hybrid Nearest Neighbor Search via Magnitude-Uniformity and Cardinality-Robustness
- arxiv url: http://arxiv.org/abs/2604.01617v1
- Date: Thu, 02 Apr 2026 04:52:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.361954
- Title: STABLE: Efficient Hybrid Nearest Neighbor Search via Magnitude-Uniformity and Cardinality-Robustness
- Title(参考訳): STABLE: マグニチュード・ユニモーティと心拍・ロバストネスによる効率的なハイブリッド近傍探索
- Authors: Qianyun Yang, Zhiwei Chen, Yupeng Hu, Zixu Li, Zhiheng Fu, Liqiang Nie,
- Abstract要約: Hybrid ANNS (Hybrid Approximate Nearest Neighbor Search) は、大規模な異種データに対する基礎的な検索技術である。
本稿では, 類似性マグニチュード不均一性に対する適合性バリアと, 属性心に対する耐性ボトルネックを克服するためのrobuSt heTerogeneity-Aware hyBrid retrievaL framEwork, STABLEを提案する。
- 参考スコア(独自算出の注目度): 59.119196450578364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hybrid Approximate Nearest Neighbor Search (Hybrid ANNS) is a foundational search technology for large-scale heterogeneous data and has gained significant attention in both academia and industry. However, current approaches overlook the heterogeneity in data distribution, thus ignoring two major challenges: the Compatibility Barrier for Similarity Magnitude Heterogeneity and the Tolerance Bottleneck to Attribute Cardinality. To overcome these issues, we propose the robuSt heTerogeneity-Aware hyBrid retrievaL framEwork, STABLE, designed for accurate, efficient, and robust hybrid ANNS under datasets with various distributions. Specifically, we introduce an enhAnced heterogeneoUs semanTic perceptiOn (AUTO) metric to achieve a joint measurement of feature similarity and attribute consistency, addressing similarity magnitude heterogeneity and improving robustness to datasets with various attribute cardinalities. Thereafter, we construct our Heterogeneous sEmantic reLation graPh (HELP) index based on AUTO to organize heterogeneous semantic relations. Finally, we employ a novel Dynamic Heterogeneity Routing method to ensure an efficient search. Extensive experiments on five feature vector benchmarks with various attribute cardinalities demonstrate the superior performance of STABLE.
- Abstract(参考訳): Hybrid ANNS (Hybrid Approximate Nearest Neighbor Search) は、大規模な異種データの基盤検索技術であり、学術と産業の両方で注目されている。
しかし、現在のアプローチではデータ分散の不均一性を見落としており、類似性マグニチュード・ヘテロジネリティの適合性障壁(Compatibility Barrier for similarity Magnitude Heterogeneity)とアトリビュート・カーディナリティに対するトレランス・ボトルネック(Tolerance Bottleneck to Attribute Cardinality)という2つの大きな課題を無視している。
これらの課題を克服するために、様々な分布を持つデータセットの下で、正確で効率的で堅牢なハイブリッドANNSを設計したrobuSt heTerogeneity-Aware hyBrid retrievaL framEwork, STABLEを提案する。
具体的には,特徴の類似度と属性の整合性を共同で測定し,類似度の大きさの異質性に対処し,様々な属性属性を持つデータセットに対するロバスト性を向上させるために,enhAnced heterogeneoUs semanTic perceptiOn(AUTO)メトリクスを導入する。
その後、AUTOに基づく異種semantic reLation graPh(HELP)インデックスを構築し、異種意味関係を整理する。
最後に、効率的な探索を保証するために、新しい動的不均質ルーティング手法を用いる。
様々な属性基数を持つ5つの特徴ベクトルベンチマークの大規模な実験は、STABLEの優れた性能を示している。
関連論文リスト
- Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.05209293008078]
クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム
HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文 参考訳(メタデータ) (2026-03-03T08:13:16Z) - Beyond Homophily: Community Search on Heterophilic Graphs [9.691955358608537]
コミュニティ検索は、あるクエリに最も関連性の高い、洗練されたノードのセットを特定することを目的としている。
ホモ親和グラフとは異なり、多くの実世界のネットワークは異種ノードを主に接続する異種ネットワークである。
i)マルチホップ信号とマルチ周波数信号を分離し、スムーズな(ホモ親和性)とコントラストな(ヘテロ親和性)の関係を捕捉するAdaptCS、(ii)主要な計算ボトルネックを除去するメモリ効率の低い低ランク最適化、(iii)オンライン検索をガイドするAdaptive Community Score(ACS)の3つの主要な設計を特徴とする統合フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-05T00:44:17Z) - HeFS: Helper-Enhanced Feature Selection via Pareto-Optimized Genetic Search [10.751560953850925]
HeFS(Helper-Enhanced Feature Selection)フレームワークを導入し、既存のアルゴリズムによって生成された特徴サブセットを洗練する。
HeFSは、元のサブセットを補完し、分類性能を改善する機能であるヘルパーセットを特定するために、残りの機能空間を体系的に検索する。
18のベンチマークデータセットでの実験では、HFSは一貫して情報のある機能を識別し、最先端のメソッドよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-21T12:30:22Z) - Domain-specific Question Answering with Hybrid Search [39.85176264551715]
本研究では,細調整された高密度検索器とキーワードベーススパース検索を併用したハイブリッド手法により,性能が著しく向上することを示す。
実験結果から, このハイブリッド方式は, シングルレトリバーシステムより優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-12-04T22:04:13Z) - Weighted Diversified Sampling for Efficient Data-Driven Single-Cell Gene-Gene Interaction Discovery [56.622854875204645]
本稿では,遺伝子・遺伝子相互作用の探索に先進的なトランスフォーマーモデルを活用する,データ駆動型計算ツールを活用した革新的なアプローチを提案する。
新たな重み付き多様化サンプリングアルゴリズムは、データセットのたった2パスで、各データサンプルの多様性スコアを算出する。
論文 参考訳(メタデータ) (2024-10-21T03:35:23Z) - Histopathology Whole Slide Image Analysis with Heterogeneous Graph
Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。
具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。
我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-07-09T14:43:40Z) - Unsupervised Heterogeneous Coupling Learning for Categorical
Representation [50.1603042640492]
この研究は、結合間の相互作用を解き放ち、結合したカテゴリデータを表現するためのUNTIE(UNsupervised heTerogeneous couplIng lEarning)アプローチを導入する。
UNTIEは、ヘテロジニアスおよび階層的値-オブジェクト結合の教師なし表現学習のために、カーネルk平均目的関数を効率よく最適化する。
UNTIEで学習した表現は、最先端のカテゴリ表現やディープ表現モデルに対して大幅な性能改善を行う。
論文 参考訳(メタデータ) (2020-07-21T11:23:27Z) - Stable and consistent density-based clustering via multiparameter persistence [49.1574468325115]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。