論文の概要: Inverted-File k-Means Clustering: Performance Analysis
- arxiv url: http://arxiv.org/abs/2002.09094v1
- Date: Fri, 21 Feb 2020 02:20:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 00:33:36.353956
- Title: Inverted-File k-Means Clustering: Performance Analysis
- Title(参考訳): 逆ファイルk-meansクラスタリング:パフォーマンス分析
- Authors: Kazuo Aoyama, Kazumi Saito, and Tetsuo Ikeda
- Abstract要約: inverted-file k-means clustering algorithm (IVF) は、潜在的に多数のクラスを持つ大規模なスパースデータセットに適したアルゴリズムである。
我々は,IVFが設計アルゴリズムよりも優れた性能を実現することを実験的に実証した。
- 参考スコア(独自算出の注目度): 1.3955252961896318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an inverted-file k-means clustering algorithm (IVF)
suitable for a large-scale sparse data set with potentially numerous classes.
Given such a data set, IVF efficiently works at high-speed and with low memory
consumption, which keeps the same solution as a standard Lloyd's algorithm. The
high performance arises from two distinct data representations. One is a sparse
expression for both the object and mean feature vectors. The other is an
inverted-file data structure for a set of the mean feature vectors. To confirm
the effect of these representations, we design three algorithms using distinct
data structures and expressions for comparison. We experimentally demonstrate
that IVF achieves better performance than the designed algorithms when they are
applied to large-scale real document data sets in a modern computer system
equipped with superscalar out-of-order processors and a deep hierarchical
memory system. We also introduce a simple yet practical clock-cycle per
instruction (CPI) model for speed-performance analysis. Analytical results
reveal that IVF suppresses three performance degradation factors: the numbers
of cache misses, branch mispredictions, and the completed instructions.
- Abstract(参考訳): 本稿では,多数のクラスを持つ大規模スパースデータセットに適した逆ファイルk平均クラスタリングアルゴリズム(IVF)を提案する。
このようなデータセットが与えられた場合、IVFは高速かつ低メモリ消費で効率的に動作し、標準のロイドアルゴリズムと同じ解を維持する。
ハイパフォーマンスは2つの異なるデータ表現から生じる。
1つはオブジェクトと平均特徴ベクトルの両方に対するスパース式である。
もう1つは、平均特徴ベクトルのセットに対する逆ファイルデータ構造である。
これらの表現の効果を確認するために、異なるデータ構造と比較式を用いた3つのアルゴリズムを設計する。
超スカラーアウトオブオーダプロセッサと深い階層型メモリシステムを備えた現代のコンピュータシステムにおいて,大規模実文書データセットに適用した場合,ivfは設計したアルゴリズムよりも優れた性能を実現することを実験的に実証した。
また,命令ごとのクロックサイクル(CPI)モデルを導入し,高速化解析を行った。
解析結果から、IVFはキャッシュミスの数、分岐予測、完了命令の3つの性能劣化を抑えることが明らかとなった。
関連論文リスト
- Compact Neural Graphics Primitives with Learned Hash Probing [100.07267906666293]
学習したプローブを持つハッシュテーブルにはデメリットはなく,その結果,サイズと速度の組合せが好適であることを示す。
推論は、トレーニングが1.2-2.6倍遅い間、同じ品質で未処理のハッシュテーブルよりも高速である。
論文 参考訳(メタデータ) (2023-12-28T18:58:45Z) - Efficient Match Pair Retrieval for Large-scale UAV Images via Graph
Indexed Global Descriptor [9.402103660431791]
本稿では,効率的なマッチングペア検索手法を提案し,並列SfM再構成のための統合ワークフローを実装した。
提案手法は3つの大規模データセットを用いて検証されている。
論文 参考訳(メタデータ) (2023-07-10T12:41:55Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Rethinking Space-Time Networks with Improved Memory Coverage for
Efficient Video Object Segmentation [68.45737688496654]
各オブジェクトのマスク特徴を再エンコードすることなく,フレーム間の直接対応性を確立する。
対応によって、現在のクエリフレーム内の全てのノードは、過去の特徴を連想的に集約することによって推測される。
すべてのメモリノードにコントリビュートする機会があることを検証し、そのような多彩な投票がメモリ効率と推論精度の両方に有益であることを示した。
論文 参考訳(メタデータ) (2021-06-09T16:50:57Z) - Structured Inverted-File k-Means Clustering for High-Dimensional Sparse
Data [2.487445341407889]
本稿では,大規模かつ高次元スパースデータセットのためのアーキテクチャフレンドリーなk-meansクラスタリングアルゴリズムsivfを提案する。
性能解析の結果,sivfはキャッシュミス数と分岐予測の精度低下係数を低減し,高い速度を実現していることがわかった。
論文 参考訳(メタデータ) (2021-03-30T07:54:02Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - DHOG: Deep Hierarchical Object Grouping [0.0]
本研究では,相互情報量(勾配最適化など)を最大化するための欲求的あるいは局所的手法が,相互情報量規準の局所的最適性を発見することを示す。
本稿では,画像の多数の異なる表現を階層的順序で計算するディープ階層的オブジェクトグループ化(DHOG)を提案する。
これらの表現は、下層のオブジェクトクラスにグループ化する下流のタスクとよく一致している。
論文 参考訳(メタデータ) (2020-03-13T14:11:48Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。