論文の概要: GPU-Accelerated Optimizer-Aware Evaluation of Submodular Exemplar
Clustering
- arxiv url: http://arxiv.org/abs/2101.08763v1
- Date: Thu, 21 Jan 2021 18:23:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:50:42.864360
- Title: GPU-Accelerated Optimizer-Aware Evaluation of Submodular Exemplar
Clustering
- Title(参考訳): GPU加速オプティマイザ-サブモジュール外乱クラスタリングの評価
- Authors: Philipp-Jan Honysz, Sebastian Buschj\"ager, Katharina Morik
- Abstract要約: サブモジュール関数の最適化は、クラスタリングを実行する実行可能な方法を構成する。
強近似保証と実現可能な最適化 w.r.t.
ストリーミングデータはこのクラスタリングアプローチが好都合です
exemplarベースのクラスタリングは、可能なサブモジュラー関数の1つであるが、高い計算複雑性に苦しむ。
半精度のGPU計算は、シングル精度のシングルスレッドCPU計算と比較して452倍の高速化を実現した。
- 参考スコア(独自算出の注目度): 5.897728689802829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The optimization of submodular functions constitutes a viable way to perform
clustering. Strong approximation guarantees and feasible optimization w.r.t.
streaming data make this clustering approach favorable. Technically, submodular
functions map subsets of data to real values, which indicate how
"representative" a specific subset is. Optimal sets might then be used to
partition the data space and to infer clusters. Exemplar-based clustering is
one of the possible submodular functions, but suffers from high computational
complexity. However, for practical applications, the particular real-time or
wall-clock run-time is decisive. In this work, we present a novel way to
evaluate this particular function on GPUs, which keeps the necessities of
optimizers in mind and reduces wall-clock run-time. To discuss our GPU
algorithm, we investigated both the impact of different run-time critical
problem properties, like data dimensionality and the number of data points in a
subset, and the influence of required floating-point precision. In reproducible
experiments, our GPU algorithm was able to achieve competitive speedups of up
to 72x depending on whether multi-threaded computation on CPUs was used for
comparison and the type of floating-point precision required. Half-precision
GPU computation led to large speedups of up to 452x compared to
single-precision, single-thread CPU computations.
- Abstract(参考訳): 部分モジュラ関数の最適化はクラスタリングを実行するための実行可能な方法を構成する。
強近似保証と実現可能な最適化 w.r.t.
ストリーミングデータはこのクラスタリングアプローチが好都合です
技術的には、サブモジュラ関数はデータのサブセットを実際の値にマップする。
最適なセットは、データ空間を分割し、クラスタを推論するために使われる。
exemplarベースのクラスタリングは、可能なサブモジュラー関数の1つであるが、高い計算複雑性に苦しむ。
しかし、実用的なアプリケーションでは、特定のリアルタイムまたはウォールクロックのランタイムが決定的です。
本稿では,GPU上での特定の機能の評価方法を提案する。これは最適化器の必要を念頭に置いて,ウォールタイムの実行時間を短縮する。
我々は,データ次元やサブセット内のデータポイント数など,異なる実行時臨界問題特性の影響と,必要な浮動小数点精度の影響について検討した。
再現可能な実験では,CPU上のマルチスレッド計算を比較対象とし,浮動小数点精度のタイプに応じて,最大72倍の競合高速化を実現した。
半精度のGPU計算は、シングル精度のシングルスレッドCPU計算と比較して452倍の高速化を実現した。
関連論文リスト
- GPU-accelerated Faster Mean Shift with euclidean distance metrics [1.3507758562554621]
平均シフトアルゴリズムはクラスタリング問題の解法として広く用いられている。
従来の研究では,GPUを高速化する高速平均シフトアルゴリズムが提案されている。
本研究では,ユークリッド距離測定値を扱うために,従来のアルゴリズムを拡張し改良する。
論文 参考訳(メタデータ) (2021-12-27T20:18:24Z) - AdaPool: Exponential Adaptive Pooling for Information-Retaining
Downsampling [82.08631594071656]
畳み込み層は畳み込みニューラルネットワーク(CNN)の重要な構成要素である
適応的で指数関数的に重み付けされたアダプール法を提案する。
adaPoolは画像やビデオの分類やオブジェクト検出など,さまざまなタスクを通じて,ディテールの保存性の向上を実証する。
論文 参考訳(メタデータ) (2021-11-01T08:50:37Z) - Accelerating Genetic Programming using GPUs [0.0]
遺伝的プログラミング(GP)は、曲線フィッティング、データモデリング、特徴選択、分類など、機械学習に複数の応用がある。
本稿では,代用GPアルゴリズムのGPUアクセラレーションスタックに基づく変種について述べる。
論文 参考訳(メタデータ) (2021-10-15T06:13:01Z) - Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous
Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。
本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2021-10-13T20:58:15Z) - Implementation of Parallel Simplified Swarm Optimization in CUDA [2.322689362836168]
最適化コンピューティングでは、インテリジェントなSwarmアルゴリズム(SIAs)が並列化に適している。
本稿では,計算能力と汎用性を考慮したGPUに基づくSimplified Swarm Algorithm Optimization (PSSO)を提案する。
結果から,Nの次数による時間複雑性の低減が達成され,資源プリエンプションの問題は完全に回避された。
論文 参考訳(メタデータ) (2021-10-01T00:15:45Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Why Approximate Matrix Square Root Outperforms Accurate SVD in Global
Covariance Pooling? [59.820507600960745]
本稿では,前方通過のSVDと後方伝播のPad'e近似を用いて勾配を計算する新しいGCPメタ層を提案する。
提案するメタレイヤは,さまざまなCNNモデルに統合され,大規模および微細なデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-06T08:03:45Z) - Bayesian Algorithm Execution: Estimating Computable Properties of
Black-box Functions Using Mutual Information [78.78486761923855]
多くの現実世界では、T関数の評価の予算を考えると、高価なブラックボックス関数 f の性質を推測したい。
本稿では,アルゴリズムの出力に対して相互情報を最大化するクエリを逐次選択する手法InfoBAXを提案する。
これらの問題に対してInfoBAXは、元のアルゴリズムで要求されるより500倍少ないクエリをfに使用する。
論文 参考訳(メタデータ) (2021-04-19T17:22:11Z) - Structured Inverted-File k-Means Clustering for High-Dimensional Sparse
Data [2.487445341407889]
本稿では,大規模かつ高次元スパースデータセットのためのアーキテクチャフレンドリーなk-meansクラスタリングアルゴリズムsivfを提案する。
性能解析の結果,sivfはキャッシュミス数と分岐予測の精度低下係数を低減し,高い速度を実現していることがわかった。
論文 参考訳(メタデータ) (2021-03-30T07:54:02Z) - Parameter-free Locally Accelerated Conditional Gradients [91.19349793915615]
私たちは小説を紹介します。
自由局所加速cg(pf-lacg)アルゴリズムは,厳密な収束保証を提供する。
我々の理論結果は,局所加速度を実証し,非加速アルゴリズムに対するPF-LaCGの実用的改善を示す数値実験によって補完される。
論文 参考訳(メタデータ) (2021-02-12T22:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。