論文の概要: Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0
- arxiv url: http://arxiv.org/abs/2105.12026v1
- Date: Tue, 25 May 2021 15:55:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 13:56:19.764999
- Title: Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0
- Title(参考訳): Examplar-based Clustering in Industry 4.0
- Authors: Philipp-Jan Honysz and Alexander Schulze-Struchtrup and Sebastian
Buschj\"ager and Katharina Morik
- Abstract要約: 我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
- 参考スコア(独自算出の注目度): 67.80123919697971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data summarizations are a valuable tool to derive knowledge from large data
streams and have proven their usefulness in a great number of applications.
Summaries can be found by optimizing submodular functions. These functions map
subsets of data to real values, which indicate their "representativeness" and
which should be maximized to find a diverse summary of the underlying data. In
this paper, we studied Exemplar-based clustering as a submodular function and
provide a GPU algorithm to cope with its high computational complexity. We
show, that our GPU implementation provides speedups of up to 72x using
single-precision and up to 452x using half-precision computation compared to
conventional CPU algorithms. We also show, that the GPU algorithm not only
provides remarkable runtime benefits with workstation-grade GPUs but also with
low-power embedded computation units for which speedups of up to 35x are
possible. Furthermore, we apply our algorithm to real-world data from injection
molding manufacturing processes and discuss how found summaries help with
steering this specific process to cut costs and reduce the manufacturing of bad
parts. Beyond pure speedup considerations, we show, that our approach can
provide summaries within reasonable time frames for this kind of industrial,
real-world data.
- Abstract(参考訳): データ要約は、巨大なデータストリームから知識を引き出すための貴重なツールであり、多くのアプリケーションでその有用性を証明しています。
要約は、サブモジュラー関数を最適化することで見つけることができる。
これらの関数はデータのサブセットを実際の値にマッピングし、それらの"表現性"を示し、基礎となるデータの多様な要約を見つけるために最大化する。
本稿では,Exemplarベースのクラスタリングをサブモジュール関数として検討し,その計算複雑性に対処するGPUアルゴリズムを提案する。
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
また、GPUアルゴリズムはワークステーショングレードのGPUだけでなく、最大35倍の高速化が可能な低消費電力の組み込み計算ユニットにも優れた実行時利益をもたらすことを示した。
さらに,本アルゴリズムを射出成形プロセスから得られた実世界のデータに適用し,この特定の工程をステアリングすることで,コスト削減と不良部品製造の削減を図っている。
純粋なスピードアップだけでなく、我々のアプローチはこのような産業的で現実世界のデータに対して妥当な時間枠で要約を提供できることを示している。
関連論文リスト
- Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation [4.02235104503587]
本稿では,3次元表現から得られる情報を利用して局所的な特徴を巧みにとらえる。
GPUベースのKDTreeは、素早いビルド、クエリ、プロジェクションの強化を、簡単な操作で実現している。
我々は,本モデルの縮小バージョンが,本格的な最先端モデルに対して強い競争力を示すだけでなく,リアルタイムに動作することを示す。
論文 参考訳(メタデータ) (2024-10-14T13:49:05Z) - Randomized Polar Codes for Anytime Distributed Machine Learning [66.46612460837147]
本稿では,低速な計算ノードに対して堅牢で,線形演算の近似計算と精度の両立が可能な分散コンピューティングフレームワークを提案する。
本稿では,復号化のための計算複雑性を低く保ちながら,実数値データを扱うための逐次復号アルゴリズムを提案する。
大規模行列乗算やブラックボックス最適化など,様々な文脈において,このフレームワークの潜在的な応用を実証する。
論文 参考訳(メタデータ) (2023-09-01T18:02:04Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - Efficient GPU implementation of randomized SVD and its applications [17.71779625877989]
行列分解は、次元データの圧縮やディープラーニングアルゴリズムなど、機械学習においてユビキタスである。
行列分解の典型的な解は、計算コストと時間を大幅に増大させる複雑さを持つ。
我々は,計算行列分解の計算負担を軽減するために,現代のグラフィカル処理ユニット(GPU)で並列に動作する効率的な処理操作を利用する。
論文 参考訳(メタデータ) (2021-10-05T07:42:41Z) - GPU-Accelerated Optimizer-Aware Evaluation of Submodular Exemplar
Clustering [5.897728689802829]
サブモジュール関数の最適化は、クラスタリングを実行する実行可能な方法を構成する。
強近似保証と実現可能な最適化 w.r.t.
ストリーミングデータはこのクラスタリングアプローチが好都合です
exemplarベースのクラスタリングは、可能なサブモジュラー関数の1つであるが、高い計算複雑性に苦しむ。
半精度のGPU計算は、シングル精度のシングルスレッドCPU計算と比較して452倍の高速化を実現した。
論文 参考訳(メタデータ) (2021-01-21T18:23:44Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Fast Object Classification and Meaningful Data Representation of
Segmented Lidar Instances [0.966840768820136]
本稿では,CPU上でのリアルタイムLidarオブジェクトの分類を容易にする手法を提案する。
私たちは、セグメンテーションされたオブジェクトインスタンスを使って重要な特徴を抽出する方法を示します。
提案アルゴリズムは,特定の最適化を使わずに,CPU上でリアルタイムに実行しながら,公開データに対して良好な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-06-17T17:16:38Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。