論文の概要: Mesorasi: Architecture Support for Point Cloud Analytics via
Delayed-Aggregation
- arxiv url: http://arxiv.org/abs/2008.06967v1
- Date: Sun, 16 Aug 2020 18:11:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 11:57:46.902529
- Title: Mesorasi: Architecture Support for Point Cloud Analytics via
Delayed-Aggregation
- Title(参考訳): Mesorasi: 遅延集約によるポイントクラウド分析のアーキテクチャサポート
- Authors: Yu Feng, Boyuan Tian, Tiancheng Xu, Paul Whatmough, Yuhao Zhu
- Abstract要約: ポイントクラウド分析は、バッテリ駆動の組み込みおよびモバイルプラットフォームにおける重要なワークロードになる可能性がある。
本稿では,ポイントクラウド解析の性能とエネルギー効率を向上させるアルゴリズムアーキテクチャの共同設計システムであるMesorasiを提案する。
- 参考スコア(独自算出の注目度): 7.5528453044217665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point cloud analytics is poised to become a key workload on battery-powered
embedded and mobile platforms in a wide range of emerging application domains,
such as autonomous driving, robotics, and augmented reality, where efficiency
is paramount. This paper proposes Mesorasi, an algorithm-architecture
co-designed system that simultaneously improves the performance and energy
efficiency of point cloud analytics while retaining its accuracy. Our extensive
characterizations of state-of-the-art point cloud algorithms show that, while
structurally reminiscent of convolutional neural networks (CNNs), point cloud
algorithms exhibit inherent compute and memory inefficiencies due to the unique
characteristics of point cloud data. We propose delayed-aggregation, a new
algorithmic primitive for building efficient point cloud algorithms.
Delayed-aggregation hides the performance bottlenecks and reduces the compute
and memory redundancies by exploiting the approximately distributive property
of key operations in point cloud algorithms. Delayed-aggregation let point
cloud algorithms achieve 1.6x speedup and 51.1% energy reduction on a mobile
GPU while retaining the accuracy (-0.9% loss to 1.2% gains). To maximize the
algorithmic benefits, we propose minor extensions to contemporary CNN
accelerators, which can be integrated into a mobile Systems-on-a-Chip (SoC)
without modifying other SoC components. With additional hardware support,
Mesorasi achieves up to 3.6x speedup.
- Abstract(参考訳): point cloud analyticsは、自動運転、ロボティクス、拡張現実など、さまざまな新興アプリケーションドメインにおいて、バッテリー駆動の組み込みおよびモバイルプラットフォームにおいて、効率が最重要となる重要なワークロードになる。
本稿では,その精度を維持しつつ,ポイントクラウド解析の性能とエネルギー効率を同時に向上するアルゴリズムアーキテクチャの共同設計システムであるMesorasiを提案する。
我々の最先端のポイントクラウドアルゴリズムの特徴は、構造的に畳み込みニューラルネットワーク(CNN)を連想させるが、ポイントクラウドアルゴリズムは、ポイントクラウドデータのユニークな特徴のため、固有の計算とメモリの非効率を示す。
効率的なポイントクラウドアルゴリズムを構築するための新しいアルゴリズムプリミティブである遅延集約を提案する。
遅延集約はパフォーマンスボトルネックを隠蔽し、ポイントクラウドアルゴリズムにおけるキー操作のほぼ分散性を利用して計算とメモリ冗長性を低減します。
遅延集約 ポイントクラウドアルゴリズムは、精度(-0.9%の損失から1.2%のゲイン)を維持しながら、モバイルGPU上で1.6倍のスピードアップと51.1%のエネルギー削減を達成する。
アルゴリズムの利点を最大化するために,他のSoCコンポーネントを変更することなく,モバイルシステム・オン・チップ(SoC)に統合可能な,現代のCNNアクセラレータのマイナー拡張を提案する。
追加のハードウェアサポートにより、Mesorasiは最大3.6倍のスピードアップを達成する。
関連論文リスト
- Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning [49.91297276176978]
私たちは小説を提案します。
ポイントGST (Point GST) と呼ばれる点雲の効率的な微細調整法。
ポイントGSTは事前トレーニングされたモデルを凍結し、スペクトル領域のパラメータを微調整するためのトレーニング可能なポイントクラウドスペクトルアダプタ(PCSA)を導入する。
挑戦的なポイントクラウドデータセットに関する大規模な実験は、ポイントGSTが完全に微調整されたデータセットを上回るだけでなく、トレーニング可能なパラメータを大幅に削減することを示した。
論文 参考訳(メタデータ) (2024-10-10T17:00:04Z) - DIPR: Efficient Point Cloud Registration via Dynamic Iteration [4.491867613612359]
我々は、ダイナミックイットフレームワークであるDIPRを通じて、スペーサー入力ポイントに基づくオーバーラップポイントに対話的にフォーカスする、新しい効率的なポイントクラウド登録を導入する。
提案手法は,最先端手法と比較して計算時間とGPUメモリ消費を大幅に削減しつつ,優れた登録精度を実現する。
論文 参考訳(メタデータ) (2023-12-05T16:47:46Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - PointAttN: You Only Need Attention for Point Cloud Completion [89.88766317412052]
ポイント・クラウド・コンプリート(Point cloud completion)とは、部分的な3次元ポイント・クラウドから3次元の形状を完成させることである。
そこで我々は,kNNを除去するために,ポイントクラウドをポイント単位に処理する新しいニューラルネットワークを提案する。
提案するフレームワークであるPointAttNはシンプルで簡潔で効果的であり、3次元形状の構造情報を正確に捉えることができる。
論文 参考訳(メタデータ) (2022-03-16T09:20:01Z) - POEM: 1-bit Point-wise Operations based on Expectation-Maximization for
Efficient Point Cloud Processing [53.74076015905961]
我々は,効率的なポイントクラウド処理のために,期待最大化に基づくポイントワイズ処理をBNNに導入する。
私たちのPOEMは、最先端のバイナリポイントクラウドネットワークを6.7%まで大きく上回っている。
論文 参考訳(メタデータ) (2021-11-26T09:45:01Z) - DRINet++: Efficient Voxel-as-point Point Cloud Segmentation [41.89569852619741]
DRINet++はDRINetを拡張し、voxel-as-pointの原則で点雲の空間性と幾何学的性質を向上させる。
我々の最先端のアウトドア・ポイント・クラウド・セグメンテーションはコンバージェンスを実現し、メモリ消費問題を緩和する。
論文 参考訳(メタデータ) (2021-11-16T09:22:15Z) - Joint Parameter-and-Bandwidth Allocation for Improving the Efficiency of
Partitioned Edge Learning [73.82875010696849]
機械学習アルゴリズムは、人工知能(AI)モデルをトレーニングするために、ネットワークエッジにデプロイされる。
本稿では,パラメータ(計算負荷)割り当てと帯域幅割り当ての新しい共同設計に焦点を当てる。
論文 参考訳(メタデータ) (2020-03-10T05:52:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。