論文の概要: High Performance Hyperspectral Image Classification using Graphics
Processing Units
- arxiv url: http://arxiv.org/abs/2106.12942v1
- Date: Sun, 30 May 2021 09:26:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-27 09:02:34.201056
- Title: High Performance Hyperspectral Image Classification using Graphics
Processing Units
- Title(参考訳): グラフィックス処理ユニットを用いた高性能ハイパースペクトル画像分類
- Authors: Mahmoud Hossam
- Abstract要約: リアルタイムリモートセンシングアプリケーションは、オンボードのリアルタイム処理機能を必要とする。
軽量で小型で低消費電力のハードウェアは、オンボードのリアルタイム処理システムに不可欠である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time remote sensing applications like search and rescue missions,
military target detection, environmental monitoring, hazard prevention and
other time-critical applications require onboard real time processing
capabilities or autonomous decision making. Some unmanned remote systems like
satellites are physically remote from their operators, and all control of the
spacecraft and data returned by the spacecraft must be transmitted over a
wireless radio link. This link may not be available for extended periods when
the satellite is out of line of sight of its ground station. Therefore,
lightweight, small size and low power consumption hardware is essential for
onboard real time processing systems. With increasing dimensionality, size and
resolution of recent hyperspectral imaging sensors, additional challenges are
posed upon remote sensing processing systems and more capable computing
architectures are needed. Graphical Processing Units (GPUs) emerged as
promising architecture for light weight high performance computing that can
address these computational requirements for onboard systems. The goal of this
study is to build high performance methods for onboard hyperspectral analysis.
We propose accelerated methods for the well-known recursive hierarchical
segmentation (RHSEG) clustering method, using GPUs, hybrid multicore CPU with a
GPU and hybrid multi-core CPU/GPU clusters. RHSEG is a method developed by the
National Aeronautics and Space Administration (NASA), which is designed to
provide rich classification information with several output levels. The
achieved speedups by parallel solutions compared to CPU sequential
implementations are 21x for parallel single GPU and 240x for hybrid multi-node
computer clusters with 16 computing nodes. The energy consumption is reduced to
74% using a single GPU compared to the equivalent parallel CPU cluster.
- Abstract(参考訳): 捜索および救助任務、軍事目標検出、環境監視、ハザード防止などのリアルタイムリモートセンシングアプリケーションは、搭載されたリアルタイム処理機能や自律的な意思決定を必要とする。
衛星のような無人の遠隔システムはオペレーターから物理的に遠ざかっており、宇宙船が返した全ての制御とデータを無線無線で送信しなければならない。
このリンクは、衛星が地上局の視界外にある場合、長期間は利用できない可能性がある。
そのため、オンボードリアルタイム処理システムには軽量で小型で低消費電力のハードウェアが不可欠である。
近年のハイパースペクトルイメージングセンサの寸法、サイズ、解像度が向上するにつれて、リモートセンシング処理システムやより有能なコンピューティングアーキテクチャに新たな課題が生まれている。
gpu(graphical processing unit)は軽量高性能コンピューティングのための有望なアーキテクチャとして登場し、オンボードシステムにおけるこれらの計算要件に対処できる。
本研究の目的は,オンボードハイパースペクトル解析のための高性能手法を構築することである。
本稿では,GPUを用いたRHSEGクラスタリング手法,GPUを用いたハイブリッドマルチコアCPU,ハイブリッドマルチコアCPU/GPUクラスタの高速化手法を提案する。
RHSEGはNASA(National Aeronautics and Space Administration)によって開発された手法で、複数の出力レベルを持つ豊富な分類情報を提供するように設計されている。
CPUシーケンシャル実装と比較して達成された並列ソリューションによるスピードアップは、並列シングルGPUで21倍、ハイブリッドマルチノードコンピュータクラスタで16の計算ノードで240倍である。
同等の並列CPUクラスタと比較して、単一のGPUを使用してエネルギー消費量を74%に削減する。
関連論文リスト
- Benchmarking Edge AI Platforms for High-Performance ML Inference [0.0]
エッジコンピューティングは、通信遅延を減らし、リアルタイム処理を可能にする能力から、高性能で異質なSystem-on-Chipソリューションの興隆を促進している。
現在のアプローチでは、現代的なハードウェアをスケールダウンすることが多いが、ニューラルネットワークワークロードのパフォーマンス特性は、大きく異なる場合がある。
我々は、CPUのみ、CPU/GPU、CPU/NPU統合ソリューション間で、様々な線形代数およびニューラルネットワーク推論タスクのレイテンシとスループットを比較した。
論文 参考訳(メタデータ) (2024-09-23T08:27:27Z) - Accelerating AI and Computer Vision for Satellite Pose Estimation on the Intel Myriad X Embedded SoC [3.829322478948514]
本稿では,インテルのMovidius Myriad Xを用いたハイブリッドAI/CVシステムを構築し,衛星の宇宙ミッションにおける姿勢を初期化・追跡する。
提案したシングルチップ,ロバスト推定,リアルタイムソリューションは,2Wの限られたパワーエンベロープ内で,1メガピクセルのRGB画像に対して最大5FPSのスループットを提供する。
論文 参考訳(メタデータ) (2024-09-19T17:50:50Z) - FusionAI: Decentralized Training and Deploying LLMs with Massive
Consumer-Level GPUs [57.12856172329322]
我々は、巨大な未使用のコンシューマレベルのGPUをアンロックする分散システムを構想する。
このシステムは、CPUとGPUメモリの制限、ネットワーク帯域幅の低さ、ピアとデバイスの多様性など、重要な課題に直面している。
論文 参考訳(メタデータ) (2023-09-03T13:27:56Z) - SPEED: Streaming Partition and Parallel Acceleration for Temporal
Interaction Graph Embedding [22.68416593780539]
本稿では,時間的相互作用グラフ埋め込みのためのストリームエッジ分割と並列高速化という,新たなトレーニング手法を提案する。
提案手法は,計算資源,計算時間,下流タスク性能のバランスが良好である。
7つの実世界のデータセットにまたがる実証的な検証は、トレーニング速度を最大19.29倍に向上させる可能性を実証している。
論文 参考訳(メタデータ) (2023-08-27T15:11:44Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - DistGNN: Scalable Distributed Training for Large-Scale Graph Neural
Networks [58.48833325238537]
大規模グラフの構造を学ぶためにGNN(Graph Neural Networks)のフルバッチトレーニングは、実現可能な数百の計算ノードにスケールする必要がある重要な問題です。
本稿では,CPUクラスタ上でのフルバッチトレーニングのためのDGL(Deep Graph Library)を最適化したGNNについて述べる。
4つの一般的なGNNベンチマークデータセットの結果は、1つのCPUソケットを使用して最大3.7倍のスピードアップ、128のCPUソケットを使用して最大97倍のスピードアップを示す。
論文 参考訳(メタデータ) (2021-04-14T08:46:35Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z) - Dataflow Aware Mapping of Convolutional Neural Networks Onto Many-Core
Platforms With Network-on-Chip Interconnect [0.0764671395172401]
マシンインテリジェンス、特に畳み込みニューラルネットワーク(CNN)は、ここ数年で大きな研究領域となっている。
複数の同質なコアで構成される多コアプラットフォームは、データフローマッピングの労力の増大を犠牲にして、物理実装に関する制限を緩和することができる。
この作業は、最小限のランタイムと最小限のオフチップメモリアクセスに対して、最適化目標の異なるシングルコアレベルから始まる自動マッピング戦略を示す。
この戦略は、適切なマルチコアマッピング方式に拡張され、ネットワークオンチップ相互接続によるスケーラブルなシステムレベルシミュレーションを用いて評価される。
論文 参考訳(メタデータ) (2020-06-18T17:13:18Z) - Towards High Performance Java-based Deep Learning Frameworks [0.22940141855172028]
現代のクラウドサービスは、高速で効率的なデータ処理の需要を定めている。
この需要は、ディープラーニング、データマイニング、コンピュータビジョンなど、多くのアプリケーション領域に共通している。
本稿では、JavaベースのディープラーニングフレームワークであるDeep Nettsを透過的に高速化する最先端のプログラミングフレームワークであるTornadoVMを採用しました。
論文 参考訳(メタデータ) (2020-01-13T13:03:13Z) - Efficient Video Semantic Segmentation with Labels Propagation and
Refinement [138.55845680523908]
本稿では,ハイブリッドGPU/CPUを用いた高精細ビデオのリアルタイムセマンティックセマンティックセマンティック化の問題に取り組む。
i) CPU上では、非常に高速な光フロー法であり、ビデオの時間的側面を利用して、あるフレームから次のフレームへ意味情報を伝達するために使用される。
高解像度フレーム(2048 x 1024)を持つ一般的なCityscapesデータセットでは、単一のGPUとCPU上で80から1000Hzの動作ポイントが提案されている。
論文 参考訳(メタデータ) (2019-12-26T11:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。