論文の概要: Edge-InversionNet: Enabling Efficient Inference of InversionNet on Edge
Devices
- arxiv url: http://arxiv.org/abs/2310.09667v2
- Date: Wed, 18 Oct 2023 15:43:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 12:50:14.201786
- Title: Edge-InversionNet: Enabling Efficient Inference of InversionNet on Edge
Devices
- Title(参考訳): Edge-InversionNet:エッジデバイス上でのInversionNetの効率的な推論を実現する
- Authors: Zhepeng Wang, Isaacshubhanand Putla, Weiwen Jiang, Youzuo Lin
- Abstract要約: InversionNetの軽量バージョンを得るために,構造化プルーニングアルゴリズムを採用することを提案する。
計算資源の98.2%の削減を実現し, モデル性能を低下させることができた。
- 参考スコア(独自算出の注目度): 12.131258008566796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Seismic full waveform inversion (FWI) is a widely used technique in
geophysics for inferring subsurface structures from seismic data. And
InversionNet is one of the most successful data-driven machine learning models
that is applied to seismic FWI. However, the high computing costs to run
InversionNet have made it challenging to be efficiently deployed on edge
devices that are usually resource-constrained. Therefore, we propose to employ
the structured pruning algorithm to get a lightweight version of InversionNet,
which can make an efficient inference on edge devices. And we also made a
prototype with Raspberry Pi to run the lightweight InversionNet. Experimental
results show that the pruned InversionNet can achieve up to 98.2 % reduction in
computing resources with moderate model performance degradation.
- Abstract(参考訳): フルウェーブフォームインバージョン(FWI)は、地震データから地下構造を推定するための地球物理学において広く用いられている手法である。
そして、InversionNetは、地震波FWIに適用される最も成功したデータ駆動機械学習モデルの1つである。
しかし、InversionNetを実行するための高いコンピューティングコストは、通常リソース制約のあるエッジデバイスに効率的にデプロイすることを困難にしている。
そこで我々は,inversionnetの軽量化に構造化pruningアルゴリズムを応用し,エッジデバイス上で効率的な推論を実現することを提案する。
また、軽量のInversionNetを動かすためにRaspberry Piでプロトタイプを作りました。
実験の結果,pruned inversionnetは,モデル性能の低下を伴う計算資源の98.2 %削減を達成できることがわかった。
関連論文リスト
- VMGNet: A Low Computational Complexity Robotic Grasping Network Based on VMamba with Multi-Scale Feature Fusion [7.989204276876628]
ロボットグルーピングのための低計算量・高精度モデルVMGNetを提案する。
まず,視覚状態空間をロボットの把握領域に導入し,線形計算複雑性を実現する。
モデルの精度を向上させるために,効率よく軽量なマルチスケール機能融合モジュールを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:07:17Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - SpikeBottleNet: Spike-Driven Feature Compression Architecture for Edge-Cloud Co-Inference [0.86325068644655]
エッジクラウドコ推論システムのための新しいアーキテクチャであるSpikeBottleNetを提案する。
SpikeBottleNetはスパイクニューロンモデルを統合し、エッジデバイスのエネルギー消費を大幅に削減する。
論文 参考訳(メタデータ) (2024-10-11T09:59:21Z) - Accelerating Deep Neural Networks via Semi-Structured Activation
Sparsity [0.0]
ネットワークの機能マップにスパシティを爆発させることは、推論のレイテンシを低減する方法の1つです。
そこで本研究では,セミ構造化されたアクティベーション空間を小さなランタイム修正によって活用する手法を提案する。
当社のアプローチでは,ImageNetデータセット上のResNet18モデルに対して,最小精度が1.1%の1.25倍の速度向上を実現している。
論文 参考訳(メタデータ) (2023-09-12T22:28:53Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Rewarded meta-pruning: Meta Learning with Rewards for Channel Pruning [19.978542231976636]
本稿では,ディープラーニングモデルにおける計算効率向上のためのパラメータとFLOPの削減手法を提案する。
本稿では,ネットワークの精度と計算効率のトレードオフを制御するために,精度と効率係数を導入する。
論文 参考訳(メタデータ) (2023-01-26T12:32:01Z) - Efficient Cluster-Based k-Nearest-Neighbor Machine Translation [65.69742565855395]
k-Nearest-Neighbor Machine Translation (kNN-MT)は、最近、ニューラルネットワーク翻訳(NMT)におけるドメイン適応のための非パラメトリックソリューションとして提案されている。
論文 参考訳(メタデータ) (2022-04-13T05:46:31Z) - Oriented Object Detection with Transformer [51.634913687632604]
我々は,エンドツーエンドネットワークに基づくTRansformer(bf O2DETR$)によるオブジェクト指向オブジェクト検出を実装した。
注意機構を奥行き分離可能な畳み込みに置き換えることで,トランスフォーマーの簡易かつ高効率なエンコーダを設計する。
私たちの$rm O2DETR$は、オブジェクト指向オブジェクト検出の分野における別の新しいベンチマークになり、より高速なR-CNNとRetinaNetに対して最大3.85mAPの改善が達成されます。
論文 参考訳(メタデータ) (2021-06-06T14:57:17Z) - InversionNet3D: Efficient and Scalable Learning for 3D Full Waveform
Inversion [14.574636791985968]
本稿では,3次元FWIのための効率よくスケーラブルなエンコーダデコーダネットワークであるInversionNet3Dを提案する。
提案手法では,エンコーダ内のグループ畳み込みを用いて,複数のソースから情報を得るための効果的な階層を構築する。
3D Kimberlinaデータセットの実験は、InversionNet3Dがベースラインと比較して計算コストとメモリフットプリントを削減できることを示しています。
論文 参考訳(メタデータ) (2021-03-25T22:24:57Z) - ShiftAddNet: A Hardware-Inspired Deep Network [87.18216601210763]
ShiftAddNetはエネルギー効率のよい乗算レスディープニューラルネットワークである。
エネルギー効率のよい推論とトレーニングの両方につながるが、表現能力は損なわれない。
ShiftAddNetは、DNNのトレーニングと推論において、80%以上のハードウェア量子化されたエネルギーコストを積極的に削減し、同等またはより良い精度を提供する。
論文 参考訳(メタデータ) (2020-10-24T05:09:14Z) - BiPointNet: Binary Neural Network for Point Clouds [73.07852523426224]
BiPointNetは、ポイントクラウド上の効率的なディープラーニングのための最初のモデルバイナライズアプローチである。
BiPointNetは、実世界のリソース制約のあるデバイスで14.7倍のスピードアップと18.9倍のストレージを提供する。
論文 参考訳(メタデータ) (2020-10-12T07:54:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。