Fugu-MT 論文翻訳(概要): HiRISE: High-Resolution Image Scaling for Edge ML via In-Sensor Compression and Selective ROI

論文の概要: HiRISE: High-Resolution Image Scaling for Edge ML via In-Sensor Compression and Selective ROI

arxiv url: http://arxiv.org/abs/2408.03956v1
Date: Tue, 23 Jul 2024 16:26:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-19 04:27:34.337202
Title: HiRISE: High-Resolution Image Scaling for Edge ML via In-Sensor Compression and Selective ROI
Title（参考訳）: HiRISE: センサー内圧縮と選択ROIによるエッジMLの高分解能イメージスケーリング
Authors: Brendan Reidy, Sepehr Tabrizchi, Mohamadreza Mohammadi, Shaahin Angizi, Arman Roohi, Ramtin Zand,
Abstract要約: エッジ機械学習(ML)のための高解像度画像スケーリングシステムHiRISEを提案する。データ転送とエネルギー消費の最大17.7倍の削減を実現している。
参考スコア（独自算出の注目度）: 1.3757956340051605
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the rise of tiny IoT devices powered by machine learning (ML), many researchers have directed their focus toward compressing models to fit on tiny edge devices. Recent works have achieved remarkable success in compressing ML models for object detection and image classification on microcontrollers with small memory, e.g., 512kB SRAM. However, there remain many challenges prohibiting the deployment of ML systems that require high-resolution images. Due to fundamental limits in memory capacity for tiny IoT devices, it may be physically impossible to store large images without external hardware. To this end, we propose a high-resolution image scaling system for edge ML, called HiRISE, which is equipped with selective region-of-interest (ROI) capability leveraging analog in-sensor image scaling. Our methodology not only significantly reduces the peak memory requirements, but also achieves up to 17.7x reduction in data transfer and energy consumption.
Abstract（参考訳）: 機械学習(ML)を利用した小さなIoTデバイスの台頭により、多くの研究者が、小さなエッジデバイスにフィットするモデルを圧縮することに注力してきた。最近の研究は、小さなメモリを持つマイクロコントローラ、例えば512kB SRAM上でのオブジェクト検出と画像分類のためのMLモデルを圧縮することに成功した。しかし、高解像度画像を必要とするMLシステムの配置を禁止する多くの課題が残っている。小さなIoTデバイスのメモリ容量に根本的な制限があるため、外部ハードウェアなしで大きな画像を保存することは物理的に不可能である。そこで本稿では, アナログインセンサ画像スケーリングを利用するROI機能を備えたHiRISEと呼ばれるエッジMLの高分解能画像スケーリングシステムを提案する。我々の手法はピークメモリの要求を大幅に削減するだけでなく、データ転送とエネルギー消費の最大17.7倍の削減を実現している。

関連論文リスト

PocketSR: The Super-Resolution Expert in Your Pocket Mobiles [69.26751136689533]
リアルワールド・イメージ・スーパーレゾリューション (RealSR) は、携帯電話が捉えたような、Wild内の画像の視覚的品質を高めることを目的としている。大規模な生成モデルを利用する既存の手法は印象的な結果を示しているが、計算コストとレイテンシが高いため、エッジ配置には実用的ではない。超軽量単一ステップモデルであるPocketSRを導入し,高忠実度を維持しつつ生成モデリング機能をRealSRにもたらす。
論文参考訳（メタデータ） (2025-10-03T13:56:18Z)
Ultra-Low Complexity On-Orbit Compression for Remote Sensing Imagery via Block Modulated Imaging [17.334800411037836]
本稿では,リモートセンシング画像圧縮における圧縮センシングの研究を前進させる。 BMI(Block Modulated Imaging)は、1回の露光しか必要とせず、画像取得速度を大幅に向上させる。本稿では,BMIフレームワークで圧縮された画像の再構成に特化して設計された新しい復号化ネットワークを提案する。
論文参考訳（メタデータ） (2024-12-24T13:18:00Z)
ZoomLDM: Latent Diffusion Model for multi-scale image generation [57.639937071834986]
複数のスケールで画像を生成するための拡散モデルZoomLDMを提案する。我々のアプローチの中心は、自己教師あり学習(SSL)埋め込みを利用した、新たな拡大対応条件付け機構である。 ZoomLDMは、すべてのスケールにわたる最先端の画像生成品質を実現し、大きな画像全体のサムネイルを生成するデータスカース設定に優れています。
論文参考訳（メタデータ） (2024-11-25T22:39:22Z)
LiVOS: Light Video Object Segmentation with Gated Linear Matching [116.58237547253935]
LiVOSはリニアアテンションによるリニアマッチングを利用する軽量メモリネットワークである。長くて高解像度のビデオでは、STMベースのメソッドと53%のGPUメモリで一致し、32Gの消費者向けGPU上で4096pの推論をサポートする。
論文参考訳（メタデータ） (2024-11-05T05:36:17Z)
Mondrian: On-Device High-Performance Video Analytics with Compressive Packed Inference [7.624476059109304]
Mondrianは、高解像度ビデオストリーム上で高性能なオブジェクト検出を可能にするエッジシステムである。我々は,1ピクセルあたりの処理コストを最小限に抑えるために,新しい圧縮パッケージ推論を考案した。
論文参考訳（メタデータ） (2024-03-12T12:35:12Z)
MCUFormer: Deploying Vision Transformers on Microcontrollers with Limited Memory [76.02294791513552]
我々はMCUFormerと呼ばれるハードウェア・アルゴリズムの協調最適化手法を提案し、メモリが極端に制限されたマイクロコントローラにビジョントランスフォーマーを配置する。 MCUFormerは320KBのメモリを持つ画像分類のためのImageNet上で73.62%のTop-1精度を実現している。
論文参考訳（メタデータ） (2023-10-25T18:00:26Z)
Memory-Constrained Semantic Segmentation for Ultra-High Resolution UAV Imagery [35.96063342025938]
本稿では,超高解像度UAV画像の高効率・高効率セグメンテーションを実現するための複雑な課題について検討する。本稿では、ローカルパッチ以外のコンテキストにアクセスすることなく、ローカル推論のためのGPUメモリ効率が高く効果的なフレームワークを提案する。基礎となる高解像度情報の潜在的な意味バイアスを補正するために,効率的なメモリベースインタラクション方式を提案する。
論文参考訳（メタデータ） (2023-10-07T07:44:59Z)
MicroISP: Processing 32MP Photos on Mobile Devices with Deep Learning [114.66037224769005]
エッジデバイスに特化して設計された新しいMicroISPモデルを提案する。提案したソリューションは,モバイルMLライブラリを使用して,最新のスマートフォン上で最大32MPの写真を処理できる。モデルのアーキテクチャは柔軟で、計算能力の異なるデバイスに複雑性を調整することができる。
論文参考訳（メタデータ） (2022-11-08T17:40:50Z)
Iterative Patch Selection for High-Resolution Image Recognition [10.847032625429717]
本稿では,メモリ使用量を入力サイズから分離する単純な手法であるIPSを提案する。 IPSは、最も健全なパッチだけを選択してこれを達成し、画像認識のためのグローバルな表現に集約する。本手法は,最小のアクセラレータメモリを使用しながら,異なる領域,トレーニング体制,画像サイズにまたがって高い性能を示し,幅広い適用性を有する。
論文参考訳（メタデータ） (2022-10-24T07:55:57Z)
Memory-Oriented Design-Space Exploration of Edge-AI Hardware for XR Applications [5.529817156718514]
低消費電力エッジAI機能は、Metaverseのビジョンをサポートするためにデバイス上の拡張現実(XR)アプリケーションに不可欠である。本研究は,ハードウェア設計空間探索のためのハンド検出とアイセグメンテーションの2つの代表的XRワークロードについて検討する。どちらのアプリケーションでも、ディープニューラルネットワークをトレーニングし、量子化とハードウェア固有のボトルネックの影響を分析します。最先端の非揮発性メモリ技術(STT/SOT/VGSOT MRAM)をXR-AI推論パイプラインに統合した影響を評価した。
論文参考訳（メタデータ） (2022-06-08T11:18:02Z)
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays [66.62377866022221]
Latent Replay-based Continual Learning (CL)技術は、原則としてオンライン、サーバレスの適応を可能にする。 10コアのFP32対応並列超低消費電力プロセッサをベースとした,エンドツーエンドCLのためのHW/SWプラットフォームを提案する。これらの手法を組み合わせることで,64MB未満のメモリを用いて連続学習を実現することができることを示す。
論文参考訳（メタデータ） (2021-10-20T11:01:23Z)
FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。 Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文参考訳（メタデータ） (2021-08-27T03:07:55Z)
Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文参考訳（メタデータ） (2021-03-25T07:10:46Z)
A Machine Learning Imaging Core using Separable FIR-IIR Filters [2.099922236065961]
完全にトレーニング可能な固定トポロジーニューラルネットワークを使用して、さまざまな画像処理タスクを実行できるモデルを構築します。提案した機械学習イメージングコアはMagICと呼ばれ、シリコン面積は3mm2である。それぞれのMagICコアは56mW(215mW)を500MHzで消費し、エネルギー効率は23TOPS/W/mm2である。
論文参考訳（メタデータ） (2020-01-02T21:24:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。