論文の概要: Q-Segment: Segmenting Images In-Sensor for Vessel-Based Medical
Diagnosis
- arxiv url: http://arxiv.org/abs/2312.09854v1
- Date: Fri, 15 Dec 2023 15:01:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 15:16:01.633076
- Title: Q-Segment: Segmenting Images In-Sensor for Vessel-Based Medical
Diagnosis
- Title(参考訳): Q-Segment: 血管型診断のためのイメージインセンサー
- Authors: Pietro Bonazzi, Julian Moosmann, Yawei Li, Sizhen Bian, Michele Magno
- Abstract要約: 本稿では、量子化されたリアルタイムセグメンテーションアルゴリズム「Q-Segment」を提案し、2つの低消費電力エッジビジョンプラットフォームに対して包括的評価を行う。
Q-セグメントは1.9msの超低推論時間と5.7mJのエネルギー消費を達成する。
この研究は、エッジベースのイメージセグメンテーションに関する貴重な洞察をもたらし、低消費電力環境に適した効率的なアルゴリズムの基礎を築いた。
- 参考スコア(独自算出の注目度): 11.917014372788584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the growing interest in deploying deep learning models
directly in-sensor. We present "Q-Segment", a quantized real-time segmentation
algorithm, and conduct a comprehensive evaluation on two low-power edge vision
platforms, namely Sony IMX500, which has an in-sensors processor, and Sony
Spresense, a low-power multi-core ARM Cortex-M microcontroller. One of the main
goals of the model is to achieve end-to-end image segmentation for vessel-based
medical diagnosis. Deployed on the IMX500 platform, Q-Segment achieves
ultra-low inference time in-sensor of only 1.9 ms and energy consumption of
only 5.7 mJ. We compare the proposed network with outperforming existing
networks on various platforms by a factor of 75x (compared to ERFNet). The
network architecture employs an encoder-decoder structure with skip
connections, and results in a binary accuracy of 97.25% and an Area Under the
Receiver Operating Characteristic Curve (AUC) of 96.97% on the CHASE dataset.
This research contributes valuable insights into edge-based image segmentation,
laying the foundation for efficient algorithms tailored to low-power
environments.
- Abstract(参考訳): 本稿では,ディープラーニングモデルを直接センサに展開することへの関心が高まっている。
我々は、量子化されたリアルタイムセグメンテーションアルゴリズムである「Q-Segment」を紹介し、低消費電力エッジビジョンプラットフォームであるソニー IMX500と低出力マルチコアARM Cortex-Mマイクロコントローラであるソニー Spresenseを包括的に評価する。
このモデルの主な目的の1つは、血管ベースの診断のためのエンドツーエンドのイメージセグメンテーションを実現することである。
IMX500プラットフォーム上に配備されたQセグメントは、わずか1.9msの超低推論時間とわずか5.7mJのエネルギー消費を達成する。
提案するネットワークと各種プラットフォーム上の既存ネットワークを75倍の性能で比較した(ERFNetと比較)。
ネットワークアーキテクチャでは、接続をスキップするエンコーダ・デコーダ構造を採用しており、2進法の精度は97.25%、受信器動作特性曲線(AUC)は96.97%である。
この研究は、エッジベースのイメージセグメンテーションに関する貴重な洞察をもたらし、低消費電力環境に適した効率的なアルゴリズムの基礎を築いた。
関連論文リスト
- LHU-Net: A Light Hybrid U-Net for Cost-Efficient, High-Performance Volumetric Medical Image Segmentation [4.168081528698768]
医用画像分割のための合理化ハイブリッドU-NetであるLHU-Netを紹介する。
5つのベンチマークデータセットでテストした結果、LHU-Netは優れた効率と精度を示した。
論文 参考訳(メタデータ) (2024-04-07T22:58:18Z) - Gesture Recognition for FMCW Radar on the Edge [0.0]
ジェスチャーは5つの特徴の集合によって効率的に特徴付けられることを示す。
リカレントニューラルネットワーク(RNN)ベースのアーキテクチャは、これらの特徴を利用して、5つの異なるジェスチャーを共同で検出し、分類する。
提案システムでは, ホールドアウトテストデータセットにおいて, 98.4%のF1スコアでジェスチャーを認識する。
論文 参考訳(メタデータ) (2023-10-13T06:03:07Z) - Implementation of a perception system for autonomous vehicles using a
detection-segmentation network in SoC FPGA [0.0]
我々は,MultiTaskV3検出セグメンテーションネットワークを,単一アーキテクチャ内で両方の機能を実現する知覚システムの基礎として用いている。
システム全体の電力消費はCPUベースの実装に比べて比較的少ない。
また、オブジェクト検出のmAPの97%以上、画像分割のmIoUの90%以上を達成している。
論文 参考訳(メタデータ) (2023-07-17T17:44:18Z) - Ultra-low Power Deep Learning-based Monocular Relative Localization
Onboard Nano-quadrotors [64.68349896377629]
この研究は、2つのピアナノドロンのディープニューラルネットワーク(DNN)を介して、単分子の相対的な局所化に対処する、新しい自律的なエンドツーエンドシステムを示す。
超制約ナノドローンプラットフォームに対処するため,データセットの増大,量子化,システム最適化などを含む垂直統合フレームワークを提案する。
実験の結果,DNNは低分解能モノクローム画像のみを用いて最大2mの距離で10cmのターゲットナノドローンを正確に局在させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-03T14:14:08Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Global Context Vision Transformers [78.5346173956383]
我々は,コンピュータビジョンのパラメータと計算利用を向上する新しいアーキテクチャであるGC ViT(Global context vision transformer)を提案する。
本稿では,ViTにおける帰納バイアスの欠如に対処し,アーキテクチャにおける可溶性逆残差ブロックを改良して活用することを提案する。
提案したGC ViTは,画像分類,オブジェクト検出,セマンティックセマンティックセグメンテーションタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-06-20T18:42:44Z) - Rethinking BiSeNet For Real-time Semantic Segmentation [6.622485130017622]
BiSeNetはリアルタイムセグメンテーションのための人気のある2ストリームネットワークであることが証明されている。
本稿では,stdc( short-term dense concatenate network)と呼ばれる新しい構造を提案する。
論文 参考訳(メタデータ) (2021-04-27T13:49:47Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - AnalogNet: Convolutional Neural Network Inference on Analog Focal Plane
Sensor Processors [0.0]
アナログ平面センサプロセッサ(FPSP)と呼ばれるユニークな種類のデバイスの性能を利用した高速でエネルギー効率の良い畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
センサアレイが収集したデータを別のプロセッサに送信して処理する従来のビジョンシステムとは異なり、FPSPは撮像装置自体でデータを処理できる。
提案するアーキテクチャはAnalogNetと呼ばれ,MNISTの手書き文字認識タスクにおいて,1フレームあたり0.7mJの速度で96.9%の精度で動作可能である。
論文 参考訳(メタデータ) (2020-06-02T16:44:43Z) - Near-chip Dynamic Vision Filtering for Low-Bandwidth Pedestrian
Detection [99.94079901071163]
本稿では、ダイナミックビジョンセンサ(DVS)を用いた歩行者検出のための新しいエンドツーエンドシステムを提案する。
我々は、複数のセンサがローカル処理ユニットにデータを送信し、検出アルゴリズムを実行するアプリケーションをターゲットにしている。
我々の検出器は450ミリ秒毎に検出を行うことができ、総合的なテストF1スコアは83%である。
論文 参考訳(メタデータ) (2020-04-03T17:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。