Fugu-MT 論文翻訳(概要): Programmable Silicon Retina on Pixel Processor Array

論文の概要: Programmable Silicon Retina on Pixel Processor Array

arxiv url: http://arxiv.org/abs/2606.08370v1
Date: Sat, 06 Jun 2026 23:10:48 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:42:06.065647
Title: Programmable Silicon Retina on Pixel Processor Array
Title（参考訳）: ピクセルプロセッサアレイ上でのプログラマブルシリコン網膜
Authors: Maciej Lewandowski, Prince Philip, Alexandre Marcireau, Chetan Singh Thakur, André van Schaik, Piotr Dudek,
Abstract要約: SCAMP-5 Pixel Processor Array上で,マルチステージシリコン網膜モデルの最初の実装について述べる。我々は,映像強度再構成と映像塩分率予測におけるモデルの性能評価を行った。結果は、シリコン網膜の「情報蒸留」機構が下流のニューラルネットワークをより効率的に表現できることを示唆している。
参考スコア（独自算出の注目度）: 42.80978894922492
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Standard dynamic vision sensors approximate retinal processing by detecting temporal contrast changes, offering high speed and high dynamic range. In this work, we explore whether incorporating additional biologically inspired processing stages - specifically spatial filtering and gain control - can offer advantages for certain downstream tasks such as saliency prediction. We present the first implementation of a multi-stage Silicon Retina model on the SCAMP-5 Pixel Processor Array, along with a GPU-based simulation framework. We evaluate the performance of our model on Video Intensity Reconstruction and Video Saliency Prediction. While the bio-inspired model is less effective at reconstructing absolute intensity frames, it achieves a 13\% reduction in saliency prediction loss in comparison to standard DVS event representation, while reducing the event rate by approximately 47\%. These experiments are obtained using a lightweight $\approx 100$k-parameter FireNet-style network, adapted from event-based reconstruction to saliency prediction. These results suggest that the silicon retina's "information distillation" mechanism can achieve a more efficient representation for downstream neural networks, particularly in bandwidth-constrained edge applications.
Abstract（参考訳）: 標準ダイナミックビジョンセンサは、時間的コントラスト変化を検出して網膜処理を近似し、高速かつ高ダイナミックレンジを提供する。本研究では,生物にインスパイアされた処理段階(特に空間フィルタリングとゲイン制御)を取り入れることで,サリエンシ予測などの下流タスクにメリットがもたらされるかどうかを考察する。我々は、GPUベースのシミュレーションフレームワークとともに、SCAMP-5 Pixel Processor Array上に多段階シリコン網膜モデルの最初の実装を示す。我々は,映像強度再構成と映像塩分率予測におけるモデルの性能評価を行った。バイオインスパイアされたモデルは絶対強度フレームの再構築にはあまり効果がないが,標準のDVSイベント表現と比較して,13倍のサリエンシ予測損失を減少させ,イベントレートを約47倍に削減する。これらの実験は、イベントベースの再構築から正当性予測に適応した軽量な$\approx 100$k-parameter FireNetスタイルのネットワークを用いて得られる。これらの結果は、シリコン網膜の「情報蒸留」機構が、特に帯域幅に制約のあるエッジアプリケーションにおいて、下流ニューラルネットワークのより効率的な表現を実現することを示唆している。

関連論文リスト

$D^3$-RSMDE: 40$\times$ Faster and High-Fidelity Remote Sensing Monocular Depth Estimation [72.9912717963138]
リモートセンシング画像からのリアルタイムで高忠実な単眼深度推定は、多くのアプリケーションにとって不可欠である。視覚変換器(ViT)のバックボーンを高密度な予測に使用するのは速いが、知覚品質は低いことが多い。リモートセンシング単眼深度推定のための深度詳細拡散法(D3$-RSMDE)を提案する。 D3$-RSMDEは、Learninged Perceptual Image Patch similarity (LPIPS)の知覚距離を11.85%削減する。
論文参考訳（メタデータ） (2026-03-17T10:50:36Z)
Enhancing Eye Feature Estimation from Event Data Streams through Adaptive Inference State Space Modeling [68.1289208938377]
イベントベースのデータストリームから目の特徴抽出を効率的かつ低エネルギーで行うことができる。本稿では,特徴抽出のための新しいアーキテクチャである強調型推論状態空間モデル(AISSM)を紹介する。また、トレーニング効率を向上させる新しい学習手法を開発・評価する。
論文参考訳（メタデータ） (2026-03-14T18:47:08Z)
Dynamic Graph Induced Contour-aware Heat Conduction Network for Event-based Object Detection [42.021851148914145]
イベントベースのビジョンセンサー(EVS)は、低照度環境で従来のRGBフレームベースのカメラに対して大きな優位性を示している。本稿では,イベントストリームに基づく物体検出のための動的グラフ誘導輪郭対応熱伝導ネットワークを提案する。
論文参考訳（メタデータ） (2025-05-19T09:44:01Z)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-29T19:02:54Z)
Optimal OnTheFly Feedback Control of Event Sensors [0.14999444543328289]
イベントベースの視覚センサは、ピクセル強度の変動が閾値を超えるとトリガされるイベントの非同期ストリームを生成する。本稿では,過去のイベントをコントローラネットワークが解析する,アクティベーションしきい値の動的フィードバック制御手法を提案する。本手法は,LPIPSの知覚的画像差度測定値において,固定的およびランダムに変化する閾値スキームを6～12%向上させることを示した。
論文参考訳（メタデータ） (2024-08-23T10:49:16Z)
Finding Visual Saliency in Continuous Spike Stream [23.591309376586835]
本稿では,連続スパイク流における視覚的塩分濃度を初めて検討する。本稿では,フルスパイクニューラルネットワークに基づくRecurrent Spiking Transformerフレームワークを提案する。我々のフレームワークは、スパイクストリームにおける視覚的サリエンシの強調とキャプチャにおいて、大幅に改善されている。
論文参考訳（メタデータ） (2024-03-10T15:15:35Z)
DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文参考訳（メタデータ） (2023-12-12T06:07:21Z)
SpikeSEE: An Energy-Efficient Dynamic Scenes Processing Framework for Retinal Prostheses [3.794154439461156]
本研究では,スパイク表現符号化技術とバイオインスパイクされたスパイキングリカレントニューラルネットワーク(SRNN)モデルを組み合わせたエネルギー効率の高い動的シーン処理フレームワーク(SpikeSEE)を提案する。提案したSpikeSEEは,よりエネルギー消費の少ないガングリオン細胞の応答をより正確に予測する。
論文参考訳（メタデータ） (2022-09-16T12:46:10Z)
Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-10-16T12:36:23Z)
Optimisation of a Siamese Neural Network for Real-Time Energy Efficient Object Tracking [0.0]
組込み視覚システムのためのSiameseニューラルネットワークを用いた視覚物体追跡の最適化について述べる。提案手法は,高解像度ビデオストリームに対して,リアルタイムに動作するものと推定された。
論文参考訳（メタデータ） (2020-07-01T13:49:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。