論文の概要: Lossy Event Compression based on Image-derived Quad Trees and Poisson
Disk Sampling
- arxiv url: http://arxiv.org/abs/2005.00974v2
- Date: Tue, 1 Dec 2020 07:41:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 06:50:13.045660
- Title: Lossy Event Compression based on Image-derived Quad Trees and Poisson
Disk Sampling
- Title(参考訳): 画像由来のクワッドツリーとポアソンディスクサンプリングに基づく損失イベント圧縮
- Authors: Srutarshi Banerjee, Zihao W. Wang, Henry H. Chopp, Oliver Cossairt,
Aggelos Katsaggelos
- Abstract要約: 隣接する強度画像から得られたクワッドツリー(QT)セグメンテーションマップに基づく新しいイベント圧縮アルゴリズムを提案する。
提案アルゴリズムは,最先端技術と比較して6倍以上の圧縮を実現する。
- 参考スコア(独自算出の注目度): 6.5364852148089545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With several advantages over conventional RGB cameras, event cameras have
provided new opportunities for tackling visual tasks under challenging
scenarios with fast motion, high dynamic range, and/or power constraint. Yet
unlike image/video compression, the performance of event compression algorithm
is far from satisfying and practical. The main challenge for compressing events
is the unique event data form, i.e., a stream of asynchronously fired event
tuples each encoding the 2D spatial location, timestamp, and polarity (denoting
an increase or decrease in brightness). Since events only encode temporal
variations, they lack spatial structure which is crucial for compression. To
address this problem, we propose a novel event compression algorithm based on a
quad tree (QT) segmentation map derived from the adjacent intensity images. The
QT informs 2D spatial priority within the 3D space-time volume. In the event
encoding step, events are first aggregated over time to form polarity-based
event histograms. The histograms are then variably sampled via Poisson Disk
Sampling prioritized by the QT based segmentation map. Next, differential
encoding and run length encoding are employed for encoding the spatial and
polarity information of the sampled events, respectively, followed by Huffman
encoding to produce the final encoded events. Our Poisson Disk Sampling based
Lossy Event Compression (PDS-LEC) algorithm performs rate-distortion based
optimal allocation. On average, our algorithm achieves greater than 6x
compression compared to the state of the art.
- Abstract(参考訳): 従来のrgbカメラよりもいくつかの利点があるため、イベントカメラは高速動作、高ダイナミックレンジ、および/またはパワー制約を伴う困難なシナリオで視覚タスクに取り組む新しい機会を提供している。
しかし、画像/ビデオ圧縮とは異なり、イベント圧縮アルゴリズムの性能は満足感と実用性には程遠い。
イベントを圧縮する主な課題は、ユニークなイベントデータ形式、すなわち2次元の空間的位置、タイムスタンプ、極性(明るさの増加または減少を意味する)をそれぞれ符号化する非同期に発生したイベントタプルのストリームである。
事象は時間変化のみをエンコードするため、圧縮に不可欠な空間構造が欠如している。
この問題に対処するために,隣接する強度画像から得られたクアッドツリー(QT)セグメンテーションマップに基づく新しいイベント圧縮アルゴリズムを提案する。
QTは3次元時空間ボリューム内の2次元空間優先度を通知する。
イベントエンコーディングステップでは、イベントは時間とともに集約され、極性に基づくイベントヒストグラムを形成する。
ヒストグラムは、QTベースのセグメンテーションマップによって優先順位付けされたPoisson Disk Smplingを介して可変サンプリングされる。
次に、サンプルイベントの空間情報と極性情報をそれぞれ符号化するために差分符号化とラン長符号化を用い、次いでHuffman符号化を用いて最終符号化イベントを生成する。
我々のpoisson disk sampling based lossy event compression (pds-lec) アルゴリズムはレート分散に基づく最適割り当てを行う。
平均して、このアルゴリズムは芸術の状況と比較して6倍以上の圧縮を達成している。
関連論文リスト
- Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - Spiking Music: Audio Compression with Event Based Auto-encoders [3.7710541619011737]
ニューロンはスパイクと呼ばれる時間的出来事を通じて情報を伝達する。
イベントベースの符号化は音声圧縮に有効であることを示す。
我々は、ピアノ録音の大規模なMAESTROデータセットでこれを検証した。
論文 参考訳(メタデータ) (2024-02-02T17:07:39Z) - Neural-based Compression Scheme for Solar Image Data [8.374518151411612]
我々は、NASAのデータ集約画像ミッションで使用されるニューラルネットワークに基づく損失圧縮手法を提案する。
本研究では,画像の局所構造と大域構造の両方を捉えるために,局所的および非局所的アテンションモジュールを備えた逆トレーニングニューラルネットワークを提案する。
このアルゴリズムをSDOデータ解析に使用するための概念実証として、圧縮画像を用いてコロナホール(CH)検出を行った。
論文 参考訳(メタデータ) (2023-11-06T04:13:58Z) - Graph-based Asynchronous Event Processing for Rapid Object Recognition [59.112755601918074]
イベントカメラは、各イベントがピクセル位置、トリガ時間、明るさの極性が変化するような非同期イベントストリームをキャプチャする。
イベントカメラのための新しいグラフベースのフレームワーク、SlideGCNを紹介した。
当社のアプローチでは、データをイベント単位で効率的に処理し、内部でグラフの構造を維持しながら、イベントデータの低レイテンシ特性を解放することが可能です。
論文 参考訳(メタデータ) (2023-08-28T08:59:57Z) - EfficientSCI: Densely Connected Network with Space-time Factorization
for Large-scale Video Snapshot Compressive Imaging [6.8372546605486555]
圧縮率の高いUHDカラービデオは,PSNRが32dB以上である単一エンドツーエンドのディープラーニングモデルを用いて,スナップショット2次元計測から再構成可能であることを示す。
提案手法は,従来のSOTAアルゴリズムよりも性能が優れ,リアルタイム性能が向上した。
論文 参考訳(メタデータ) (2023-05-17T07:28:46Z) - Dual Memory Aggregation Network for Event-Based Object Detection with
Learnable Representation [79.02808071245634]
イベントベースのカメラはバイオインスパイアされたセンサーで、各ピクセルの明るさ変化を非同期に捉える。
イベントストリームは、正極性と負極性の両方のためにx-y-t座標の格子に分割され、3次元テンソル表現として柱の集合が生成される。
長メモリは適応型convLSTMの隠れ状態に符号化され、短メモリはイベントピラー間の空間的時間的相関を計算することによってモデル化される。
論文 参考訳(メタデータ) (2023-03-17T12:12:41Z) - NeuMap: Neural Coordinate Mapping by Auto-Transdecoder for Camera
Localization [60.73541222862195]
NeuMapは、カメラのローカライゼーションのためのエンドツーエンドのニューラルマッピング手法である。
シーン全体を遅延コードグリッドにエンコードし、Transformerベースのオートデコーダがクエリピクセルの3D座標を回帰する。
論文 参考訳(メタデータ) (2022-11-21T04:46:22Z) - A Novel Approach for Neuromorphic Vision Data Compression based on Deep
Belief Network [0.2578242050187029]
ニューロモルフィックカメラ(Neuromorphic camera)は、人間の目が局所的な明るさの変化だけを捉えているイメージセンサーである。
本稿では,イベントデータに対する深層学習に基づく新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:21:14Z) - Exploring Long- and Short-Range Temporal Information for Learned Video
Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。
本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。
この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。
本稿では,マルチスケール補償を実現する階層構造を設計する。
論文 参考訳(メタデータ) (2022-08-07T15:57:18Z) - Fast-Vid2Vid: Spatial-Temporal Compression for Video-to-Video Synthesis [40.249030338644225]
映像合成 (Vid2Vid) は, セマンティックマップのシーケンスから写真リアルな映像を生成することで, 顕著な成果を上げている。
Fast-Vid2Vidは20 FPSのリアルタイムパフォーマンスを実現し、1つのV100 GPUで約8倍の計算コストを節約する。
論文 参考訳(メタデータ) (2022-07-11T17:57:57Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。