論文の概要: Lossy Event Compression based on Image-derived Quad Trees and Poisson
Disk Sampling
- arxiv url: http://arxiv.org/abs/2005.00974v2
- Date: Tue, 1 Dec 2020 07:41:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 06:50:13.045660
- Title: Lossy Event Compression based on Image-derived Quad Trees and Poisson
Disk Sampling
- Title(参考訳): 画像由来のクワッドツリーとポアソンディスクサンプリングに基づく損失イベント圧縮
- Authors: Srutarshi Banerjee, Zihao W. Wang, Henry H. Chopp, Oliver Cossairt,
Aggelos Katsaggelos
- Abstract要約: 隣接する強度画像から得られたクワッドツリー(QT)セグメンテーションマップに基づく新しいイベント圧縮アルゴリズムを提案する。
提案アルゴリズムは,最先端技術と比較して6倍以上の圧縮を実現する。
- 参考スコア(独自算出の注目度): 6.5364852148089545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With several advantages over conventional RGB cameras, event cameras have
provided new opportunities for tackling visual tasks under challenging
scenarios with fast motion, high dynamic range, and/or power constraint. Yet
unlike image/video compression, the performance of event compression algorithm
is far from satisfying and practical. The main challenge for compressing events
is the unique event data form, i.e., a stream of asynchronously fired event
tuples each encoding the 2D spatial location, timestamp, and polarity (denoting
an increase or decrease in brightness). Since events only encode temporal
variations, they lack spatial structure which is crucial for compression. To
address this problem, we propose a novel event compression algorithm based on a
quad tree (QT) segmentation map derived from the adjacent intensity images. The
QT informs 2D spatial priority within the 3D space-time volume. In the event
encoding step, events are first aggregated over time to form polarity-based
event histograms. The histograms are then variably sampled via Poisson Disk
Sampling prioritized by the QT based segmentation map. Next, differential
encoding and run length encoding are employed for encoding the spatial and
polarity information of the sampled events, respectively, followed by Huffman
encoding to produce the final encoded events. Our Poisson Disk Sampling based
Lossy Event Compression (PDS-LEC) algorithm performs rate-distortion based
optimal allocation. On average, our algorithm achieves greater than 6x
compression compared to the state of the art.
- Abstract(参考訳): 従来のrgbカメラよりもいくつかの利点があるため、イベントカメラは高速動作、高ダイナミックレンジ、および/またはパワー制約を伴う困難なシナリオで視覚タスクに取り組む新しい機会を提供している。
しかし、画像/ビデオ圧縮とは異なり、イベント圧縮アルゴリズムの性能は満足感と実用性には程遠い。
イベントを圧縮する主な課題は、ユニークなイベントデータ形式、すなわち2次元の空間的位置、タイムスタンプ、極性(明るさの増加または減少を意味する)をそれぞれ符号化する非同期に発生したイベントタプルのストリームである。
事象は時間変化のみをエンコードするため、圧縮に不可欠な空間構造が欠如している。
この問題に対処するために,隣接する強度画像から得られたクアッドツリー(QT)セグメンテーションマップに基づく新しいイベント圧縮アルゴリズムを提案する。
QTは3次元時空間ボリューム内の2次元空間優先度を通知する。
イベントエンコーディングステップでは、イベントは時間とともに集約され、極性に基づくイベントヒストグラムを形成する。
ヒストグラムは、QTベースのセグメンテーションマップによって優先順位付けされたPoisson Disk Smplingを介して可変サンプリングされる。
次に、サンプルイベントの空間情報と極性情報をそれぞれ符号化するために差分符号化とラン長符号化を用い、次いでHuffman符号化を用いて最終符号化イベントを生成する。
我々のpoisson disk sampling based lossy event compression (pds-lec) アルゴリズムはレート分散に基づく最適割り当てを行う。
平均して、このアルゴリズムは芸術の状況と比較して6倍以上の圧縮を達成している。
関連論文リスト
- Large Language Models for Lossless Image Compression: Next-Pixel Prediction in Language Space is All You Need [53.584140947828004]
前例のないインテリジェンスを持つ言語大モデル(LLM)は、様々なデータモダリティのための汎用ロスレス圧縮機である。
P$2$-LLMは,様々な入念な洞察と方法論を統合した次世代の予測型LLMである。
ベンチマークデータセットの実験では、P$2$-LLMがSOTAの古典的および学習的コーデックに勝ることを示した。
論文 参考訳(メタデータ) (2024-11-19T12:15:40Z) - bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction [57.199618102578576]
疎二分量時間画像データから高画質の画像スタックを元の解像度で再構成する新しい方法であるbit2bitを提案する。
Poisson denoisingの最近の研究に触発されて、スパースバイナリ光子データから高密度な画像列を生成するアルゴリズムを開発した。
本研究では,様々な課題の画像条件下でのSPADの高速映像を多種多種に含む新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-10-30T17:30:35Z) - Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration [9.547947845734992]
イベントカメラはバイオインスパイアされたセンサーで、強度の変化を非同期に捉え、イベントストリームを出力する。
本稿では, PAST-Act と呼ばれる新しいフレームワークを提案する。
私たちはまた、コミュニティの利益のために任意の期間で、ArDVS100という名前の分レベルのイベントベースの認識データセットを構築しました。
論文 参考訳(メタデータ) (2024-09-25T14:08:37Z) - Compression of Structured Data with Autoencoders: Provable Benefit of
Nonlinearities and Depth [83.15263499262824]
勾配勾配勾配は入力のスパース構造を完全に無視する解に収束することを示す。
浅層構造にデノナイジング関数を付加することにより,スパースデータの圧縮におけるガウス性能の改善方法を示す。
CIFAR-10 や MNIST などの画像データセットに対して,本研究の成果を検証した。
論文 参考訳(メタデータ) (2024-02-07T16:32:29Z) - Neural-based Compression Scheme for Solar Image Data [8.374518151411612]
我々は、NASAのデータ集約画像ミッションで使用されるニューラルネットワークに基づく損失圧縮手法を提案する。
本研究では,画像の局所構造と大域構造の両方を捉えるために,局所的および非局所的アテンションモジュールを備えた逆トレーニングニューラルネットワークを提案する。
このアルゴリズムをSDOデータ解析に使用するための概念実証として、圧縮画像を用いてコロナホール(CH)検出を行った。
論文 参考訳(メタデータ) (2023-11-06T04:13:58Z) - Graph-based Asynchronous Event Processing for Rapid Object Recognition [59.112755601918074]
イベントカメラは、各イベントがピクセル位置、トリガ時間、明るさの極性が変化するような非同期イベントストリームをキャプチャする。
イベントカメラのための新しいグラフベースのフレームワーク、SlideGCNを紹介した。
当社のアプローチでは、データをイベント単位で効率的に処理し、内部でグラフの構造を維持しながら、イベントデータの低レイテンシ特性を解放することが可能です。
論文 参考訳(メタデータ) (2023-08-28T08:59:57Z) - EfficientSCI: Densely Connected Network with Space-time Factorization
for Large-scale Video Snapshot Compressive Imaging [6.8372546605486555]
圧縮率の高いUHDカラービデオは,PSNRが32dB以上である単一エンドツーエンドのディープラーニングモデルを用いて,スナップショット2次元計測から再構成可能であることを示す。
提案手法は,従来のSOTAアルゴリズムよりも性能が優れ,リアルタイム性能が向上した。
論文 参考訳(メタデータ) (2023-05-17T07:28:46Z) - A Novel Approach for Neuromorphic Vision Data Compression based on Deep
Belief Network [0.2578242050187029]
ニューロモルフィックカメラ(Neuromorphic camera)は、人間の目が局所的な明るさの変化だけを捉えているイメージセンサーである。
本稿では,イベントデータに対する深層学習に基づく新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:21:14Z) - Exploring Long- and Short-Range Temporal Information for Learned Video
Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。
本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。
この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。
本稿では,マルチスケール補償を実現する階層構造を設計する。
論文 参考訳(メタデータ) (2022-08-07T15:57:18Z) - Fast-Vid2Vid: Spatial-Temporal Compression for Video-to-Video Synthesis [40.249030338644225]
映像合成 (Vid2Vid) は, セマンティックマップのシーケンスから写真リアルな映像を生成することで, 顕著な成果を上げている。
Fast-Vid2Vidは20 FPSのリアルタイムパフォーマンスを実現し、1つのV100 GPUで約8倍の計算コストを節約する。
論文 参考訳(メタデータ) (2022-07-11T17:57:57Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。