論文の概要: Reinforcement Learning for Adaptive Video Compressive Sensing
- arxiv url: http://arxiv.org/abs/2105.08205v1
- Date: Tue, 18 May 2021 00:01:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-19 14:15:20.922449
- Title: Reinforcement Learning for Adaptive Video Compressive Sensing
- Title(参考訳): 適応型ビデオ圧縮センシングのための強化学習
- Authors: Sidi Lu, Xin Yuan, Aggelos K Katsaggelos, Weisong Shi
- Abstract要約: 映像圧縮センシングに強化学習を適用し,圧縮比を適応させる。
video snapshot compressive imaging (sci) は低速カメラを用いて高速ビデオを撮影する。
- 参考スコア(独自算出の注目度): 23.143370657334447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We apply reinforcement learning to video compressive sensing to adapt the
compression ratio. Specifically, video snapshot compressive imaging (SCI),
which captures high-speed video using a low-speed camera is considered in this
work, in which multiple (B) video frames can be reconstructed from a snapshot
measurement. One research gap in previous studies is how to adapt B in the
video SCI system for different scenes. In this paper, we fill this gap
utilizing reinforcement learning (RL). An RL model, as well as various
convolutional neural networks for reconstruction, are learned to achieve
adaptive sensing of video SCI systems. Furthermore, the performance of an
object detection network using directly the video SCI measurements without
reconstruction is also used to perform RL-based adaptive video compressive
sensing. Our proposed adaptive SCI method can thus be implemented in low cost
and real time. Our work takes the technology one step further towards real
applications of video SCI.
- Abstract(参考訳): 映像圧縮センシングに強化学習を適用し,圧縮比を適応させる。
具体的には、低速カメラを用いて高速映像を撮影するビデオスナップショット圧縮画像(SCI)について、スナップショット計測から複数の(B)ビデオフレームを再構成できると考えられる。
前回の研究では、異なる場面でビデオSCIシステムにBを適応する方法が研究の欠如となっている。
本稿では,強化学習(RL)を用いて,このギャップを埋める。
再構成のための様々な畳み込みニューラルネットワークと同様にrlモデルが学習され、ビデオsciシステムの適応的センシングを実現する。
さらに、再構成のないビデオSCI測定を直接使用したオブジェクト検出ネットワークの性能を用いて、RLに基づく適応的なビデオ圧縮センシングを行う。
したがって,提案手法は低コストかつリアルタイムに実現可能である。
我々の研究は、ビデオSCIの実際の応用に向けて一歩前進する。
関連論文リスト
- Deep Optics for Video Snapshot Compressive Imaging [10.830072985735175]
ビデオ・スナップショット・イメージング(SCI)は、2D検出器の1枚のショットだけでビデオ・フレームのシーケンスをキャプチャすることを目的としている。
本稿では,マスクと再構成ネットワークを協調的に最適化する枠組みを提案する。
これは、現実世界のビデオSCIのマイルストーンだ、と私たちは信じている。
論文 参考訳(メタデータ) (2024-04-08T08:04:44Z) - Progressive Fourier Neural Representation for Sequential Video
Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。
本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。
我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文 参考訳(メタデータ) (2023-06-20T06:02:19Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - EfficientSCI: Densely Connected Network with Space-time Factorization
for Large-scale Video Snapshot Compressive Imaging [6.8372546605486555]
圧縮率の高いUHDカラービデオは,PSNRが32dB以上である単一エンドツーエンドのディープラーニングモデルを用いて,スナップショット2次元計測から再構成可能であることを示す。
提案手法は,従来のSOTAアルゴリズムよりも性能が優れ,リアルタイム性能が向上した。
論文 参考訳(メタデータ) (2023-05-17T07:28:46Z) - Frozen CLIP Models are Efficient Video Learners [86.73871814176795]
ビデオ認識はエンドツーエンドの学習パラダイムに支配されている。
Contrastive Vision-Language Pre-Trainingの最近の進歩は、視覚認識タスクのための新しいルートの道を開く。
高品質なビデオ認識モデルを直接トレーニングする効率的なフレームワークである、効率的なビデオ学習を提案する。
論文 参考訳(メタデータ) (2022-08-06T17:38:25Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - 10-mega pixel snapshot compressive imaging with a hybrid coded aperture [48.95666098332693]
高解像度画像は私たちの日常生活で広く使われているが、高解像度モードで動作するカメラのフレームレートが低いため、高速ビデオ撮影は困難である。
既存の撮像システムの低スループット化への解決策として、スナップショットイメージング(SCI)が提案された。
論文 参考訳(メタデータ) (2021-06-30T01:09:24Z) - Self-Supervised Adaptation for Video Super-Resolution [7.26562478548988]
シングルイメージスーパーリゾリューション(SISR)ネットワークは、特定の入力画像にネットワークパラメータを適応させることができます。
従来のビデオスーパーレゾリューション(VSR)ネットワークがビデオフレームをテストするためにパラメータを適応できるようにする新しい学習アルゴリズムを紹介します。
論文 参考訳(メタデータ) (2021-03-18T08:30:24Z) - Memory-Efficient Network for Large-scale Video Compressive Sensing [21.040260603729227]
ビデオスナップショットイメージング(SCI)は、2D検出器を用いて1枚のショットで一連のビデオフレームをキャプチャする。
本稿では,マルチグループ可逆3次元畳み込みニューラルネットワークに基づく大規模映像SCIのためのメモリ効率の良いネットワークを開発する。
論文 参考訳(メタデータ) (2021-03-04T15:14:58Z) - Plug-and-Play Algorithms for Video Snapshot Compressive Imaging [41.818167109996885]
低速2dセンサ(検出器)を用いたスナップショット映像撮影(sci)の再構成問題を考える。
SCIの基本原則は、異なるマスクを持つフレームを変調し、エンコードされたフレームをセンサーのスナップショットに統合することです。
私たちの日常生活で大規模な問題(HDまたはUHDビデオ)にSCIを適用することは、まだ1つのボトルネックが再構築アルゴリズムにあります。
論文 参考訳(メタデータ) (2021-01-13T00:51:49Z) - An Emerging Coding Paradigm VCM: A Scalable Coding Approach Beyond
Feature and Signal [99.49099501559652]
Video Coding for Machine (VCM)は、視覚的特徴圧縮と古典的なビデオ符号化のギャップを埋めることを目的としている。
我々は,学習した動きパターンのガイダンスを用いて,映像フレームを再構成するために条件付き深層生成ネットワークを用いる。
予測モデルを介してスパース動作パターンを抽出することを学ぶことにより、特徴表現をエレガントに活用し、符号化されたフレームの外観を生成する。
論文 参考訳(メタデータ) (2020-01-09T14:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。