Fugu-MT 論文翻訳(概要): Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

論文の概要: Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

arxiv url: http://arxiv.org/abs/2603.00611v1
Date: Sat, 28 Feb 2026 12:11:13 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-03 19:50:56.291738
Title: Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark
Title（参考訳）: ビデオレベル圧縮スペクトル再構成のための時空間的特徴伝搬の探索:データセット,モデル,ベンチマーク
Authors: Lijing Cai, Zhan Shi, Chenglong Huang, Jinyao Wu, Qiping Li, Zikang Huo, Linsen Chen, Chongde Zi, Xun Cao,
Abstract要約: SCI(Spectral Compressive Imaging)は、ダイナミックスペクトルビジョンにおいて大きな可能性を秘めている。既存の再建法は、主にイメージベースであり、2つの制限がある。フレーム・バイ・フレームの再構築パラダイムは、ビデオ知覚において重要な時間的一貫性を確保するのに失敗する。
参考スコア（独自算出の注目度）: 22.5556672954071
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recently, Spectral Compressive Imaging (SCI) has achieved remarkable success, unlocking significant potential for dynamic spectral vision. However, existing reconstruction methods, primarily image-based, suffer from two limitations: (i) Encoding process masks spatial-spectral features, leading to uncertainty in reconstructing missing information from single compressed measurements, and (ii) The frame-by-frame reconstruction paradigm fails to ensure temporal consistency, which is crucial in the video perception. To address these challenges, this paper seeks to advance spectral reconstruction from the image level to the video level, leveraging the complementary features and temporal continuity across adjacent frames in dynamic scenes. Initially, we construct the first high-quality dynamic hyperspectral image dataset (DynaSpec), comprising 30 sequences obtained through frame-scanning acquisition. Subsequently, we propose the Propagation-Guided Spectral Video Reconstruction Transformer (PG-SVRT), which employs a spatial-then-temporal attention to effectively reconstruct spectral features from abundant video information, while using a bridged token to reduce computational complexity. Finally, we conduct simulation experiments to assess the performance of four SCI systems, and construct a DD-CASSI prototype for real-world data collection and benchmarking. Extensive experiments demonstrate that PG-SVRT achieves superior performance in reconstruction quality, spectral fidelity, and temporal consistency, while maintaining minimal FLOPs. Project page: https://github.com/nju-cite/DynaSpec
Abstract（参考訳）: 近年、SCI(Spectral Compressive Imaging)は顕著な成功を収めており、ダイナミック・スペクトル・ビジョンにおいて大きな可能性を秘めている。しかし、既存の復元方法は、主にイメージベースであり、2つの制限がある。一空間スペクトルの特徴を符号化し、単一の圧縮測定から欠落情報を再構成する不確実性を引き起こすこと。 (II)フレーム・バイ・フレーム再構築のパラダイムは,映像知覚において重要な時間的一貫性を確保するのに失敗する。これらの課題に対処するため、ダイナミックなシーンにおける隣接フレーム間の相補的特徴と時間的連続性を活用することにより、画像レベルから映像レベルへのスペクトル再構成を推し進める。はじめに,フレームスキャン取得により得られた30のシーケンスからなる,最初の高品質なダイナミックハイパースペクトル画像データセット(DynaSpec)を構築した。次に,空間的注意を生かし,豊富な映像情報からスペクトル特徴を効果的に再構成するPG-SVRT(Propagation-Guided Spectral Video Reconstruction Transformer)を提案する。最後に、4つのSCIシステムの性能評価のためのシミュレーション実験を行い、実世界のデータ収集とベンチマークのためのDD-CASSIプロトタイプを構築した。大規模実験により、PG-SVRTは最小のFLOPを維持しながら、再構成品質、スペクトル忠実度、時間的一貫性において優れた性能を発揮することが示された。プロジェクトページ: https://github.com/nju-cite/DynaSpec

関連論文リスト

One-Shot Refiner: Boosting Feed-forward Novel View Synthesis via One-Step Diffusion [57.824020826432815]
スパース画像から高忠実性ノベルビュー合成(NVS)を実現するための新しいフレームワークを提案する。 ViTバックボーンによって制限されることなく高解像度画像を処理できるデュアルドメイン詳細知覚モジュールを設計する。我々は,修復過程において高周波の詳細を保存できる特徴誘導拡散ネットワークを開発した。
論文参考訳（メタデータ） (2026-01-20T17:11:55Z)
STCDiT: Spatio-Temporally Consistent Diffusion Transformer for High-Quality Video Super-Resolution [60.06664986365803]
我々は,事前学習したビデオ拡散モデルに基づいて構築されたビデオ超解像フレームワークSTCDiTを提案する。複雑なカメラの動きであっても、構造的に忠実で時間的に安定した動画を劣化した入力から復元することを目的としている。
論文参考訳（メタデータ） (2025-11-24T05:37:23Z)
LVTINO: LAtent Video consisTency INverse sOlver for High Definition Video Restoration [3.2944592608677614]
本稿では,VCMで符号化された先行画像を用いた高精細ビデオ再生のための,最初のゼロショット・プラグ・アンド・プレイ逆解器であるLVTINOを提案する。我々の条件付け機構は、自動微分の必要性を回避し、少数のニューラルファンクション評価で最先端のビデオ再構成品質を達成する。
論文参考訳（メタデータ） (2025-10-01T18:10:08Z)
Progressive Flow-inspired Unfolding for Spectral Compressive Imaging [11.638690628451647]
符号化開口スナップショット分光画像(CASSI)は、単一の2次元圧縮計測から3次元ハイパースペクトル画像(HSI)を取得する。近年の深層展開ネットワーク (DUN) はCASSI再建の最先端を達成している。拡散軌跡と流れの整合性に着想を得て,新しい軌道制御可能な展開フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-15T16:10:50Z)
Coarse-Fine Spectral-Aware Deformable Convolution For Hyperspectral Image Reconstruction [15.537910100051866]
Coded Aperture Snapshot Spectral Imaging (CASSI) の逆問題について検討する。粗面スペクトル対応変形性畳み込みネットワーク(CFSDCN)を提案する。我々のCFSDCNは、シミュレーションされたHSIデータセットと実際のHSIデータセットの両方において、従来の最先端(SOTA)メソッドよりも大幅に優れています。
論文参考訳（メタデータ） (2024-06-18T15:15:12Z)
Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文参考訳（メタデータ） (2024-05-24T15:56:40Z)
DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral Diffusion Model [18.25548360119976]
マルチスペクトル画像(MSI)におけるスナップショット圧縮画像(SCI)再構成の精度向上を目指した。 DiffSCIと呼ばれる新しいゼロショット拡散モデルを提案する。我々は,DiffSCIが自己監督的,ゼロショット的アプローチよりも顕著な性能向上を示すことを示すため,広範囲な試験を行った。
論文参考訳（メタデータ） (2023-11-19T20:27:14Z)
You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos [56.676761067861236]
ビデオがトリミングされていない場合、時間的文のグラウンド化は、文問合せに従って目的のモーメントを意味的に見つけることを目的としている。それまでの優れた作品は、かなり成功したが、それらはデコードされたフレームから抽出されたハイレベルな視覚的特徴にのみ焦点を当てている。本稿では,圧縮された映像を直接視覚入力として利用する,圧縮された領域のTSGを提案する。
論文参考訳（メタデータ） (2023-03-14T12:53:27Z)
Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。 HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文参考訳（メタデータ） (2022-05-20T11:37:44Z)
MST++: Multi-stage Spectral-wise Transformer for Efficient Spectral Reconstruction [148.26195175240923]
効率的なスペクトル再構成のためのマルチステージスペクトル変換器(MST++)を提案する。 NTIRE 2022 Spectral Reconstruction Challengeでは、私たちのアプローチが優勝しました。
論文参考訳（メタデータ） (2022-04-17T02:39:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。