論文の概要: High-Speed FHD Full-Color Video Computer-Generated Holography
- arxiv url: http://arxiv.org/abs/2508.19579v1
- Date: Wed, 27 Aug 2025 05:24:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.503123
- Title: High-Speed FHD Full-Color Video Computer-Generated Holography
- Title(参考訳): 高速FHDフルカラー映像ホログラフィー
- Authors: Haomiao Zhang, Miao Cao, Xuan Yu, Hui Luo, Yanling Piao, Mengjie Qin, Zhangyuan Li, Ping Wang, Xin Yuan,
- Abstract要約: ホログラフィーは次世代ディスプレイにとって有望な技術だ。
高速で高品質なホログラフィックビデオを生成するには、フレームレートの表示と効率的な計算の両方が必要である。
- 参考スコア(独自算出の注目度): 13.302001362328134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer-generated holography (CGH) is a promising technology for next-generation displays. However, generating high-speed, high-quality holographic video requires both high frame rate display and efficient computation, but is constrained by two key limitations: ($i$) Learning-based models often produce over-smoothed phases with narrow angular spectra, causing severe color crosstalk in high frame rate full-color displays such as depth-division multiplexing and thus resulting in a trade-off between frame rate and color fidelity. ($ii$) Existing frame-by-frame optimization methods typically optimize frames independently, neglecting spatial-temporal correlations between consecutive frames and leading to computationally inefficient solutions. To overcome these challenges, in this paper, we propose a novel high-speed full-color video CGH generation scheme. First, we introduce Spectrum-Guided Depth Division Multiplexing (SGDDM), which optimizes phase distributions via frequency modulation, enabling high-fidelity full-color display at high frame rates. Second, we present HoloMamba, a lightweight asymmetric Mamba-Unet architecture that explicitly models spatial-temporal correlations across video sequences to enhance reconstruction quality and computational efficiency. Extensive simulated and real-world experiments demonstrate that SGDDM achieves high-fidelity full-color display without compromise in frame rate, while HoloMamba generates FHD (1080p) full-color holographic video at over 260 FPS, more than 2.6$\times$ faster than the prior state-of-the-art Divide-Conquer-and-Merge Strategy.
- Abstract(参考訳): コンピュータ生成ホログラフィー(CGH)は次世代ディスプレイに期待できる技術である。
しかし、高速で高品質なホログラフィックビデオを生成するには、フレームレートの表示と効率的な計算の両方を必要とするが、(i$)学習ベースのモデルは狭い角スペクトルを持つ過度に滑らかな位相を生成し、深度分割多重化のような高フレームレートフルカラーディスプレイにおいて深刻な色クロストークを引き起こし、フレームレートと色忠実度の間のトレードオフをもたらす。
($)
既存のフレーム・バイ・フレーム最適化手法は通常、フレームを独立に最適化し、連続するフレーム間の空間的時間的相関を無視し、計算的に非効率な解をもたらす。
本稿では,これらの課題を克服するために,新しい高速フルカラーCGH生成方式を提案する。
まず、周波数変調による位相分布を最適化し、高フレームレートで高忠実度フルカラー表示を可能にするスペクトル誘導深さ分割多重化(SGDDM)を提案する。
第二に、HoloMambaは軽量な非対称なMamba-Unetアーキテクチャで、ビデオシーケンス間の空間的時間的相関を明示的にモデル化し、再構成品質と計算効率を向上させる。
大規模なシミュレーションと実世界の実験により、SGDDMはフレームレートを損なわずに高忠実なフルカラーディスプレイを実現し、一方HoloMambaは260 FPS以上のフルカラーホログラフィックビデオを生成し、260 FPS以上の2.6$\times$は、最先端のDivide-Conquer-and-Merge戦略よりも高速である。
関連論文リスト
- STORM: Token-Efficient Long Video Understanding for Multimodal LLMs [116.4479155699528]
STORMは、イメージエンコーダとビデオLLMの間に専用のテンポラリエンコーダを組み込んだ、新しいアーキテクチャである。
我々は,STORMが様々な長いビデオ理解ベンチマークにおいて最先端の結果を達成することを示す。
論文 参考訳(メタデータ) (2025-03-06T06:17:38Z) - VISION-XL: High Definition Video Inverse Problem Solver using Latent Image Diffusion Models [58.464465016269614]
本稿では,遅延画像拡散モデルを用いた高精細ビデオ逆問題の解法を提案する。
提案手法は,NVIDIA 4090 GPUの1フレームあたり6秒未満でHD解像度の再構成を実現する。
論文 参考訳(メタデータ) (2024-11-29T08:10:49Z) - Ada-VE: Training-Free Consistent Video Editing Using Adaptive Motion Prior [13.595032265551184]
ビデオ間合成は、キャラクタ一貫性の維持、スムーズな時間遷移、高速動作時の視覚的品質の維持において大きな課題となる。
本稿では,冗長計算を選択的に削減する適応型動き誘導型クロスフレームアテンション機構を提案する。
これにより、同じ計算予算内でより多くのフレームにクロスフレームの注意を向けることができる。
論文 参考訳(メタデータ) (2024-06-07T12:12:25Z) - RAVEN: Rethinking Adversarial Video Generation with Efficient Tri-plane Networks [93.18404922542702]
本稿では,長期的空間的および時間的依存関係に対処する新しいビデオ生成モデルを提案する。
提案手法は,3次元認識型生成フレームワークにインスパイアされた,明示的で単純化された3次元平面のハイブリッド表現を取り入れたものである。
我々のモデルは高精細度ビデオクリップを解像度256時間256$ピクセルで合成し、フレームレート30fpsで5ドル以上まで持続する。
論文 参考訳(メタデータ) (2024-01-11T16:48:44Z) - Context-Aware Video Reconstruction for Rolling Shutter Cameras [52.28710992548282]
本稿では,文脈対応のGSビデオ再構成アーキテクチャを提案する。
まず、2つのRSフレームの画素が共通のGSフレームに歪むように、左右の運動場を推定する。
そこで,両面閉塞マスクとともにGSフレーム合成を誘導し,高忠実度GSビデオフレームを生成するための改良手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:05:47Z) - Time-multiplexed Neural Holography: A flexible framework for holographic
near-eye displays with fast heavily-quantized spatial light modulators [44.73608798155336]
ホログラフィックの近眼ディスプレイは、バーチャルおよび拡張現実システムに前例のない機能を提供する。
このようなホログラム近眼ディスプレイのカメラ校正波伝搬モデルの進歩を報告する。
我々のフレームワークは,2Dおよび2.5D RGBDイメージ,3D焦点スタック,4D光フィールドなど,さまざまなタイプのコンテンツで実行時の監視を支援するために柔軟である。
論文 参考訳(メタデータ) (2022-05-05T00:03:50Z) - VCGAN: Video Colorization with Hybrid Generative Adversarial Network [22.45196398040388]
ハイブリッド生成適応ネットワーク(VCGAN)によるハイブリッド映像のカラー化は、エンドツーエンド学習を用いたカラー化への改良されたアプローチである。
実験の結果,VCGANは既存の手法よりも高品質で時間的に一貫したカラービデオを生成することがわかった。
論文 参考訳(メタデータ) (2021-04-26T05:50:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。