論文の概要: P-Hologen: An End-to-End Generative Framework for Phase-Only Holograms
- arxiv url: http://arxiv.org/abs/2404.01330v2
- Date: Fri, 02 May 2025 04:51:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.628848
- Title: P-Hologen: An End-to-End Generative Framework for Phase-Only Holograms
- Title(参考訳): P-Hologen: 位相限定ホログラムのためのエンドツーエンド生成フレームワーク
- Authors: JooHyun Park, YuJin Jeon, HuiYong Kim, SeungHwan Baek, HyeongYeop Kang,
- Abstract要約: 位相限定ホログラム(POH)用に設計された最初のエンドツーエンド生成フレームワークであるP-Hologenを紹介する。
P-ホロゲンは既存の手法に比べて品質と計算効率が優れている。
我々のモデルは、既存の画像を必要としない高品質で多様なホログラフィックコンテンツを生成する。
- 参考スコア(独自算出の注目度): 10.667658956529504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Holography stands at the forefront of visual technology, offering immersive, three-dimensional visualizations through the manipulation of light wave amplitude and phase. Although generative models have been extensively explored in the image domain, their application to holograms remains relatively underexplored due to the inherent complexity of phase learning. Exploiting generative models for holograms offers exciting opportunities for advancing innovation and creativity, such as semantic-aware hologram generation and editing. Currently, the most viable approach for utilizing generative models in the hologram domain involves integrating an image-based generative model with an image-to-hologram conversion model, which comes at the cost of increased computational complexity and inefficiency. To tackle this problem, we introduce P-Hologen, the first end-to-end generative framework designed for phase-only holograms (POHs). P-Hologen employs vector quantized variational autoencoders to capture the complex distributions of POHs. It also integrates the angular spectrum method into the training process, constructing latent spaces for complex phase data using strategies from the image processing domain. Extensive experiments demonstrate that P-Hologen achieves superior quality and computational efficiency compared to the existing methods. Furthermore, our model generates high-quality unseen, diverse holographic content from its learned latent space without requiring pre-existing images. Our work paves the way for new applications and methodologies in holographic content creation, opening a new era in the exploration of generative holographic content. The code for our paper is publicly available on https://github.com/james0223/P-Hologen.
- Abstract(参考訳): ホログラフィーは視覚技術の最前線にあり、光の振幅と位相を操作することで没入型3次元の可視化を提供する。
生成モデルは画像領域で広く研究されているが、位相学習の本質的な複雑さのためにホログラムへの応用は比較的過小評価されている。
ホログラムの生成モデルを爆発させることは、セマンティックアウェアなホログラムの生成や編集など、イノベーションと創造性を促進するエキサイティングな機会を提供する。
現在、ホログラム領域における生成モデルを利用するための最も有効なアプローチは、画像に基づく生成モデルと画像からホログラムへの変換モデルを統合することである。
この問題に対処するために,位相のみのホログラム(POH)用に設計された最初のエンドツーエンド生成フレームワークであるP-Hologenを紹介する。
P-ホロゲンは、ベクトル量子化された変分オートエンコーダを用いて、POHの複雑な分布をキャプチャする。
また、角スペクトル法をトレーニングプロセスに統合し、画像処理領域からの戦略を用いて複雑な位相データのための潜在空間を構築する。
大規模な実験により、P-ホロゲンは既存の方法よりも優れた品質と計算効率を達成することが示された。
さらに,既存の画像を必要とすることなく,学習した潜在空間から高品質で多様なホログラフィックコンテンツを生成する。
我々の研究はホログラフィックコンテンツ作成の新しい応用と方法論の道を開き、生成ホログラフィックコンテンツ探索の新しい時代を開く。
私たちの論文のコードはhttps://github.com/james0223/P-Hologen.comで公開されています。
関連論文リスト
- Harmonizing Visual Representations for Unified Multimodal Understanding and Generation [53.01486796503091]
我々は,共有MARエンコーダによる理解と生成タスクを調和させる統合自己回帰フレームワークであるemphHarmonを提案する。
HarmonはGenEval、MJHQ30K、WISEベンチマークで最先端の画像生成結果を達成する。
論文 参考訳(メタデータ) (2025-03-27T20:50:38Z) - T-SVG: Text-Driven Stereoscopic Video Generation [87.62286959918566]
本稿では,テキスト駆動ステレオビデオ生成(T-SVG)システムを紹介する。
テキストプロンプトを使用してビデオ生成を合理化し、参照ビデオを作成する。
これらのビデオは、3Dポイントのクラウドシーケンスに変換され、微妙なパララックス差のある2つの視点からレンダリングされる。
論文 参考訳(メタデータ) (2024-12-12T14:48:46Z) - DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - Re-Thinking Inverse Graphics With Large Language Models [51.333105116400205]
逆グラフィックス -- イメージを物理変数に反転させ、レンダリングすると観察されたシーンの再現を可能にする -- は、コンピュータビジョンとグラフィックスにおいて根本的な課題である。
LLMを中心とした逆グラフフレームワークである逆グラフ大言語モデル(IG-LLM)を提案する。
我々は、凍結した事前学習されたビジュアルエンコーダと連続的な数値ヘッドを組み込んで、エンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2024-04-23T16:59:02Z) - Configurable Learned Holography [33.45219677645646]
本稿では,RGBのみの2次元画像から様々なホログラム表示のための3次元ホログラムをインタラクティブに計算する学習モデルを提案する。
我々は,3次元ホログラム合成タスクの深度推定と3次元ホログラム合成の相関関係の同定に,ホログラム計算を頼れるようにした。
論文 参考訳(メタデータ) (2024-03-24T13:57:30Z) - Stochastic Light Field Holography [35.73147050231529]
視覚チューリングテストはホログラフィックディスプレイのリアリズムを評価するための最終目標である。
従来の研究は、大規模な焦点音量に対する「注意」や画質の制限といった課題に対処することに注力してきた。
そこで本研究では,非コヒーレント光場の投影演算子をマッチングすることにより,ホログラム生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-12T16:20:08Z) - HORIZON: High-Resolution Semantically Controlled Panorama Synthesis [105.55531244750019]
パノラマ合成は、仮想世界の中心にユーザーを没入させ、360度の視覚的な風景を再現する。
視覚合成の最近の進歩は、2次元平面画像における意味制御の可能性を解き放ったが、これらの手法のパノラマ合成への直接的応用は歪んだ内容を生み出す。
我々は,高分解能パノラマを生成するための革新的な枠組みを公表し,洗練された球面モデリングによる球面歪みとエッジ不連続性の問題に着目した。
論文 参考訳(メタデータ) (2022-10-10T09:43:26Z) - Time-multiplexed Neural Holography: A flexible framework for holographic
near-eye displays with fast heavily-quantized spatial light modulators [44.73608798155336]
ホログラフィックの近眼ディスプレイは、バーチャルおよび拡張現実システムに前例のない機能を提供する。
このようなホログラム近眼ディスプレイのカメラ校正波伝搬モデルの進歩を報告する。
我々のフレームワークは,2Dおよび2.5D RGBDイメージ,3D焦点スタック,4D光フィールドなど,さまざまなタイプのコンテンツで実行時の監視を支援するために柔軟である。
論文 参考訳(メタデータ) (2022-05-05T00:03:50Z) - Image quality enhancement of embedded holograms in holographic
information hiding using deep neural networks [0.0]
埋め込みホログラムの明るさはホストホログラムの明るさのごく一部に設定され、ホストホログラムのほとんど損傷を受けていない。
埋め込みホログラムの再構成画像は、再構成されたホスト画像よりも暗いため、知覚することは困難である。
本研究では、深層ニューラルネットワークを用いて暗色画像の復元を行う。
論文 参考訳(メタデータ) (2021-12-20T01:21:28Z) - Neural Étendue Expander for Ultra-Wide-Angle High-Fidelity Holographic Display [51.399291206537384]
現代のホログラフィックディスプレイは、表示領域と回折光の最大固体角度の積である低い「エンテンダ」を有する。
自然画像データセットから学習したニューラルな「固有拡大器」を提案する。
ニューラルネットワーク拡張器を用いて,64$times$ 'etendue expansion of natural image in full color, and expand the FOV by a magnitude of horizontal and vertically。
論文 参考訳(メタデータ) (2021-09-16T17:21:52Z) - Learned holographic light transport [2.642698101441705]
ホログラフィーアルゴリズムはしばしば物理ホログラフィーディスプレイの結果と一致するシミュレーションで不足する。
我々の研究はホログラフィックディスプレイのホログラフィック光輸送を学習することで、このミスマッチに対処する。
本手法はホログラフィックディスプレイのシミュレーション精度と画質を劇的に向上させることができる。
論文 参考訳(メタデータ) (2021-08-01T12:05:33Z) - Structure and Design of HoloGen [0.0]
CGHは焦点深度、調節度、収束度を含む光場を完全に表現することができる。
HoloGenはMITライセンスのアプリケーションで、専門家の指導なしに幅広いアルゴリズムを使ってホログラムを生成するために使われる。
論文 参考訳(メタデータ) (2020-06-18T13:29:46Z) - Towards Coding for Human and Machine Vision: A Scalable Image Coding
Approach [104.02201472370801]
圧縮モデルと生成モデルの両方を活用することにより,新しい画像符号化フレームワークを考案した。
高度な生成モデルを導入することで、コンパクトな特徴表現と参照画素から画像を再構成するフレキシブルネットワークを訓練する。
実験により、人間の視覚的品質と顔のランドマーク検出の両方において、我々の枠組みが優れていることが示された。
論文 参考訳(メタデータ) (2020-01-09T10:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。