論文の概要: LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
- arxiv url: http://arxiv.org/abs/2504.08902v1
- Date: Fri, 11 Apr 2025 18:12:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:54:09.225912
- Title: LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
- Title(参考訳): LookingGlass:ラプラシア・ピラミッド・ウォーピングによるアナモルファス生成
- Authors: Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo,
- Abstract要約: アナモルフィズム(英: Anamorphosis)は、意図的に歪んだ画像のカテゴリーであり、直接観察すると認識できない。
そこで本研究では,遅延補正フローモデルの助けを借りて,直視時に有効な解釈を保持するアナモルフィック画像を生成する手法を提案する。
- 参考スコア(独自算出の注目度): 7.356328937024185
- License:
- Abstract: Anamorphosis refers to a category of images that are intentionally distorted, making them unrecognizable when viewed directly. Their true form only reveals itself when seen from a specific viewpoint, which can be through some catadioptric device like a mirror or a lens. While the construction of these mathematical devices can be traced back to as early as the 17th century, they are only interpretable when viewed from a specific vantage point and tend to lose meaning when seen normally. In this paper, we revisit these famous optical illusions with a generative twist. With the help of latent rectified flow models, we propose a method to create anamorphic images that still retain a valid interpretation when viewed directly. To this end, we introduce Laplacian Pyramid Warping, a frequency-aware image warping technique key to generating high-quality visuals. Our work extends Visual Anagrams (arXiv:2311.17919) to latent space models and to a wider range of spatial transforms, enabling the creation of novel generative perceptual illusions.
- Abstract(参考訳): アナモルフィズム(英: Anamorphosis)は、意図的に歪んだ画像のカテゴリーであり、直接観察すると認識できない。
彼らの真の形は、特定の視点から見るときのみ、鏡やレンズのような白内障のデバイスを通して現れる。
これらの数学的装置の構築は17世紀までさかのぼるが、それらは特定の分岐点から見てのみ解釈可能であり、普通に見ると意味を失う傾向がある。
本稿では、これらの有名な錯視を生成的ツイストで再検討する。
そこで本研究では,遅延補正フローモデルの助けを借りて,直視時に有効な解釈を保持するアナモルフィック画像を生成する手法を提案する。
そこで我々は,高品質な映像を生成するための周波数対応画像ワープ技術であるLaplacian Pyramid Warpingを紹介する。
我々の研究は、視覚アナグラム(arXiv:2311.17919)を潜在空間モデルに拡張し、より広い範囲の空間変換に拡張し、新しい生成的知覚錯覚の作成を可能にした。
関連論文リスト
- Slow Perception: Let's Perceive Geometric Figures Step-by-step [53.69067976062474]
私たちは、正確なコピー(強い知覚)が視覚的なo1への第一歩だと信じています。
本稿では,モデルが基本点-線の組み合わせを徐々に知覚するように導く「スロー知覚(SP)」の概念を紹介する。
論文 参考訳(メタデータ) (2024-12-30T00:40:35Z) - Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models [15.977340635967018]
マルチビュー光学錯視(Multi-view optical illusions)は、フリップや回転などの変換によって外観が変化する画像である。
既製のテキスト・画像拡散モデルからこれらの錯覚を得るゼロショット法を提案する。
本手法の有効性と柔軟性を示す定性的および定量的な結果を提供する。
論文 参考訳(メタデータ) (2023-11-29T18:59:59Z) - Curved Diffusion: A Generative Model With Optical Geometry Control [56.24220665691974]
最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。
本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-29T13:06:48Z) - Neural Implicit Morphing of Face Images [0.7643309077806446]
フェイスフォーミングは、多くの芸術的および法医学的応用を持つコンピュータグラフィックスにおける問題である。
このタスクは、特徴アライメントのためのワープと、歪んだ画像間のシームレスな遷移のためのブレンディングで構成される。
我々は,このような歪みや顔画像のブレンドを表現するために,協調型ニューラルネットワークを活用することを提案する。
論文 参考訳(メタデータ) (2023-08-26T14:12:19Z) - RealFusion: 360{\deg} Reconstruction of Any Object from a Single Image [98.46318529630109]
対象物の全360度写真モデルを1枚の画像から再構成する際の問題点を考察する。
拡散に基づく自己条件付き画像生成装置を設計し、オブジェクトの新たなビューを"ドレームアップ"するよう促すプロンプトを設計する。
論文 参考訳(メタデータ) (2023-02-21T13:25:35Z) - Generalizable Person Re-Identification via Viewpoint Alignment and
Fusion [74.30861504619851]
本研究は,3次元高密度ポーズ推定モデルとテクスチャマッピングモジュールを用いて,歩行者画像を標準視像にマッピングすることを提案する。
テクスチャマッピングモジュールの不完全性のため、標準ビュー画像は、原画像から識別的な詳細手がかりを失う可能性がある。
提案手法は,各種評価設定における既存手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2022-12-05T16:24:09Z) - Generate and Edit Your Own Character in a Canonical View [18.400846952014188]
そこで本研究では,様式化された肖像画を標準的視点で生成する新しい枠組みを提案する。
提案する潜在マッパーを用いて,StyleGANの潜在空間におけるフロントエンドマッピングを解析し,発見する。
我々のモデルは、3Dの監督なしに、未実装の2Dイメージセットで訓練することができる。
論文 参考訳(メタデータ) (2022-05-06T01:37:07Z) - Paraphrasing Magritte's Observation [0.0]
本稿では,「Li et al., 2022」で使用される統計学習に適合したオリジナル漫画風画像を生成する手法を提案する。
学術的,非営利的な出版物において,表現(提案手法によって生成された刺激)と現実(実際の対象)との明確な区別は,生成した刺激の使用に関する最終的な問題を回避する。
論文 参考訳(メタデータ) (2022-02-11T00:20:04Z) - I M Avatar: Implicit Morphable Head Avatars from Videos [68.13409777995392]
モノクロビデオから暗黙の頭部アバターを学習するための新しい手法であるIMavatarを提案する。
従来の3DMMによるきめ細かい制御機構に着想を得て, 学習用ブレンドサップとスキンフィールドによる表現・ポーズ関連変形を表現した。
本手法は,最先端の手法と比較して,幾何性を改善し,より完全な表現空間をカバーできることを定量的かつ定性的に示す。
論文 参考訳(メタデータ) (2021-12-14T15:30:32Z) - Infinite Nature: Perpetual View Generation of Natural Scenes from a
Single Image [73.56631858393148]
本研究では,1枚の画像から任意に長いカメラの軌跡に対応する新規ビューの長期生成という,永続的なビュー生成の問題について紹介する。
我々は、幾何合成と画像合成の両方を反復レンダリング、洗練、反復フレームワークで統合するハイブリッドアプローチを採用する。
提案手法は,手動のアノテーションを使わずに,一眼レフビデオシーケンスの集合から訓練することができる。
論文 参考訳(メタデータ) (2020-12-17T18:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。