論文の概要: A Survey on Text-Driven 360-Degree Panorama Generation
- arxiv url: http://arxiv.org/abs/2502.14799v1
- Date: Thu, 20 Feb 2025 18:19:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 14:29:16.618447
- Title: A Survey on Text-Driven 360-Degree Panorama Generation
- Title(参考訳): テキスト駆動型360度パノラマ生成に関する調査
- Authors: Hai Wang, Xiaoyu Xiang, Weihao Xia, Jing-Hao Xue,
- Abstract要約: テキスト駆動型360度パノラマ生成は没入型視覚コンテンツ生成の革新的進歩である。
テキスト・画像拡散モデルの最近の進歩は、この新興分野の急速な発展を加速させている。
このサーベイは、最先端のアルゴリズムの詳細な分析と、360度3Dシーン生成におけるその拡張的応用を提供する。
- 参考スコア(独自算出の注目度): 31.86065545952698
- License:
- Abstract: The advent of text-driven 360-degree panorama generation, enabling the synthesis of 360-degree panoramic images directly from textual descriptions, marks a transformative advancement in immersive visual content creation. This innovation significantly simplifies the traditionally complex process of producing such content. Recent progress in text-to-image diffusion models has accelerated the rapid development in this emerging field. This survey presents a comprehensive review of text-driven 360-degree panorama generation, offering an in-depth analysis of state-of-the-art algorithms and their expanding applications in 360-degree 3D scene generation. Furthermore, we critically examine current limitations and propose promising directions for future research. A curated project page with relevant resources and research papers is available at https://littlewhitesea.github.io/Text-Driven-Pano-Gen/.
- Abstract(参考訳): テキスト駆動の360度パノラマ生成の出現により、テキスト記述から直接360度パノラマ画像の合成が可能になった。
この革新は、そのようなコンテンツを生産する伝統的な複雑なプロセスを大幅に単純化する。
テキスト・画像拡散モデルの最近の進歩は、この新興分野の急速な発展を加速させている。
本調査では,テキスト駆動型360度パノラマ生成の総合的なレビューを行い,最先端のアルゴリズムとその360度3Dシーン生成への応用を詳細に分析した。
さらに,現状の限界を批判的に検討し,今後の研究に期待できる方向性を提案する。
関連リソースと研究論文を備えたキュレートされたプロジェクトページがhttps://littlewhitesea.github.io/Text-Driven-Pano-Gen/.comで公開されている。
関連論文リスト
- TextAtlas5M: A Large-scale Dataset for Dense Text Image Generation [67.45160043297193]
テキスト条件付き画像生成における長文レンダリングの評価を目的とした,新しいデータセットであるTextAtlas5Mを紹介する。
私たちのデータセットは、500万の長文生成と、さまざまなデータタイプにわたる画像の収集で構成されています。
さらに、3つのデータドメインにまたがる3000の人間改良テストセットTextAtlasEvalをキュレートし、テキスト条件生成のための最も広範なベンチマークの1つを確立します。
論文 参考訳(メタデータ) (2025-02-11T18:59:19Z) - DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion [60.45000652592418]
本稿では,テキスト駆動型パノラマ生成フレームワークDiffPanoを提案し,拡張性,一貫性,多様なパノラマシーン生成を実現する。
DiffPanoは、不明瞭なテキスト記述とカメラのポーズによって、一貫した多様なパノラマ画像を生成することができることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:57:02Z) - SceneDreamer360: Text-Driven 3D-Consistent Scene Generation with Panoramic Gaussian Splatting [53.32467009064287]
テキスト駆動型3D一貫性シーン生成モデルSceneDreamer360を提案する。
提案手法は,テキスト駆動パノラマ画像生成モデルを3次元シーン生成の先行モデルとして活用する。
SceneDreamer360はそのパノラマ画像生成と3DGSにより、より高品質で空間的に整合性があり、視覚的に魅力的な3Dシーンを任意のテキストプロンプトから生成できることを示した。
論文 参考訳(メタデータ) (2024-08-25T02:56:26Z) - Visual Text Generation in the Wild [67.37458807253064]
野生で高品質なテキスト画像を生成する視覚テキスト生成装置(SceneVTG)を提案する。
提案したSceneVTGは、従来のレンダリングに基づく手法と最近の拡散に基づく手法を、忠実さと理性の観点から大きく上回っている。
生成された画像は、テキスト検出とテキスト認識を含むタスクに優れたユーティリティを提供する。
論文 参考訳(メタデータ) (2024-07-19T09:08:20Z) - OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting [9.870063736691556]
我々は,従来の狭視野画像(NFoV)から360度画像を生成するという,最近の話題に対処する。
この課題は、NFoV画像から合理的で一貫した環境を予測することを目的としている。
そこで本稿では,Mambaと呼ばれる状態空間モデルを備えた新しいテキスト誘導アウトペイントフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-15T17:23:00Z) - Taming Stable Diffusion for Text to 360° Panorama Image Generation [74.69314801406763]
そこで本研究では,テキストプロンプトから360度画像を生成するためにPanFusionという2分岐拡散モデルを提案する。
本研究では,協調的認知過程における歪みを最小限に抑えるために,投射認識を備えたユニークなクロスアテンション機構を提案する。
論文 参考訳(メタデータ) (2024-04-11T17:46:14Z) - Autoregressive Omni-Aware Outpainting for Open-Vocabulary 360-Degree Image Generation [36.45222068699805]
AOG-Netは、NFoVとテキストガイダンスを併用または個別に、不完全な画像を段階的に描画することで、360度画像生成のために提案される。
各自己回帰ステップにおいて、アウトペイントガイダンスを定式化するために、グローバルローカルコンディショニング機構が考案された。
室内と屋外の両方でよく使用される2つの360度画像データセットに関する総合実験により,提案手法の最先端性能が実証された。
論文 参考訳(メタデータ) (2023-09-07T03:22:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。