論文の概要: Advancing Urban Renewal: An Automated Approach to Generating Historical
Arcade Facades with Stable Diffusion Models
- arxiv url: http://arxiv.org/abs/2311.11590v1
- Date: Mon, 20 Nov 2023 08:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 19:43:52.635600
- Title: Advancing Urban Renewal: An Automated Approach to Generating Historical
Arcade Facades with Stable Diffusion Models
- Title(参考訳): 都市再生の促進:安定拡散モデルによる歴史的アーケードの自動生成
- Authors: Zheyuan Kuang, Jiaxin Zhang, Yiying Huang, Yunqin Li
- Abstract要約: 本研究では,歴史的アーケードのファサード画像の自動生成手法を提案する。
様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。
提案手法は, 生成画像の高精度, 信頼性, 多様性を示すものである。
- 参考スコア(独自算出の注目度): 1.645684081891833
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Urban renewal and transformation processes necessitate the preservation of
the historical urban fabric, particularly in districts known for their
architectural and historical significance. These regions, with their diverse
architectural styles, have traditionally required extensive preliminary
research, often leading to subjective results. However, the advent of machine
learning models has opened up new avenues for generating building facade
images. Despite this, creating high-quality images for historical district
renovations remains challenging, due to the complexity and diversity inherent
in such districts. In response to these challenges, our study introduces a new
methodology for automatically generating images of historical arcade facades,
utilizing Stable Diffusion models conditioned on textual descriptions. By
classifying and tagging a variety of arcade styles, we have constructed several
realistic arcade facade image datasets. We trained multiple low-rank adaptation
(LoRA) models to control the stylistic aspects of the generated images,
supplemented by ControlNet models for improved precision and authenticity. Our
approach has demonstrated high levels of precision, authenticity, and diversity
in the generated images, showing promising potential for real-world urban
renewal projects. This new methodology offers a more efficient and accurate
alternative to conventional design processes in urban renewal, bypassing issues
of unconvincing image details, lack of precision, and limited stylistic
variety. Future research could focus on integrating this two-dimensional image
generation with three-dimensional modeling techniques, providing a more
comprehensive solution for renovating architectural facades in historical
districts.
- Abstract(参考訳): 都市再生と変容の過程は、特にその建築と歴史的重要性で知られる地域で、歴史的都市生地の保存を必要としている。
これらの地域は様々な建築様式を持ち、伝統的に広範な予備研究を必要としており、しばしば主観的な結果をもたらす。
しかし、機械学習モデルの出現は、ファサード画像を生成するための新しい道を開いた。
それにもかかわらず、これらの地区に固有の複雑さと多様性のため、歴史地区の改修のために高品質な画像を作成することは依然として困難である。
そこで本研究では,テキスト記述に基づく安定拡散モデルを用いて,歴史的なアーケードファサードの画像を自動生成する手法を提案する。
様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。
我々は,複数の低ランク適応(lora)モデルを訓練し,生成画像のスタイリスティックな側面を制御し,精度と信頼性を向上させるためのコントロールネットモデルで補足した。
提案手法は, 生成した画像の高精度, 信頼性, 多様性を実証し, 実際の都市再生プロジェクトの可能性を示した。
この新しい手法は、都市再生における従来の設計プロセスのより効率的で正確な代替手段を提供し、画像の詳細の確証のない問題、精度の欠如、限定的な様式的多様性の問題を回避している。
将来の研究は、この2次元画像生成と3次元モデリング技術を統合することに集中し、歴史的地区の建築ファサードを改良するためのより包括的なソリューションを提供する。
関連論文リスト
- Artistic Intelligence: A Diffusion-Based Framework for High-Fidelity Landscape Painting Synthesis [2.205829309604458]
LPGenはランドスケープ・ペインティング・ジェネレーションに特化して設計された新しい拡散モデルである。
LPGenは、構造的およびスタイリスティックな特徴を独立して処理する分離されたクロスアテンションメカニズムを導入している。
モデルは高解像度のランドスケープ画像のキュレートされたデータセットに事前トレーニングされ、異なる芸術様式で分類され、詳細で一貫した出力を確保するために微調整される。
論文 参考訳(メタデータ) (2024-07-24T12:32:24Z) - Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [12.96911281844627]
本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。
この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文 参考訳(メタデータ) (2024-07-22T07:29:38Z) - UrbanGenAI: Reconstructing Urban Landscapes using Panoptic Segmentation
and Diffusion Models [0.0]
本稿では,都市デザインへの包括的アプローチとして,高度な画像分割と拡散モデルの相乗効果を活用するために,プロトタイプアプリケーション内にカプセル化された新しいワークフローを提案する。
評価の結果,プロトタイプアプリケーションによる高い性能を示し,オブジェクト検出とテキスト・ツー・イメージ生成の両面で有意な精度を示した。
予備試験には、デザイン教育における学習経験を高める教育ツールとしてのUrbanGenAIの活用と、コミュニティ主導の都市計画を促進する参加型機器の活用が含まれていた。
論文 参考訳(メタデータ) (2024-01-25T18:30:46Z) - ReconFusion: 3D Reconstruction with Diffusion Priors [104.73604630145847]
本稿では,数枚の写真を用いて現実のシーンを再構成するReconFusionを提案する。
提案手法は,合成および多視点データセットに基づいて訓練された新規なビュー合成に先立って拡散を利用する。
本手法は,観測領域の外観を保ちながら,非拘束領域における現実的な幾何学とテクスチャを合成する。
論文 参考訳(メタデータ) (2023-12-05T18:59:58Z) - Coloring the Past: Neural Historical Buildings Reconstruction from
Archival Photography [69.93897305312574]
本稿では, ボリュームレンダリング技術を用いて, 歴史的建造物の形状を復元する手法を提案する。
我々は,高密度点雲を幾何学的先行として利用し,カラー画像に制限のある建物の色を復元するために,色相の埋め込み損失を導入する。
論文 参考訳(メタデータ) (2023-11-29T16:59:45Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。