論文の概要: Advancing Urban Renewal: An Automated Approach to Generating Historical
Arcade Facades with Stable Diffusion Models
- arxiv url: http://arxiv.org/abs/2311.11590v1
- Date: Mon, 20 Nov 2023 08:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 19:43:52.635600
- Title: Advancing Urban Renewal: An Automated Approach to Generating Historical
Arcade Facades with Stable Diffusion Models
- Title(参考訳): 都市再生の促進:安定拡散モデルによる歴史的アーケードの自動生成
- Authors: Zheyuan Kuang, Jiaxin Zhang, Yiying Huang, Yunqin Li
- Abstract要約: 本研究では,歴史的アーケードのファサード画像の自動生成手法を提案する。
様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。
提案手法は, 生成画像の高精度, 信頼性, 多様性を示すものである。
- 参考スコア(独自算出の注目度): 1.645684081891833
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Urban renewal and transformation processes necessitate the preservation of
the historical urban fabric, particularly in districts known for their
architectural and historical significance. These regions, with their diverse
architectural styles, have traditionally required extensive preliminary
research, often leading to subjective results. However, the advent of machine
learning models has opened up new avenues for generating building facade
images. Despite this, creating high-quality images for historical district
renovations remains challenging, due to the complexity and diversity inherent
in such districts. In response to these challenges, our study introduces a new
methodology for automatically generating images of historical arcade facades,
utilizing Stable Diffusion models conditioned on textual descriptions. By
classifying and tagging a variety of arcade styles, we have constructed several
realistic arcade facade image datasets. We trained multiple low-rank adaptation
(LoRA) models to control the stylistic aspects of the generated images,
supplemented by ControlNet models for improved precision and authenticity. Our
approach has demonstrated high levels of precision, authenticity, and diversity
in the generated images, showing promising potential for real-world urban
renewal projects. This new methodology offers a more efficient and accurate
alternative to conventional design processes in urban renewal, bypassing issues
of unconvincing image details, lack of precision, and limited stylistic
variety. Future research could focus on integrating this two-dimensional image
generation with three-dimensional modeling techniques, providing a more
comprehensive solution for renovating architectural facades in historical
districts.
- Abstract(参考訳): 都市再生と変容の過程は、特にその建築と歴史的重要性で知られる地域で、歴史的都市生地の保存を必要としている。
これらの地域は様々な建築様式を持ち、伝統的に広範な予備研究を必要としており、しばしば主観的な結果をもたらす。
しかし、機械学習モデルの出現は、ファサード画像を生成するための新しい道を開いた。
それにもかかわらず、これらの地区に固有の複雑さと多様性のため、歴史地区の改修のために高品質な画像を作成することは依然として困難である。
そこで本研究では,テキスト記述に基づく安定拡散モデルを用いて,歴史的なアーケードファサードの画像を自動生成する手法を提案する。
様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。
我々は,複数の低ランク適応(lora)モデルを訓練し,生成画像のスタイリスティックな側面を制御し,精度と信頼性を向上させるためのコントロールネットモデルで補足した。
提案手法は, 生成した画像の高精度, 信頼性, 多様性を実証し, 実際の都市再生プロジェクトの可能性を示した。
この新しい手法は、都市再生における従来の設計プロセスのより効率的で正確な代替手段を提供し、画像の詳細の確証のない問題、精度の欠如、限定的な様式的多様性の問題を回避している。
将来の研究は、この2次元画像生成と3次元モデリング技術を統合することに集中し、歴史的地区の建築ファサードを改良するためのより包括的なソリューションを提供する。
関連論文リスト
- UrbanGenAI: Reconstructing Urban Landscapes using Panoptic Segmentation
and Diffusion Models [0.0]
本稿では,都市デザインへの包括的アプローチとして,高度な画像分割と拡散モデルの相乗効果を活用するために,プロトタイプアプリケーション内にカプセル化された新しいワークフローを提案する。
評価の結果,プロトタイプアプリケーションによる高い性能を示し,オブジェクト検出とテキスト・ツー・イメージ生成の両面で有意な精度を示した。
予備試験には、デザイン教育における学習経験を高める教育ツールとしてのUrbanGenAIの活用と、コミュニティ主導の都市計画を促進する参加型機器の活用が含まれていた。
論文 参考訳(メタデータ) (2024-01-25T18:30:46Z) - EGAIN: Extended GAn INversion [5.602947425285195]
GAN(Generative Adversarial Networks)は近年大きな進歩を遂げている。
近年のGANは、非絡み合った潜在空間の機能を符号化することが証明されている。
GANインバージョンは、実際の顔画像の顔意味論を操作するための扉を開く。
論文 参考訳(メタデータ) (2023-12-22T23:25:17Z) - ReconFusion: 3D Reconstruction with Diffusion Priors [104.73604630145847]
本稿では,数枚の写真を用いて現実のシーンを再構成するReconFusionを提案する。
提案手法は,合成および多視点データセットに基づいて訓練された新規なビュー合成に先立って拡散を利用する。
本手法は,観測領域の外観を保ちながら,非拘束領域における現実的な幾何学とテクスチャを合成する。
論文 参考訳(メタデータ) (2023-12-05T18:59:58Z) - FaceStudio: Put Your Face Everywhere in Seconds [23.381791316305332]
アイデンティティを保存する画像合成は、パーソナライズされたスタイリスティックなタッチを加えながら、被験者のアイデンティティを維持することを目指している。
Textual InversionやDreamBoothといった従来の手法は、カスタムイメージ作成に力を入れている。
本研究は,人間の画像に焦点をあてたアイデンティティ保存合成への新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-05T11:02:45Z) - Coloring the Past: Neural Historical Buildings Reconstruction from
Archival Photography [69.93897305312574]
本稿では, ボリュームレンダリング技術を用いて, 歴史的建造物の形状を復元する手法を提案する。
我々は,高密度点雲を幾何学的先行として利用し,カラー画像に制限のある建物の色を復元するために,色相の埋め込み損失を導入する。
論文 参考訳(メタデータ) (2023-11-29T16:59:45Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。