Fugu-MT 論文翻訳(概要): Advancing Urban Renewal: An Automated Approach to Generating Historical Arcade Facades with Stable Diffusion Models

論文の概要: Advancing Urban Renewal: An Automated Approach to Generating Historical Arcade Facades with Stable Diffusion Models

arxiv url: http://arxiv.org/abs/2311.11590v1
Date: Mon, 20 Nov 2023 08:03:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-21 19:43:52.635600
Title: Advancing Urban Renewal: An Automated Approach to Generating Historical Arcade Facades with Stable Diffusion Models
Title（参考訳）: 都市再生の促進:安定拡散モデルによる歴史的アーケードの自動生成
Authors: Zheyuan Kuang, Jiaxin Zhang, Yiying Huang, Yunqin Li
Abstract要約: 本研究では,歴史的アーケードのファサード画像の自動生成手法を提案する。様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。提案手法は, 生成画像の高精度, 信頼性, 多様性を示すものである。
参考スコア（独自算出の注目度）: 1.645684081891833
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Urban renewal and transformation processes necessitate the preservation of the historical urban fabric, particularly in districts known for their architectural and historical significance. These regions, with their diverse architectural styles, have traditionally required extensive preliminary research, often leading to subjective results. However, the advent of machine learning models has opened up new avenues for generating building facade images. Despite this, creating high-quality images for historical district renovations remains challenging, due to the complexity and diversity inherent in such districts. In response to these challenges, our study introduces a new methodology for automatically generating images of historical arcade facades, utilizing Stable Diffusion models conditioned on textual descriptions. By classifying and tagging a variety of arcade styles, we have constructed several realistic arcade facade image datasets. We trained multiple low-rank adaptation (LoRA) models to control the stylistic aspects of the generated images, supplemented by ControlNet models for improved precision and authenticity. Our approach has demonstrated high levels of precision, authenticity, and diversity in the generated images, showing promising potential for real-world urban renewal projects. This new methodology offers a more efficient and accurate alternative to conventional design processes in urban renewal, bypassing issues of unconvincing image details, lack of precision, and limited stylistic variety. Future research could focus on integrating this two-dimensional image generation with three-dimensional modeling techniques, providing a more comprehensive solution for renovating architectural facades in historical districts.
Abstract（参考訳）: 都市再生と変容の過程は、特にその建築と歴史的重要性で知られる地域で、歴史的都市生地の保存を必要としている。これらの地域は様々な建築様式を持ち、伝統的に広範な予備研究を必要としており、しばしば主観的な結果をもたらす。しかし、機械学習モデルの出現は、ファサード画像を生成するための新しい道を開いた。それにもかかわらず、これらの地区に固有の複雑さと多様性のため、歴史地区の改修のために高品質な画像を作成することは依然として困難である。そこで本研究では,テキスト記述に基づく安定拡散モデルを用いて,歴史的なアーケードファサードの画像を自動生成する手法を提案する。様々なアーケードスタイルを分類・タグ付けすることで、現実的なアーケードファサード画像データセットを構築した。我々は,複数の低ランク適応(lora)モデルを訓練し,生成画像のスタイリスティックな側面を制御し,精度と信頼性を向上させるためのコントロールネットモデルで補足した。提案手法は, 生成した画像の高精度, 信頼性, 多様性を実証し, 実際の都市再生プロジェクトの可能性を示した。この新しい手法は、都市再生における従来の設計プロセスのより効率的で正確な代替手段を提供し、画像の詳細の確証のない問題、精度の欠如、限定的な様式的多様性の問題を回避している。将来の研究は、この2次元画像生成と3次元モデリング技術を統合することに集中し、歴史的地区の建築ファサードを改良するためのより包括的なソリューションを提供する。

関連論文リスト

Augmented Reality in Cultural Heritage: A Dual-Model Pipeline for 3D Artwork Reconstruction [12.45946835655036]
本稿では,博物館環境に適した革新的な拡張現実パイプラインを提案する。美術品を認識し、単一の画像から正確な3Dモデルを生成することを目的としている。
論文参考訳（メタデータ） (2025-07-18T07:59:29Z)
Revealing the Ancient Beauty: Digital Reconstruction of Temple Tiles using Computer Vision [0.0]
機械学習、ディープラーニング、コンピュータビジョン技術は、3D再構成のような発展途上国に革命をもたらした。インドの記念碑の特質を評価するために,3つの最先端技術を提案する。
論文参考訳（メタデータ） (2025-07-16T12:46:04Z)
A Generative Approach to High Fidelity 3D Reconstruction from Text Data [0.0]
本研究では,テキスト・画像生成をシームレスに統合する完全自動パイプライン,様々な画像処理技術,反射除去と3次元再構成のためのディープラーニング手法を提案する。安定拡散のような最先端の生成モデルを活用することで、この手法は自然言語の入力を多段階のワークフローを通じて詳細な3Dモデルに変換する。このアプローチは、意味的コヒーレンスを維持すること、幾何学的複雑さを管理すること、詳細な視覚情報を保存することなど、生成的再構築における重要な課題に対処する。
論文参考訳（メタデータ） (2025-03-05T16:54:15Z)
A Critical Assessment of Modern Generative Models' Ability to Replicate Artistic Styles [0.0]
本稿では,現代生成モデルのスタイル再現能力を批判的に評価する。これらのモデルは,構造的整合性と構成的バランスを維持しつつ,従来の芸術様式をいかに効果的に再現するかを検討する。この分析は、過去の芸術スタイルを模倣したAI生成作品の大規模なデータセットに基づいている。
論文参考訳（メタデータ） (2025-02-21T07:00:06Z)
Personalized Image Generation with Deep Generative Models: A Decade Survey [51.26287478042516]
本稿では、様々な生成モデルにまたがって、一般化されたパーソナライズされた画像生成についてレビューする。まず、異なる生成モデル間でパーソナライズプロセスを標準化する統合フレームワークを定義する。次に、各生成モデルにおけるパーソナライズ手法の詳細な分析を行い、そのユニークな貢献と革新を強調します。
論文参考訳（メタデータ） (2025-02-18T17:34:04Z)
FaceLift: Learning Generalizable Single Image 3D Face Reconstruction from Synthetic Heads [54.24070918942727]
1枚の画像から高画質の360度3Dヘッドを復元するための新しいフィードフォワードアプローチであるFaceLiftを提案する。パイプラインはまずマルチビューの潜伏拡散モデルを用いて、1つの入力から一貫したサイドビューとバックビューを生成する。 FaceLiftは、アイデンティティ保存、ディテールリカバリ、レンダリング品質において、最先端の3D顔再構成方法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-12-23T18:59:49Z)
Artistic Intelligence: A Diffusion-Based Framework for High-Fidelity Landscape Painting Synthesis [2.205829309604458]
LPGenはランドスケープ・ペインティング・ジェネレーションに特化して設計された新しい拡散モデルである。 LPGenは、構造的およびスタイリスティックな特徴を独立して処理する分離されたクロスアテンションメカニズムを導入している。モデルは高解像度のランドスケープ画像のキュレートされたデータセットに事前トレーニングされ、異なる芸術様式で分類され、詳細で一貫した出力を確保するために微調整される。
論文参考訳（メタデータ） (2024-07-24T12:32:24Z)
Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [12.96911281844627]
本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文参考訳（メタデータ） (2024-07-22T07:29:38Z)
UrbanGenAI: Reconstructing Urban Landscapes using Panoptic Segmentation and Diffusion Models [0.0]
本稿では,都市デザインへの包括的アプローチとして,高度な画像分割と拡散モデルの相乗効果を活用するために,プロトタイプアプリケーション内にカプセル化された新しいワークフローを提案する。評価の結果,プロトタイプアプリケーションによる高い性能を示し,オブジェクト検出とテキスト・ツー・イメージ生成の両面で有意な精度を示した。予備試験には、デザイン教育における学習経験を高める教育ツールとしてのUrbanGenAIの活用と、コミュニティ主導の都市計画を促進する参加型機器の活用が含まれていた。
論文参考訳（メタデータ） (2024-01-25T18:30:46Z)
ReconFusion: 3D Reconstruction with Diffusion Priors [104.73604630145847]
本稿では,数枚の写真を用いて現実のシーンを再構成するReconFusionを提案する。提案手法は,合成および多視点データセットに基づいて訓練された新規なビュー合成に先立って拡散を利用する。本手法は,観測領域の外観を保ちながら,非拘束領域における現実的な幾何学とテクスチャを合成する。
論文参考訳（メタデータ） (2023-12-05T18:59:58Z)
Coloring the Past: Neural Historical Buildings Reconstruction from Archival Photography [69.93897305312574]
本稿では, ボリュームレンダリング技術を用いて, 歴史的建造物の形状を復元する手法を提案する。我々は,高密度点雲を幾何学的先行として利用し,カラー画像に制限のある建物の色を復元するために,色相の埋め込み損失を導入する。
論文参考訳（メタデータ） (2023-11-29T16:59:45Z)
Diffusion Models for Image Restoration and Enhancement -- A Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文参考訳（メタデータ） (2023-08-18T08:40:38Z)
IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-03-17T17:07:36Z)
Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文参考訳（メタデータ） (2022-05-25T17:59:53Z)
InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文参考訳（メタデータ） (2021-12-08T21:39:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。