論文の概要: Sketch-Based Facade Renovation With Generative AI: A Streamlined Framework for Bypassing As-Built Modelling in Industrial Adaptive Reuse
- arxiv url: http://arxiv.org/abs/2601.08531v1
- Date: Tue, 13 Jan 2026 13:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.211083
- Title: Sketch-Based Facade Renovation With Generative AI: A Streamlined Framework for Bypassing As-Built Modelling in Industrial Adaptive Reuse
- Title(参考訳): アクティビティ・アダプティブ・リユースにおけるアズ・ビルト・モデリングをバイパスする合理化フレームワーク「ジェネレーティブ・AI」によるスケッチベースのファサード・リノベーション」
- Authors: Warissara Booranamaitree, Xusheng Du, Yushu Cai, Zhengyang Wang, Ye Zhang, Haoran Xie,
- Abstract要約: 本稿では、生成人工知能(AI)と視覚言語モデル(VLM)を組み合わせた3段階の枠組みを提案し、一貫した改修提案を行う。
データセットと実際の産業ビルに関する実験から、提案手法は、ファサードのディテールの品質を改善しつつ、元の構造を保存するための改修提案を作成できることを示している。
- 参考スコア(独自算出の注目度): 18.541486953284437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facade renovation offers a more sustainable alternative to full demolition, yet producing design proposals that preserve existing structures while expressing new intent remains challenging. Current workflows typically require detailed as-built modelling before design, which is time-consuming, labour-intensive, and often involves repeated revisions. To solve this issue, we propose a three-stage framework combining generative artificial intelligence (AI) and vision-language models (VLM) that directly processes rough structural sketch and textual descriptions to produce consistent renovation proposals. First, the input sketch is used by a fine-tuned VLM model to predict bounding boxes specifying where modifications are needed and which components should be added. Next, a stable diffusion model generates detailed sketches of new elements, which are merged with the original outline through a generative inpainting pipeline. Finally, ControlNet is employed to refine the result into a photorealistic image. Experiments on datasets and real industrial buildings indicate that the proposed framework can generate renovation proposals that preserve the original structure while improving facade detail quality. This approach effectively bypasses the need for detailed as-built modelling, enabling architects to rapidly explore design alternatives, iterate on early-stage concepts, and communicate renovation intentions with greater clarity.
- Abstract(参考訳): ファサード・リノベーション(Facade renovation)は、完全な解体に代わるより持続可能な代替手段を提供するが、既存の構造を保存し、新しい意図を表現した設計提案は依然として難しいままである。
現在のワークフローは通常、設計前に構築された詳細なモデリングを必要とします。
この問題を解決するために,生成人工知能(AI)と視覚言語モデル(VLM)を組み合わせた3段階のフレームワークを提案する。
まず、入力スケッチは細調整されたVLMモデルによって、どの変更が必要か、どのコンポーネントを追加するべきかを指定するバウンディングボックスを予測するために使用される。
次に、安定拡散モデルが新しい要素の詳細なスケッチを生成し、生成的インペイントパイプラインを通じて元のアウトラインとマージする。
最後に、ControlNetは結果をフォトリアリスティックなイメージに洗練するために使用される。
データセットと実際の産業ビルに関する実験から、提案手法は、ファサードのディテールの品質を改善しつつ、元の構造を保存するための改修提案を作成できることを示している。
このアプローチは、構築された詳細なモデリングの必要性を効果的に回避し、設計上の代替案を迅速に探求し、アーリーステージの概念を反復し、より明確に再開発意図を伝達することを可能にする。
関連論文リスト
- Factuality Matters: When Image Generation and Editing Meet Structured Visuals [46.627460447235855]
我々は、13万の高品質な構造化画像対からなる大規模データセットを構築した。
FLUX.1 KontextとVLMを統合する統一モデルを訓練する。
3段階のトレーニングカリキュラムは、プログレッシブな特徴アライメント、知識の注入、推論による生成を可能にする。
論文 参考訳(メタデータ) (2025-10-06T17:56:55Z) - DeOcc-1-to-3: 3D De-Occlusion from a Single Image via Self-Supervised Multi-View Diffusion [50.90541069907167]
閉塞型マルチビュー生成のためのエンドツーエンドフレームワークであるDeOcc-1-to-3を提案する。
私たちの自己教師型トレーニングパイプラインは、隠蔽されたイメージペアと擬似地上構造ビューを活用して、モデル構造を意識した補完とビュー整合性を教える。
論文 参考訳(メタデータ) (2025-06-26T17:58:26Z) - Policy Optimized Text-to-Image Pipeline Design [73.9633527029941]
本稿では,テキスト・ツー・イメージ生成のための新しい強化学習フレームワークを提案する。
提案手法は、まず、画像品質のスコアをインタプリタ-ワークフローの組み合わせから直接予測できる報奨モデルのアンサンブルを訓練する。
次に、最初の語彙学習とGRPOに基づく最適化という2段階のトレーニング戦略を実装した。
論文 参考訳(メタデータ) (2025-05-27T17:50:47Z) - CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [69.83433430133302]
CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文 参考訳(メタデータ) (2025-05-25T12:14:23Z) - LIRM: Large Inverse Rendering Model for Progressive Reconstruction of Shape, Materials and View-dependent Radiance Fields [23.174562444342286]
本稿では,高品質な形状,材料,放射界を共同で再構成するトランスフォーマーアーキテクチャであるLarge Inverse Rendering Model(LIRM)を提案する。
我々のモデルは、現在最先端のスパース・ビュー・リコンストラクション品質を実現する、最近の大規模リコンストラクション・モデル(LRM)に基づいて構築されている。
論文 参考訳(メタデータ) (2025-04-28T17:48:58Z) - Pro-DG: Procedural Diffusion Guidance for Architectural Facade Generation [46.76076836382595]
Pro-DGは、手続き的に制御可能なフォトリアリスティックファサード生成のためのフレームワークである。
文法規則を用いてファサードのレイアウトを再構築し、ユーザ定義の変換によってその構造を編集する。
論文 参考訳(メタデータ) (2025-04-02T10:16:19Z) - ReMatching Dynamic Reconstruction Flow [55.272357926111454]
この研究は、動的再構成モデルに変形前処理を組み込むことにより、再構成品質を改善するために設計されたReMatchingフレームワークを導入している。
提案手法では,既存の動的再構成パイプラインをシームレスに補うためのマッチング手順を提案する。
合成・実世界の動的シーンを含む一般的なベンチマーク評価では, 現状の手法を改良することで, 再現精度が向上することが示されている。
論文 参考訳(メタデータ) (2024-11-01T16:09:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。