論文の概要: Generative AI and the History of Architecture
- arxiv url: http://arxiv.org/abs/2312.15106v1
- Date: Fri, 22 Dec 2023 23:02:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:50:22.458480
- Title: Generative AI and the History of Architecture
- Title(参考訳): 生成AIと建築史
- Authors: Joern Ploennigs and Markus Berger
- Abstract要約: 異なるアーキテクチャスタイルのテキストと画像生成のための生成AIプラットフォームについて検討する。
私たちは、10100万のMidjourneyクエリのデータセットを分析し、実践者がすでに特定のアーキテクチャ概念をクエリしているかどうかを確認します。
- 参考スコア(独自算出の注目度): 0.6993026261767287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent generative AI platforms are able to create texts or impressive images
from simple text prompts. This makes them powerful tools for summarizing
knowledge about architectural history or deriving new creative work in early
design tasks like ideation, sketching and modelling. But, how good is the
understanding of the generative AI models of the history of architecture? Has
it learned to properly distinguish styles, or is it hallucinating information?
In this chapter, we investigate this question for generative AI platforms for
text and image generation for different architectural styles, to understand the
capabilities and boundaries of knowledge of those tools. We also analyze how
they are already being used by analyzing a data set of 101 million Midjourney
queries to see if and how practitioners are already querying for specific
architectural concepts.
- Abstract(参考訳): 最近の生成aiプラットフォームは、単純なテキストプロンプトからテキストや印象的なイメージを作成できる。
これにより、アーキテクチャ履歴に関する知識を要約したり、アイデア、スケッチ、モデリングといった初期のデザインタスクで新しい創造的な仕事を引き出す強力なツールになります。
しかし、建築史における生成的AIモデルの理解は、どの程度優れているのか?
スタイルを適切に区別することを学んだか、あるいは情報を幻覚させるか?
本章では,これらのツールの知識の能力と境界を理解するために,異なるアーキテクチャスタイルのテキストと画像生成のための生成AIプラットフォームに対するこの問題について検討する。
また、1億100万のMidjourneyクエリのデータセットを分析して、実践者がすでに特定のアーキテクチャ概念を問合っているかどうか、どのように分析しています。
関連論文リスト
- GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - From Manifestations to Cognitive Architectures: a Scalable Framework [2.6563873893593826]
本稿では,現実を情報源として解釈する新しい手法を提案する。
このフレームワークは、Long Term MemoryやWorking Memoryといった、古典的な認知アーキテクチャの要素を構築することができる。
論文 参考訳(メタデータ) (2024-06-14T08:26:26Z) - Visual Knowledge in the Big Model Era: Retrospect and Prospect [63.282425615863]
視覚知識は、視覚概念とその関係を簡潔で包括的で解釈可能な方法でカプセル化できる新しい知識表現である。
視覚世界に関する知識は、人間の認知と知性にとって欠かせない要素として認識されているため、視覚知識は、機械知性を確立する上で重要な役割を担っていると考えられる。
論文 参考訳(メタデータ) (2024-04-05T07:31:24Z) - Sketch-to-Architecture: Generative AI-aided Architectural Design [20.42779592734634]
簡単なスケッチから概念的なフロアプランと3Dモデルを生成するために,AIモデルを利用する新しいワークフローを提案する。
我々の研究は、アーキテクチャ設計プロセスにおける生成AIの可能性を示し、コンピュータ支援アーキテクチャ設計の新しい方向性を指し示している。
論文 参考訳(メタデータ) (2024-03-29T14:04:45Z) - ArchiGuesser -- AI Art Architecture Educational Game [0.5919433278490629]
生成AIは、単純な入力プロンプトに基づいて、テキスト、音声、画像から教育コンテンツを作成することができる。
本稿では,様々なAI技術を組み合わせた多感覚学習ゲームArchiGuesserについて述べる。
論文 参考訳(メタデータ) (2023-12-14T20:48:26Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Unfinished Architectures: A Perspective from Artificial Intelligence [73.52315464582637]
人工知能(AI)の開発は、未完成のアーキテクチャの完成の可能性を提案する新たな道を開く。
DALL-Eのような最近のツールでは、テキスト記述でガイドされた画像が完成する。
本稿では、歴史的寺院の未完成のファサードの完成にこれらの新しいAIツールを使用することについて検討し、建築図学の分野におけるまだ老朽化したスタジアムの分析を行う。
論文 参考訳(メタデータ) (2023-03-03T13:05:10Z) - The Construction of Reality in an AI: A Review [0.0]
本稿では,構成主義的AI実装に対する意識を高めることを目的とする。
2008年のGuerin氏の“Learning Like a Baby: A Survey of AI approach”をベースとしている。
その焦点は、ピアジェのスキーマのレンズを通して実際に見られる知識表現と学習アルゴリズムである。
論文 参考訳(メタデータ) (2023-02-03T22:52:17Z) - AI Art in Architecture [0.6853165736531939]
最近の拡散ベースのAIアートプラットフォームは、単純なテキスト記述から印象的なイメージを作成することができる。
これはアーキテクチャ設計の初期段階にも当てはまり、アイデア、スケッチ、モデリングの段階が複数ある。
アーキテクチャ設計における一連の一般的なユースケースに対して,Midjourney,DALL-E 2,StableDiffusionの各プラットフォームの適用性について検討する。
論文 参考訳(メタデータ) (2022-12-19T12:24:14Z) - The Curious Layperson: Fine-Grained Image Recognition without Expert
Labels [90.88501867321573]
我々は、専門家のアノテーションを使わずに、きめ細かい画像認識という新しい問題を考える。
非専門的な画像記述を用いてオブジェクトの視覚的外観を記述するモデルを学ぶ。
次に、画像記述と文書とを文レベルでマッチングする、きめ細かいテキスト類似性モデルを訓練する。
論文 参考訳(メタデータ) (2021-11-05T17:58:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。