論文の概要: From Clay to Code: Typological and Material Reasoning in AI Interpretations of Iranian Pigeon Towers
- arxiv url: http://arxiv.org/abs/2601.00029v1
- Date: Mon, 29 Dec 2025 20:03:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.225316
- Title: From Clay to Code: Typological and Material Reasoning in AI Interpretations of Iranian Pigeon Towers
- Title(参考訳): クレイからコードへ:イランのピジョンタワーのAI解釈におけるティポロジーと物質的推論
- Authors: Abolhassan Pishahang, Maryam Badiei,
- Abstract要約: 本研究では, 生成型AIシステムが, 頂点形に埋め込まれたアーキテクチャインテリジェンスをどのように解釈するかを検討する。
安定拡散XL(SDXL)に基づく3つの拡散モデルであるMidjourney v6, DALL-E 3, DreamStudioが試験された。
その結果、AIは幾何学的パターンを確実に再現するが、物質的推論と気候的推論を誤読することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates how generative AI systems interpret the architectural intelligence embedded in vernacular form. Using the Iranian pigeon tower as a case study, the research tests three diffusion models, Midjourney v6, DALL-E 3, and DreamStudio based on Stable Diffusion XL (SDXL), across three prompt stages: referential, adaptive, and speculative. A five-criteria evaluation framework assesses how each system reconstructs typology, materiality, environment, realism, and cultural specificity. Results show that AI reliably reproduces geometric patterns but misreads material and climatic reasoning. Reference imagery improves realism yet limits creativity, while freedom from reference generates inventive but culturally ambiguous outcomes. The findings define a boundary between visual resemblance and architectural reasoning, positioning computational vernacular reasoning as a framework for analyzing how AI perceives, distorts, and reimagines traditional design intelligence.
- Abstract(参考訳): 本研究では, 生成型AIシステムが, 頂点形に埋め込まれたアーキテクチャインテリジェンスをどのように解釈するかを検討する。
イランのハト塔をケーススタディとして、研究チームは3つの拡散モデル、Midjourney v6、DALL-E 3、DreamStudioをSDXL(Stable Diffusion XL)に基づいて試験した。
5つの基準評価フレームワークは, それぞれのシステムがタイプ, 物質性, 環境, リアリズム, 文化的特異性をどのように再構築するかを評価する。
その結果、AIは幾何学的パターンを確実に再現するが、物質的推論と気候的推論を誤読することがわかった。
参照画像はリアリズムを改善するが創造性を制限し、参照の自由は革新的だが文化的にあいまいな結果を生み出す。
この発見は、視覚的類似性とアーキテクチャ的推論の境界を定義し、AIが伝統的なデザインインテリジェンスをどのように知覚し、歪曲し、再想像するかを分析するためのフレームワークとして計算頂点推論を位置づけている。
関連論文リスト
- A Unified Representation Underlying the Judgment of Large Language Models [6.674085049223262]
生物学的および人工知能両方のアーキテクチャ上の問題は、判断が特別なモジュールに依存するか、あるいは統一されたドメイン・ジェネラル・リソースに依存しているかである。
評価判断が支配的次元に沿って計算されることを示し、これをVAA(Valence-Assent Axis)と呼ぶ。
VAAは生成過程の制御信号として機能し、実際の精度を犠牲にしても、その評価状態と整合した合理性を構築する。
論文 参考訳(メタデータ) (2025-10-31T09:57:19Z) - Modeling Open-World Cognition as On-Demand Synthesis of Probabilistic Models [93.1043186636177]
我々は、人々が分散表現と象徴表現の組み合わせを使って、新しい状況に合わせた見知らぬ精神モデルを構築するという仮説を探求する。
モデル合成アーキテクチャ」という概念の計算的実装を提案する。
我々は、新しい推論データセットに基づく人間の判断のモデルとして、MSAを評価した。
論文 参考訳(メタデータ) (2025-07-16T18:01:03Z) - Active Inference AI Systems for Scientific Discovery [1.450405446885067]
この観点では、進歩は抽象論、推論、経験的根拠の3つのギャップを互いに強化する。
デザイン原則は、想像空間を推論し、世界から学ぶシステムのために提案されている。
論文 参考訳(メタデータ) (2025-06-26T14:43:04Z) - SITE: towards Spatial Intelligence Thorough Evaluation [121.1493852562597]
空間知能 (Spatial Intelligence, SI) は、空間的関係の可視化、操作、推論を含む認知能力を表す。
SI Thorough Evaluationに向けたベンチマークデータセットであるSITEを紹介する。
ベンチマークの計算には、31の既存のデータセットに関するボトムアップ調査と、認知科学の3つの分類システムに基づくトップダウン戦略を組み合わせる。
論文 参考訳(メタデータ) (2025-05-08T17:45:44Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Unmaking AI Imagemaking: A Methodological Toolkit for Critical
Investigation [0.0]
本稿では,AI画像モデルに対する3つの手法を提案する。
エコシステムの開放は、モデルの生産を取り巻く価値、構造、インセンティブを分析します。
出力をアンメイキングすると、モデルの生成結果が分析され、そのロジックが明らかになる。
論文 参考訳(メタデータ) (2023-07-19T05:26:10Z) - From Word Models to World Models: Translating from Natural Language to
the Probabilistic Language of Thought [124.40905824051079]
言語インフォームド・シンキングのための計算フレームワークである「構成」を合理的に提案する。
我々は、自然言語から確率論的思考言語への文脈感応的なマッピングとして、言語の意味を定式化する。
LLMは、現実的に適切な言語的意味をキャプチャする文脈依存翻訳を生成することができることを示す。
認知的なモチベーションを持つシンボリックモジュールを統合するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2023-06-22T05:14:00Z) - AIGenC: An AI generalisation model via creativity [1.933681537640272]
本稿では,創造性に関する認知理論に触発された計算モデル(AIGenC)を紹介する。
人工エージェントが変換可能な表現を学習、使用、生成するために必要なコンポーネントを配置する。
本稿では, 人工エージェントの配当効率を向上するモデルの有効性について論じる。
論文 参考訳(メタデータ) (2022-05-19T17:43:31Z) - A Minimalist Dataset for Systematic Generalization of Perception,
Syntax, and Semantics [131.93113552146195]
我々は,機械が一般化可能な概念を学習する能力を調べるため,新しいデータセットであるHINT(Hand written arithmetic with INTegers)を提案する。
HINTでは、イメージなどの生信号から概念がどのように認識されるかを学ぶことが機械のタスクである。
我々は、RNN、Transformer、GPT-3など、様々なシーケンス・ツー・シーケンスモデルで広範囲に実験を行った。
論文 参考訳(メタデータ) (2021-03-02T01:32:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。