論文の概要: Zero-shot Building Age Classification from Facade Image Using GPT-4
- arxiv url: http://arxiv.org/abs/2404.09921v1
- Date: Mon, 15 Apr 2024 16:47:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-17 21:37:46.229480
- Title: Zero-shot Building Age Classification from Facade Image Using GPT-4
- Title(参考訳): GPT-4を用いたファサード画像からのゼロショット建築年代分類
- Authors: Zichao Zeng, June Moh Goo, Xinglei Wang, Bin Chi, Meihui Wang, Jan Boehm,
- Abstract要約: 論理命令を含むプロンプトを用いて、ファサード画像のためのゼロショット建築年齢分類器を開発する。
0.85年の平均絶対誤差は、モデルが小さなバイアスを伴うにもかかわらず、建設年代を予測できることを示している。
全体として、GPT-4 Visionを利用した分類器は、訓練することなく、単一のファサード画像から建物の粗い年齢のエポックを予測することができる。
- 参考スコア(独自算出の注目度): 0.7256915467062314
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A building's age of construction is crucial for supporting many geospatial applications. Much current research focuses on estimating building age from facade images using deep learning. However, building an accurate deep learning model requires a considerable amount of labelled training data, and the trained models often have geographical constraints. Recently, large pre-trained vision language models (VLMs) such as GPT-4 Vision, which demonstrate significant generalisation capabilities, have emerged as potential training-free tools for dealing with specific vision tasks, but their applicability and reliability for building information remain unexplored. In this study, a zero-shot building age classifier for facade images is developed using prompts that include logical instructions. Taking London as a test case, we introduce a new dataset, FI-London, comprising facade images and building age epochs. Although the training-free classifier achieved a modest accuracy of 39.69%, the mean absolute error of 0.85 decades indicates that the model can predict building age epochs successfully albeit with a small bias. The ensuing discussion reveals that the classifier struggles to predict the age of very old buildings and is challenged by fine-grained predictions within 2 decades. Overall, the classifier utilising GPT-4 Vision is capable of predicting the rough age epoch of a building from a single facade image without any training.
- Abstract(参考訳): 建物の建設年代は、多くの地理空間的応用を支援するために不可欠である。
最近の多くの研究は、深層学習を用いたファサード画像から建築年齢を推定することに焦点を当てている。
しかし、正確なディープラーニングモデルを構築するには、かなりの量のラベル付きトレーニングデータが必要である。
近年、GPT-4 Visionのような大規模な事前学習型視覚言語モデル(VLM)が、特定の視覚タスクを扱うためのトレーニング不要なツールとして登場したが、情報構築へのそれらの適用性や信頼性は未定のままである。
本研究では、ファサード画像のためのゼロショット建築年代分類器を論理命令を含むプロンプトを用いて開発する。
テストケースとしてロンドンを例として、ファサード画像と建築年齢のエポックを含む新しいデータセットFI-Londonを導入する。
トレーニングフリーの分類器は39.69%の精度を達成したが、平均的な0.85年間の平均的な絶対誤差は、モデルが小さなバイアスで建設年代を予測できることを示している。
その後の議論は、分類者が非常に古い建物の年齢を予測するのに苦労し、20年以内にきめ細かい予測に挑戦していることを示している。
全体として、GPT-4 Visionを利用する分類器は、訓練することなく、単一のファサード画像から建物の粗い年齢のエポックを予測することができる。
関連論文リスト
- Automated Real-World Sustainability Data Generation from Images of Buildings [0.0]
そこで本研究では,適切な迅速なエンジニアリングとドメイン知識を備えた大規模言語モデルを用いて,サステナビリティ計算に関係のあるビルディング特性を推定できることを示す。
提案手法を,47の集合住宅の実際の建物データからなる地上真実と比較し,その精度を人間よりも向上させる。
論文 参考訳(メタデータ) (2024-05-28T11:24:20Z) - Raising the Bar of AI-generated Image Detection with CLIP [50.345365081177555]
本研究の目的は、AI生成画像の普遍的検出のための事前学習された視覚言語モデル(VLM)の可能性を探ることである。
我々は,CLIP機能に基づく軽量な検出戦略を開発し,その性能を様々な難易度シナリオで検証する。
論文 参考訳(メタデータ) (2023-11-30T21:11:20Z) - Blind Dates: Examining the Expression of Temporality in Historical
Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。
我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。
解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文 参考訳(メタデータ) (2023-10-10T13:51:24Z) - Multi-view deep learning for reliable post-disaster damage
classification [0.0]
本研究は,人工知能(AI)と多視点画像を用いた,より信頼性の高い建築損傷分類を実現することを目的とする。
提案モデルでは, ハリケーン・ハーヴェイに続き, 調査対象の建物について, 専門家ラベル付きジオタグ付き画像を含む偵察視覚データセットを訓練し, 検証した。
論文 参考訳(メタデータ) (2022-08-06T01:04:13Z) - Unifying Language Learning Paradigms [96.35981503087567]
データセットやセットアップ全体にわたって普遍的に有効である事前学習モデルのための統一的なフレームワークを提案する。
本研究では, 事前学習対象を相互に配置し, 異なる対象間の補間を効果的に行う方法を示す。
また,テキスト内学習において,ゼロショットSuperGLUEで175B GPT-3,ワンショット要約でT5-XXLの性能を3倍に向上させた。
論文 参考訳(メタデータ) (2022-05-10T19:32:20Z) - Zero Shot Learning for Predicting Energy Usage of Buildings in
Sustainable Design [2.929237637363991]
2030年の挑戦は、2030年までにすべての新しい建物と大規模な改修をカーボン中立にすることを目的としている。
建築要素が建築のエネルギー利用にどのように貢献するかを理解することが重要である。
予測精度を向上させるために、AIベースのソリューションにリッチなトレーニングデータセットが必要である。
論文 参考訳(メタデータ) (2022-02-10T18:08:58Z) - LAE : Long-tailed Age Estimation [52.5745217752147]
まず、簡単な標準ベースラインを定式化し、事前トレーニング、データ拡張、モデルアーキテクチャなどのトリックを収集することで、はるかに強力なベースラインを構築します。
標準ベースラインと比較して,提案手法は推定誤差を著しく低減する。
本稿では,Long-tailed Age Estimation (LAE) という2段階の学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-25T09:05:44Z) - Continental-Scale Building Detection from High Resolution Satellite
Imagery [5.56205296867374]
アーキテクチャ,損失関数,正規化,事前学習,自己学習,後処理のバリエーションについて検討し,インスタンスセグメンテーション性能を向上する。
アフリカ全土の100万枚の衛星画像のデータセットを用いて、手動でラベル付けされた建築事例を含む実験が行われた。
本稿では,このモデルを用いた建物検出の性能向上のための新しい手法について報告する。
論文 参考訳(メタデータ) (2021-07-26T15:48:14Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。