論文の概要: OpenConstruction: A Systematic Synthesis of Open Visual Datasets for Data-Centric Artificial Intelligence in Construction Monitoring
- arxiv url: http://arxiv.org/abs/2508.11482v1
- Date: Fri, 15 Aug 2025 13:56:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:24.034669
- Title: OpenConstruction: A Systematic Synthesis of Open Visual Datasets for Data-Centric Artificial Intelligence in Construction Monitoring
- Title(参考訳): OpenConstruction: 構築監視におけるデータ中心人工知能のためのオープンビジュアルデータセットの体系的合成
- Authors: Ruoxin Xiong, Yanyu Wang, Jiannan Cai, Kaijian Liu, Yuansheng Zhu, Pingbo Tang, Nora El-Gohary,
- Abstract要約: 建設業界は、サイト監視のための人工知能(AI)と機械学習(ML)アプリケーションをサポートするために、視覚データにますます依存している。
ビジュアルデータセットへの関心が高まりつつあるにもかかわらず、既存のリソースは、実世界の建設条件のサイズ、品質、代表性に大きく変化している。
本研究では,これらの知見をオープンソースカタログであるOpenConstructionに合成し,データ駆動型手法開発を支援する。
- 参考スコア(独自算出の注目度): 4.795391174842949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The construction industry increasingly relies on visual data to support Artificial Intelligence (AI) and Machine Learning (ML) applications for site monitoring. High-quality, domain-specific datasets, comprising images, videos, and point clouds, capture site geometry and spatiotemporal dynamics, including the location and interaction of objects, workers, and materials. However, despite growing interest in leveraging visual datasets, existing resources vary widely in sizes, data modalities, annotation quality, and representativeness of real-world construction conditions. A systematic review to categorize their data characteristics and application contexts is still lacking, limiting the community's ability to fully understand the dataset landscape, identify critical gaps, and guide future directions toward more effective, reliable, and scalable AI applications in construction. To address this gap, this study conducts an extensive search of academic databases and open-data platforms, yielding 51 publicly available visual datasets that span the 2005-2024 period. These datasets are categorized using a structured data schema covering (i) data fundamentals (e.g., size and license), (ii) data modalities (e.g., RGB and point cloud), (iii) annotation frameworks (e.g., bounding boxes), and (iv) downstream application domains (e.g., progress tracking). This study synthesizes these findings into an open-source catalog, OpenConstruction, supporting data-driven method development. Furthermore, the study discusses several critical limitations in the existing construction dataset landscape and presents a roadmap for future data infrastructure anchored in the Findability, Accessibility, Interoperability, and Reusability (FAIR) principles. By reviewing the current landscape and outlining strategic priorities, this study supports the advancement of data-centric solutions in the construction sector.
- Abstract(参考訳): 建設業界は、サイト監視のための人工知能(AI)と機械学習(ML)アプリケーションをサポートするために、視覚データにますます依存している。
画像、ビデオ、ポイントクラウドで構成される高品質でドメイン固有のデータセットは、場所、作業者、材料の位置と相互作用を含む、サイト形状と時空間のダイナミクスをキャプチャする。
しかし、ビジュアルデータセットを活用することへの関心が高まっているにもかかわらず、既存のリソースは、サイズ、データモダリティ、アノテーションの品質、実世界の建設条件の代表性など、多岐にわたる。
データの特徴とアプリケーションコンテキストを分類する体系的なレビューは、まだ不足しており、データセットのランドスケープを完全に理解し、重要なギャップを特定し、建設中のより効率的で信頼性が高くスケーラブルなAIアプリケーションに向けた今後の方向性を導く、コミュニティの能力を制限している。
このギャップに対処するため,本研究では学術データベースとオープンデータプラットフォームを広範囲に探索し,2005~2024年の間に51のビジュアルデータセットを公開している。
これらのデータセットは構造化されたデータスキーマで分類される
(i)データの基本(例、サイズ、ライセンス)
(ii)データモダリティ(例えば、RGB、ポイントクラウド)
(iii)アノテーションフレームワーク(例、バウンディングボックス)、
(iv)ダウンストリームアプリケーションドメイン(例:進捗追跡)。
本研究では,これらの知見をオープンソースカタログであるOpenConstructionに合成し,データ駆動型手法開発を支援する。
さらに、既存の構築データセットのランドスケープにおけるいくつかの重要な制限について論じ、Finderability、Accessibility、Interoperability、Reusability(FAIR)の原則に準拠した将来のデータインフラストラクチャのロードマップを示す。
本研究は, 現状を概観し, 戦略的優先事項を概説することにより, 建設セクターにおけるデータ中心型ソリューションの進展を支援する。
関連論文リスト
- Graph Foundation Models: A Comprehensive Survey [66.74249119139661]
Graph Foundation Models (GFMs)は、構造化データにスケーラブルで汎用的なインテリジェンスを提供することを目指している。
この調査は、GFMの概要を包括的に提供し、モジュラーフレームワークの下での多様な取り組みを統合する。
GFMは構造化データに対するオープンエンド推論の基盤となる。
論文 参考訳(メタデータ) (2025-05-21T05:08:00Z) - OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery [4.33299613844962]
建築特性は空間データ基盤において重要な役割を担い、エネルギーシミュレーション、リスク評価、環境モデリングなどの応用を支援する。
近年の進歩により、リモートセンシングとストリートレベルの画像を用いた客観的建物属性の抽出とタグ付けが可能になった。
この研究は,クラウドソースデータを活用したオープンなフレームワークであるOpenFACADESを導入して,そのギャップを埋めるものである。
論文 参考訳(メタデータ) (2025-04-01T08:20:13Z) - Investigating Public Fine-Tuning Datasets: A Complex Review of Current Practices from a Construction Perspective [2.12587313410587]
本稿では、データ構築の観点から、現在の公開微調整データセットをレビューする。
このレビューでは、進化と分類の2つの側面から、パブリックな微調整データセットの概要を述べる。
論文 参考訳(メタデータ) (2024-07-11T13:11:16Z) - The GOOSE Dataset for Perception in Unstructured Environments [3.0408645115035036]
本研究では,非構造屋外環境を対象とした包括的データセットを提案する。
GOOSEデータセットには10万のラベル付きイメージとポイントクラウドが含まれており、さまざまな最先端セグメンテーションモデルをトレーニングするために使用される。
このイニシアチブは、既存のデータセットのシームレスなインクルージョンを可能にし、非構造化環境で動作しているさまざまなロボットの知覚能力を高めるための、共通のフレームワークを確立することを目的としている。
論文 参考訳(メタデータ) (2023-10-25T17:20:38Z) - Data Mesh: a Systematic Gray Literature Review [3.038477115588261]
Data Meshは、運用上のボトルネックを最小限に抑え、回避することを目的とした、新たなドメイン駆動の分散データアーキテクチャである。
我々は114の産業用グレー文学論文を体系的に収集,分析,合成した。
このレビューは、データメッシュの4つの重要な原則に関する実践者の視点に関する洞察を提供する。
論文 参考訳(メタデータ) (2023-04-03T15:16:46Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。