論文の概要: Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models
- arxiv url: http://arxiv.org/abs/2509.17283v1
- Date: Sun, 21 Sep 2025 23:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.198826
- Title: Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models
- Title(参考訳): ドア検出と大規模言語モデルを用いた建物コンプライアンスチェックのための自動施設列挙
- Authors: Licheng Zhan, Bach Le, Naveed Akhtar, Tuan Ngo,
- Abstract要約: ビルコンプライアンスチェック(BCC)は、建設施設が規制基準を満たすことを保証するための重要なプロセスである。
その重要性にもかかわらず、この問題はほとんど文献で見過ごされてきた。
大規模言語モデル(LLM)の最近の進歩は、自動化を強化する新たな機会を提供する。
- 参考スコア(独自算出の注目度): 28.03765868427712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building compliance checking (BCC) is a critical process for ensuring that constructed facilities meet regulatory standards. A core component of BCC is the accurate enumeration of facility types and their spatial distribution. Despite its importance, this problem has been largely overlooked in the literature, posing a significant challenge for BCC and leaving a critical gap in existing workflows. Performing this task manually is time-consuming and labor-intensive. Recent advances in large language models (LLMs) offer new opportunities to enhance automation by combining visual recognition with reasoning capabilities. In this paper, we introduce a new task for BCC: automated facility enumeration, which involves validating the quantity of each facility type against statutory requirements. To address it, we propose a novel method that integrates door detection with LLM-based reasoning. We are the first to apply LLMs to this task and further enhance their performance through a Chain-of-Thought (CoT) pipeline. Our approach generalizes well across diverse datasets and facility types. Experiments on both real-world and synthetic floor plan data demonstrate the effectiveness and robustness of our method.
- Abstract(参考訳): ビルコンプライアンスチェック(BCC)は、建設施設が規制基準を満たすことを保証するための重要なプロセスである。
BCCのコアコンポーネントは、施設タイプとその空間分布の正確な列挙である。
その重要性にもかかわらず、この問題は文献でおおむね見落とされ、BCCにとって重大な課題となり、既存のワークフローに重大なギャップを残している。
このタスクを手動で実行するのは時間と労力のかかる作業です。
大規模言語モデル(LLM)の最近の進歩は、視覚認識と推論機能を組み合わせることで、自動化を強化する新たな機会を提供する。
本稿では,BCCにおける新たな課題である自動施設列挙(automated facilities enumeration)について紹介する。
そこで本研究では,ドア検出とLCMに基づく推論を統合した新しい手法を提案する。
LLMをこのタスクに適用し、Chain-of-Thought(CoT)パイプラインを通じてそのパフォーマンスをさらに向上しました。
我々のアプローチは多様なデータセットや施設タイプにまたがってうまく一般化されている。
実世界のフロアプランデータと合成フロアプランデータの両方を用いた実験により,本手法の有効性とロバスト性を実証した。
関連論文リスト
- LLM-as-classifier: Semi-Supervised, Iterative Framework for Hierarchical Text Classification using Large Language Models [0.0]
大規模言語モデル(LLM)は、構造化されていないテキストデータを解析する前例のない機能を提供している。
標準的な微調整アプローチはリソース集約的であり、実世界のデータ分散の動的な性質にしばしば苦労する。
論文 参考訳(メタデータ) (2025-08-22T15:47:17Z) - Large Language Model-Driven Code Compliance Checking in Building Information Modeling [3.2648052741820166]
本研究では,ビルディングインフォメーション・モデリングにおける手動コードコンプライアンスチェックの時間的およびエラーの原因となる特性について考察する。
この重要なプロセスを半自動化するために、LLM(Large Language Model)駆動のアプローチを導入している。
開発システムは、GPT、Claude、Gemini、LlamaなどのLLMとRevitソフトウェアを統合し、ビルドコードを解釈し、Pythonスクリプトを生成し、半自動コンプライアンスチェックを実行する。
論文 参考訳(メタデータ) (2025-06-25T15:50:34Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.667202878390526]
長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。
実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。
以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文 参考訳(メタデータ) (2024-06-19T00:28:58Z) - CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks [14.603394022550864]
CheckEmbed (CE)は、大規模言語モデル(LLM)の単純でスケーラブルで正確な検証方法である。
CEは、全問合せレベルで、高速でセマンティックにリッチな比較を行い、精度とスケーラビリティの両方において重要な制限を克服します。
実験の結果,CEは閉じたタスクとオープンエンドタスクの両方の幻覚を確実に検出することがわかった。
論文 参考訳(メタデータ) (2024-06-04T17:42:21Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。