論文の概要: BFA-YOLO: A balanced multiscale object detection network for building façade attachments detection
- arxiv url: http://arxiv.org/abs/2409.04025v2
- Date: Mon, 11 Nov 2024 06:23:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:05:44.757684
- Title: BFA-YOLO: A balanced multiscale object detection network for building façade attachments detection
- Title(参考訳): BFA-YOLO:ファサードアタッチメント検出のためのバランスの取れたマルチスケール物体検出ネットワーク
- Authors: Yangguang Chen, Tong Wang, Guanzhou Chen, Kun Zhu, Xiaoliang Tan, Jiaqi Wang, Wenchao Guo, Qing Wang, Xiaolong Luo, Xiaodong Zhang,
- Abstract要約: 本研究では,BFA-YOLOモデルとBFA-3Dデータセットを開発した。
BFA-YOLOモデルは、ファサードアタッチメントのマルチビュー画像の分析に特化して設計された高度なアーキテクチャである。
BFA-YOLOは、BFA-3DデータセットとパブリックなFacade-WHUデータセットにおいて、mAP$_50$で1.8%と2.9%の改善を示した。
- 参考スコア(独自算出の注目度): 24.100350794625882
- License:
- Abstract: The detection of fa\c{c}ade elements on buildings, such as doors, windows, balconies, air conditioning units, billboards, and glass curtain walls, is a critical step in automating the creation of Building Information Modeling (BIM). Yet, this field faces significant challenges, including the uneven distribution of fa\c{c}ade elements, the presence of small objects, and substantial background noise, which hamper detection accuracy. To address these issues, we develop the BFA-YOLO model and the BFA-3D dataset in this study. The BFA-YOLO model is an advanced architecture designed specifically for analyzing multi-view images of fa\c{c}ade attachments. It integrates three novel components: the Feature Balanced Spindle Module (FBSM) that tackles the issue of uneven object distribution; the Target Dynamic Alignment Task Detection Head (TDATH) that enhances the detection of small objects; and the Position Memory Enhanced Self-Attention Mechanism (PMESA), aimed at reducing the impact of background noise. These elements collectively enable BFA-YOLO to effectively address each challenge, thereby improving model robustness and detection precision. The BFA-3D dataset, offers multi-view images with precise annotations across a wide range of fa\c{c}ade attachment categories. This dataset is developed to address the limitations present in existing fa\c{c}ade detection datasets, which often feature a single perspective and insufficient category coverage. Through comparative analysis, BFA-YOLO demonstrated improvements of 1.8\% and 2.9\% in mAP$_{50}$ on the BFA-3D dataset and the public Fa\c{c}ade-WHU dataset, respectively, when compared to the baseline YOLOv8 model. These results highlight the superior performance of BFA-YOLO in fa\c{c}ade element detection and the advancement of intelligent BIM technologies.
- Abstract(参考訳): ドア、窓、バルコニー、空調ユニット、看板、ガラスカーテンウォールなどの建物におけるfa\c{c}ade要素の検出は、ビルディング情報モデリング(BIM)の作成を自動化する重要なステップである。
しかし、この分野は、fa\c{c}ade要素の不均一な分布、小さな物体の存在、検出精度の低下など、重大な課題に直面している。
これらの課題に対処するため,本研究では,BFA-YOLOモデルとBFA-3Dデータセットを開発した。
BFA-YOLOモデルは、fa\c{c}adeアタッチメントのマルチビュー画像を分析するために特別に設計された高度なアーキテクチャである。
不均一なオブジェクト分散の問題に対処するFeature Balanced Spindle Module (FBSM)、小さなオブジェクトの検出を強化するTDATH(Target Dynamic Alignment Task Detection Head)、バックグラウンドノイズの影響を低減するための位置記憶強化自己認識メカニズム(PMESA)の3つの新しいコンポーネントを統合している。
これらの要素により、BFA-YOLOは各課題に効果的に対応することができ、モデルの堅牢性と検出精度が向上する。
BFA-3Dデータセットは、さまざまなfa\c{c}adeアタッチメントカテゴリにわたる正確なアノテーションを備えたマルチビュー画像を提供する。
このデータセットは、既存のfa\c{c}ade検出データセットに存在する制限に対処するために開発された。
比較分析により、BFA-YOLOは、ベースラインのYOLOv8モデルと比較して、BFA-3DデータセットとパブリックなFa\c{c}ade-WHUデータセットにおいて、mAP$_{50}$で1.8\%と2.9\%の改善を示した。
これらの結果は、fa\c{c}ade要素検出におけるBFA-YOLOの優れた性能とインテリジェントBIM技術の進歩を浮き彫りにした。
関連論文リスト
- Efficient Feature Aggregation and Scale-Aware Regression for Monocular 3D Object Detection [40.14197775884804]
MonoASRHは、効率的なハイブリッド特徴集約モジュール(EH-FAM)と適応スケール対応3D回帰ヘッド(ASRH)で構成される新しいモノクル3D検出フレームワークである。
EH-FAMは、小規模オブジェクトのセマンティックな特徴を抽出するために、グローバルな受容領域を持つマルチヘッドアテンションを用いる。
ASRHは2次元境界ボックス次元を符号化し、EH-FAMで集約された意味的特徴とスケール特徴を融合する。
論文 参考訳(メタデータ) (2024-11-05T02:33:25Z) - YOLOv11: An Overview of the Key Architectural Enhancements [0.5639904484784127]
本稿では、オブジェクト検出、インスタンスセグメンテーション、ポーズ推定、オブジェクト指向オブジェクト検出(OBB)など、さまざまなコンピュータビジョンタスクにまたがるYOLOv11の拡張機能について検討する。
本稿では,パラメータ数と精度のトレードオフに着目し,平均精度(mAP)と計算効率の両面からモデルの性能改善を概観する。
我々の研究は、オブジェクト検出の広い視野におけるYOLOv11の位置と、リアルタイムコンピュータビジョンアプリケーションに対する潜在的な影響についての洞察を提供する。
論文 参考訳(メタデータ) (2024-10-23T09:55:22Z) - A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Salient Object Detection via Integrity Learning [104.13483971954233]
整合性とは、ある有能な対象に属するすべての部分を強調する概念である。
ICON(Inteinity Cognition Network)の設計により,高感度物体検出のための整合性学習を容易にする。
ICONは3つの重要なコンポーネントを探索し、強力な整合性機能を学びます。
論文 参考訳(メタデータ) (2021-01-19T14:53:12Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Multi-View Adaptive Fusion Network for 3D Object Detection [14.506796247331584]
LiDAR-カメラ融合に基づく3Dオブジェクト検出は、自動運転の新たな研究テーマになりつつある。
本稿では,LiDARの鳥眼ビュー,LiDARレンジビュー,カメラビューイメージを3Dオブジェクト検出の入力として利用する,単一ステージ多視点融合フレームワークを提案する。
これら2つのコンポーネントを統合するために,MVAF-Netというエンドツーエンドの学習ネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-02T00:06:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。