論文の概要: Enhanced Object Detection in Floor-plan through Super Resolution
- arxiv url: http://arxiv.org/abs/2112.09844v1
- Date: Sat, 18 Dec 2021 05:06:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 03:23:44.345899
- Title: Enhanced Object Detection in Floor-plan through Super Resolution
- Title(参考訳): 超解像によるフロアプランにおける物体検出の強化
- Authors: Dev Khare, N S Kamal, Barathi Ganesh HB, V Sowmya, V V Sajith Variyar
- Abstract要約: 情報モデリングソフトウェアの構築は、スケーラブルなベクトルフォーマットを使用してフロアプランの柔軟な設計を可能にする。
フロアプラン画像から完全アノテートベクター画像への変換は、コンピュータビジョンによって実現されたプロセスである。
Super-Resolution (SR) はコンピュータビジョンにおいて確立されたCNNベースのネットワークであり、低解像度画像を高解像度に変換するために使用される。
- 参考スコア(独自算出の注目度): 1.9599274203282302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building Information Modelling (BIM) software use scalable vector formats to
enable flexible designing of floor plans in the industry. Floor plans in the
architectural domain can come from many sources that may or may not be in
scalable vector format. The conversion of floor plan images to fully annotated
vector images is a process that can now be realized by computer vision. Novel
datasets in this field have been used to train Convolutional Neural Network
(CNN) architectures for object detection. Image enhancement through
Super-Resolution (SR) is also an established CNN based network in computer
vision that is used for converting low resolution images to high resolution
ones. This work focuses on creating a multi-component module that stacks a SR
model on a floor plan object detection model. The proposed stacked model shows
greater performance than the corresponding vanilla object detection model. For
the best case, the the inclusion of SR showed an improvement of 39.47% in
object detection over the vanilla network. Data and code are made publicly
available at https://github.com/rbg-research/Floor-Plan-Detection.
- Abstract(参考訳): 情報モデリング(BIM)ソフトウェアの構築は、スケーラブルなベクトルフォーマットを使用して、業界におけるフロアプランの柔軟な設計を可能にする。
アーキテクチャ領域のフロアプランは、スケーラブルなベクターフォーマットであるかもしれないし、そうでないかもしれない多くのソースから得ることができる。
フロアプラン画像から完全にアノテートされたベクトル画像への変換は、コンピュータビジョンによって実現可能なプロセスである。
この分野での新しいデータセットは、オブジェクト検出のための畳み込みニューラルネットワーク(CNN)アーキテクチャのトレーニングに使用されている。
Super-Resolution (SR)による画像強調はコンピュータビジョンにおいて確立されたCNNベースのネットワークであり、低解像度画像から高解像度画像への変換に用いられる。
この研究は、フロアプランオブジェクト検出モデル上にSRモデルを積み重ねるマルチコンポーネントモジュールの作成に焦点を当てている。
提案するスタックモデルでは,対応するバニラ物体検出モデルよりも高い性能を示す。
最良の場合、SRが組み込まれたことにより、バニラネットワーク上での物体検出は39.47%改善した。
データとコードはhttps://github.com/rbg-research/Floor-Plan-Detectionで公開されている。
関連論文リスト
- Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Aug3D-RPN: Improving Monocular 3D Object Detection by Synthetic Images
with Virtual Depth [64.29043589521308]
仮想深度で画像を合成することでトレーニングデータを増強するレンダリングモジュールを提案する。
レンダリングモジュールは、RGB画像と対応するスパース深度画像とを入力として、さまざまなフォトリアリスティック合成画像を出力する。
さらに,深度推定タスクを通じて共同で最適化することで,検出モデルを改善する補助モジュールを導入する。
論文 参考訳(メタデータ) (2021-07-28T11:00:47Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Learning Feature Aggregation for Deep 3D Morphable Models [57.1266963015401]
階層レベルで機能集約を向上するためのマッピング行列を学習するための注意に基づくモジュールを提案する。
実験の結果,マッピング行列のエンドツーエンドトレーニングにより,様々な3次元形状データセットの最先端結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-05T16:41:00Z) - An Evolution of CNN Object Classifiers on Low-Resolution Images [0.4129225533930965]
低画質画像からのオブジェクト分類は、対象色、アスペクト比、乱れ背景のばらつきに対して困難である。
深層畳み込みニューラルネットワーク(DCNN)は、高解像度画像からオブジェクト分類の課題に直面する非常に強力なシステムとして実証されています。
本稿では,DCNNアーキテクチャを用いて低品質画像を正確に分類する最適アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2021-01-03T18:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。