論文の概要: Symbol Spotting on Digital Architectural Floor Plans Using a Deep
Learning-based Framework
- arxiv url: http://arxiv.org/abs/2006.00684v1
- Date: Mon, 1 Jun 2020 03:16:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 06:32:28.039310
- Title: Symbol Spotting on Digital Architectural Floor Plans Using a Deep
Learning-based Framework
- Title(参考訳): 深層学習フレームワークを用いたデジタル建築床計画におけるシンボルスポッティング
- Authors: Alireza Rezvanifar, Melissa Cote, Alexandra Branzan Albu
- Abstract要約: 本稿では,ディープラーニング(DL)フレームワークを用いた実世界のデジタル建築フロア計画のシンボルスポッティングに焦点を当てた。
本稿では,DLベースのオブジェクト検出ネットワークに特有な問題を避けるため,タイルに基づくトレーニング戦略を提案する。
実世界のフロアプランにおける実験により,クラス内類似度が低く,図形的複雑性が変化するアーキテクチャシンボルの検出に成功していることが示された。
- 参考スコア(独自算出の注目度): 76.70609932823149
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This papers focuses on symbol spotting on real-world digital architectural
floor plans with a deep learning (DL)-based framework. Traditional on-the-fly
symbol spotting methods are unable to address the semantic challenge of
graphical notation variability, i.e. low intra-class symbol similarity, an
issue that is particularly important in architectural floor plan analysis. The
presence of occlusion and clutter, characteristic of real-world plans, along
with a varying graphical symbol complexity from almost trivial to highly
complex, also pose challenges to existing spotting methods. In this paper, we
address all of the above issues by leveraging recent advances in DL and
adapting an object detection framework based on the You-Only-Look-Once (YOLO)
architecture. We propose a training strategy based on tiles, avoiding many
issues particular to DL-based object detection networks related to the relative
small size of symbols compared to entire floor plans, aspect ratios, and data
augmentation. Experiments on real-world floor plans demonstrate that our method
successfully detects architectural symbols with low intra-class similarity and
of variable graphical complexity, even in the presence of heavy occlusion and
clutter. Additional experiments on the public SESYD dataset confirm that our
proposed approach can deal with various degradation and noise levels and
outperforms other symbol spotting methods.
- Abstract(参考訳): 本稿では、ディープラーニング(DL)ベースのフレームワークを用いた実世界のデジタル建築フロアプランのシンボルスポッティングに焦点を当てる。
従来のオン・ザ・フライのシンボルスポッティング手法では、図式表記のばらつき、すなわちクラス内シンボルの類似性の低さという意味的課題に対処できない。
現実世界の計画の特徴である隠蔽と乱雑の存在と、ほとんど自明なものから非常に複雑なものまで様々にグラフィカルなシンボルの複雑さは、既存のスポッティング手法にも問題を引き起こす。
本稿では、最近のDLの進歩を活用し、You-Only-Look-Once(YOLO)アーキテクチャに基づいたオブジェクト検出フレームワークを適用することで、上記の問題に対処する。
タイルに基づくトレーニング戦略を提案し,床全体の計画やアスペクト比,データ拡張などと比較して,シンボルの相対的小ささに関連するdlベースの物体検出ネットワークに関する多くの問題を回避した。
実世界のフロアプランにおける実験により, ヘビーオクルージョンやクラッタの存在下でも, クラス内類似度が低く, グラフィカルな複雑度も低い建築シンボルを検出できることが証明された。
SESYDデータセットのさらなる実験により、提案手法は様々な劣化やノイズレベルに対処し、他のシンボルスポッティング法より優れていることを確認した。
関連論文リスト
- ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Symbolic Visual Reinforcement Learning: A Scalable Framework with
Object-Level Abstraction and Differentiable Expression Search [63.3745291252038]
DiffSESは、離散的なシンボルポリシーを発見する新しいシンボリック学習手法である。
生のピクセルレベルの入力の代わりにオブジェクトレベルの抽象化を使用することで、DiffSESはシンボリック表現の単純さとスケーラビリティの利点を活用することができる。
我々の実験は、DiffSESが最先端のシンボルRL法よりもシンプルでスケーラブルなシンボリックポリシーを生成することができることを示した。
論文 参考訳(メタデータ) (2022-12-30T17:50:54Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction [2.9896482273918434]
本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。
我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。
提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
論文 参考訳(メタデータ) (2022-03-04T07:05:23Z) - FloorPlanCAD: A Large-Scale CAD Drawing Dataset for Panoptic Symbol
Spotting [38.987494792258694]
FloorPlanCADは1万以上のフロアプランを含む大規模実世界のCAD描画データセットである。
グラフ畳み込みニューラルネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
提案したCNN-GCN法は意味記号スポッティングのタスクにおいて最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2021-05-15T06:01:11Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。