論文の概要: FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning
- arxiv url: http://arxiv.org/abs/2107.02462v1
- Date: Tue, 6 Jul 2021 08:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 23:12:44.250271
- Title: FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning
- Title(参考訳): floorlevel-net:高度誘導マルチタスク学習によるフロアレベルライン認識
- Authors: Mengyang Wu, Wei Zeng, Chi-Wing Fu
- Abstract要約: 本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
まず、新しいデータセットをコンパイルし、トレーニングサンプルを合成する新しいデータ拡張スキームを開発する。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴を関連付けるマルチタスク学習ネットワークである。
- 参考スコア(独自算出の注目度): 49.30194762653723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to recognize the position and order of the floor-level lines that
divide adjacent building floors can benefit many applications, for example,
urban augmented reality (AR). This work tackles the problem of locating
floor-level lines in street-view images, using a supervised deep learning
approach. Unfortunately, very little data is available for training such a
network $-$ current street-view datasets contain either semantic annotations
that lack geometric attributes, or rectified facades without perspective
priors. To address this issue, we first compile a new dataset and develop a new
data augmentation scheme to synthesize training samples by harassing (i) the
rich semantics of existing rectified facades and (ii) perspective priors of
buildings in diverse street views. Next, we design FloorLevel-Net, a multi-task
learning network that associates explicit features of building facades and
implicit floor-level lines, along with a height-attention mechanism to help
enforce a vertical ordering of floor-level lines. The generated segmentations
are then passed to a second-stage geometry post-processing to exploit
self-constrained geometric priors for plausible and consistent reconstruction
of floor-level lines. Quantitative and qualitative evaluations conducted on
assorted facades in existing datasets and street views from Google demonstrate
the effectiveness of our approach. Also, we present context-aware image overlay
results and show the potentials of our approach in enriching AR-related
applications.
- Abstract(参考訳): 隣接する建物の床を分割するフロアレベルラインの位置と順序を認識する能力は、都市拡張現実(AR)など、多くの応用に有用である。
本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
残念なことに、現在のストリートビューデータセットの$-$は、幾何学的属性を持たないセマンティックアノテーションを含むネットワークや、パースペクティブを含まない修正ファサードといったトレーニング用のデータはほとんどありません。
この問題に対処するため,我々はまず,新しいデータセットをコンパイルし,既存のファサードの豊富な意味を嫌がらせ(i)し,(ii)多様な街並みの建築物の視点からトレーニングサンプルを合成する新しいデータ拡張手法を開発した。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴と、フロアレベルラインの垂直順序を強制するハイトアテンション機構を関連付けるマルチタスク学習ネットワークである。
生成されたセグメンテーションは第2段階の幾何後処理に渡され、フロアレベルラインの可塑性かつ一貫した再構築のために自己制約付き幾何前処理を利用する。
既存のデータセットのファサードとgoogleのストリートビューで行った定量的・質的評価は、このアプローチの有効性を示しています。
また、文脈対応画像オーバーレイ結果を示し、AR関連アプリケーションの強化におけるアプローチの可能性を示す。
関連論文リスト
- Fine-Grained Building Function Recognition from Street-View Images via Geometry-Aware Semi-Supervised Learning [18.432786227782803]
細粒度建物機能認識のための幾何対応半教師付きフレームワークを提案する。
半教師あり学習における擬似ラベルの精度を高めるために,マルチソースデータ間の幾何学的関係を利用する。
提案手法は, 建築物のきめ細かい機能認識において, 優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-18T12:48:48Z) - RoIPoly: Vectorized Building Outline Extraction Using Vertex and Logit Embeddings [5.093758132026397]
航空画像や衛星画像から建物概要を抽出する新しいクエリベースの手法を提案する。
クエリとして各ポリゴンを定式化し、潜在的ビルディングの最も関連性の高い領域に対してクエリの注意を拘束する。
本手法は,2次元フロアプラン再構築データセットであるStructured3Dを用いて,ベクトル化建物アウトライン抽出データセット(CrowdAI)と2次元フロアプラン再構築データセット(Structured3D)について評価する。
論文 参考訳(メタデータ) (2024-07-20T16:12:51Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - Segment Any Building [8.12405696290333]
この原稿は、画像にセグメンテーションを構築するための最先端表現学習パラダイムを用いて、多様なデータセットをタンデムで活用する能力をアクセント化する。
我々の前衛合同訓練体制は, 都市インフラ整備, 防災戦略, 生態モニタリングなど, 重要な分野に重大な影響を及ぼし, アプローチのメリットを浮き彫りにしている。
この研究の結果は、学術的な追求の基盤を固めることと、セグメンテーション構築の分野における革新的な応用による地平線を埋めることの両方に繋がる。
論文 参考訳(メタデータ) (2023-10-02T12:49:20Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - 3D Line Mapping Revisited [86.13455066577657]
LIMAPは、3Dラインマッピングのためのライブラリで、多視点画像から3Dラインマップを堅牢かつ効率的に作成する。
私たちのコードは、既存のポイントベースのStructure-from-Motionメソッドとシームレスに統合されます。
私たちの堅牢な3Dラインマップは、新たな研究方向も開きます。
論文 参考訳(メタデータ) (2023-03-30T16:14:48Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。