論文の概要: FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning
- arxiv url: http://arxiv.org/abs/2107.02462v1
- Date: Tue, 6 Jul 2021 08:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 23:12:44.250271
- Title: FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning
- Title(参考訳): floorlevel-net:高度誘導マルチタスク学習によるフロアレベルライン認識
- Authors: Mengyang Wu, Wei Zeng, Chi-Wing Fu
- Abstract要約: 本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
まず、新しいデータセットをコンパイルし、トレーニングサンプルを合成する新しいデータ拡張スキームを開発する。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴を関連付けるマルチタスク学習ネットワークである。
- 参考スコア(独自算出の注目度): 49.30194762653723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to recognize the position and order of the floor-level lines that
divide adjacent building floors can benefit many applications, for example,
urban augmented reality (AR). This work tackles the problem of locating
floor-level lines in street-view images, using a supervised deep learning
approach. Unfortunately, very little data is available for training such a
network $-$ current street-view datasets contain either semantic annotations
that lack geometric attributes, or rectified facades without perspective
priors. To address this issue, we first compile a new dataset and develop a new
data augmentation scheme to synthesize training samples by harassing (i) the
rich semantics of existing rectified facades and (ii) perspective priors of
buildings in diverse street views. Next, we design FloorLevel-Net, a multi-task
learning network that associates explicit features of building facades and
implicit floor-level lines, along with a height-attention mechanism to help
enforce a vertical ordering of floor-level lines. The generated segmentations
are then passed to a second-stage geometry post-processing to exploit
self-constrained geometric priors for plausible and consistent reconstruction
of floor-level lines. Quantitative and qualitative evaluations conducted on
assorted facades in existing datasets and street views from Google demonstrate
the effectiveness of our approach. Also, we present context-aware image overlay
results and show the potentials of our approach in enriching AR-related
applications.
- Abstract(参考訳): 隣接する建物の床を分割するフロアレベルラインの位置と順序を認識する能力は、都市拡張現実(AR)など、多くの応用に有用である。
本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
残念なことに、現在のストリートビューデータセットの$-$は、幾何学的属性を持たないセマンティックアノテーションを含むネットワークや、パースペクティブを含まない修正ファサードといったトレーニング用のデータはほとんどありません。
この問題に対処するため,我々はまず,新しいデータセットをコンパイルし,既存のファサードの豊富な意味を嫌がらせ(i)し,(ii)多様な街並みの建築物の視点からトレーニングサンプルを合成する新しいデータ拡張手法を開発した。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴と、フロアレベルラインの垂直順序を強制するハイトアテンション機構を関連付けるマルチタスク学習ネットワークである。
生成されたセグメンテーションは第2段階の幾何後処理に渡され、フロアレベルラインの可塑性かつ一貫した再構築のために自己制約付き幾何前処理を利用する。
既存のデータセットのファサードとgoogleのストリートビューで行った定量的・質的評価は、このアプローチの有効性を示しています。
また、文脈対応画像オーバーレイ結果を示し、AR関連アプリケーションの強化におけるアプローチの可能性を示す。
関連論文リスト
- Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Segment Any Building [8.12405696290333]
この原稿は、画像にセグメンテーションを構築するための最先端表現学習パラダイムを用いて、多様なデータセットをタンデムで活用する能力をアクセント化する。
我々の前衛合同訓練体制は, 都市インフラ整備, 防災戦略, 生態モニタリングなど, 重要な分野に重大な影響を及ぼし, アプローチのメリットを浮き彫りにしている。
この研究の結果は、学術的な追求の基盤を固めることと、セグメンテーション構築の分野における革新的な応用による地平線を埋めることの両方に繋がる。
論文 参考訳(メタデータ) (2023-10-02T12:49:20Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - 3D Line Mapping Revisited [86.13455066577657]
LIMAPは、3Dラインマッピングのためのライブラリで、多視点画像から3Dラインマップを堅牢かつ効率的に作成する。
私たちのコードは、既存のポイントベースのStructure-from-Motionメソッドとシームレスに統合されます。
私たちの堅牢な3Dラインマップは、新たな研究方向も開きます。
論文 参考訳(メタデータ) (2023-03-30T16:14:48Z) - Parsing Line Segments of Floor Plan Images Using Graph Neural Networks [0.0]
接合ヒートマップを用いて線セグメントの終端を予測し,グラフニューラルネットワークを用いて線セグメントとそのカテゴリを抽出する。
提案手法では,ベクトル化された線分を出力することができ,実際の使用には後処理のステップを少なくする必要がある。
論文 参考訳(メタデータ) (2023-03-07T12:32:19Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Representing Deep Neural Networks Latent Space Geometries with Graphs [38.63434325489782]
ディープラーニング(DL)は多くの機械学習タスクで最先端のパフォーマンスに到達する能力に多くの注目を集めている。
本研究は, 様々な問題に対処するために, これらの潜在測地に関する制約を導入することが可能であることを示す。
論文 参考訳(メタデータ) (2020-11-14T17:21:29Z) - Holistic Multi-View Building Analysis in the Wild with Projection
Pooling [18.93067906200084]
細粒度構造属性に関連する6つの異なる分類課題に対処する。
このようなリモート・ビルディング・アナリティクスの問題に対処することは、都市景観の大規模データセットの増大により、最近になって可能になった。
9674棟の49426画像(トップビューとストリートビュー)からなる新しいベンチマークデータセットを提案する。
論文 参考訳(メタデータ) (2020-08-23T13:49:22Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。