論文の概要: Holistic Multi-View Building Analysis in the Wild with Projection
Pooling
- arxiv url: http://arxiv.org/abs/2008.10041v3
- Date: Sat, 19 Dec 2020 20:59:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 02:45:13.725409
- Title: Holistic Multi-View Building Analysis in the Wild with Projection
Pooling
- Title(参考訳): プロジェクション・プールを用いた野生の総合的多視点ビルディング解析
- Authors: Zbigniew Wojna, Krzysztof Maziarz, {\L}ukasz Jocz, Robert Pa{\l}uba,
Robert Kozikowski, Iasonas Kokkinos
- Abstract要約: 細粒度構造属性に関連する6つの異なる分類課題に対処する。
このようなリモート・ビルディング・アナリティクスの問題に対処することは、都市景観の大規模データセットの増大により、最近になって可能になった。
9674棟の49426画像(トップビューとストリートビュー)からなる新しいベンチマークデータセットを提案する。
- 参考スコア(独自算出の注目度): 18.93067906200084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address six different classification tasks related to fine-grained
building attributes: construction type, number of floors, pitch and geometry of
the roof, facade material, and occupancy class. Tackling such a remote building
analysis problem became possible only recently due to growing large-scale
datasets of urban scenes. To this end, we introduce a new benchmarking dataset,
consisting of 49426 images (top-view and street-view) of 9674 buildings. These
photos are further assembled, together with the geometric metadata. The dataset
showcases various real-world challenges, such as occlusions, blur, partially
visible objects, and a broad spectrum of buildings. We propose a new projection
pooling layer, creating a unified, top-view representation of the top-view and
the side views in a high-dimensional space. It allows us to utilize the
building and imagery metadata seamlessly. Introducing this layer improves
classification accuracy -- compared to highly tuned baseline models --
indicating its suitability for building analysis.
- Abstract(参考訳): 建設タイプ, 床数, 屋根のピッチと形状, ファサード材, 占有階級といった, きめ細かい建築特性に関する6つの異なる分類課題に対処する。
このようなリモートビル分析問題に取り組むことは、都市シーンの大規模データセットの成長によって最近初めて可能になった。
この目的のために,9674棟の49426画像(トップビューとストリートビュー)からなる新しいベンチマークデータセットを導入する。
これらの写真は幾何学的メタデータと共にさらに組み立てられる。
データセットには、オクルージョン、ぼやけ、部分的に見える物体、広い範囲の建物など、さまざまな現実世界の課題が展示されている。
本研究では,高次元空間におけるトップビューとサイドビューの統一的なトップビュー表現を作成する,新しい投影プーリング層を提案する。
これにより、ビルドとイメージメタデータをシームレスに利用することができます。
このレイヤの導入により、高度に調整されたベースラインモデルと比較して、分類精度が向上する。
関連論文リスト
- GBSS:a global building semantic segmentation dataset for large-scale
remote sensing building extraction [10.39943244036649]
我々は6大陸から116.9kのサンプル(約742kの建物)からなるグローバル・ビルディング・セマンティック・データセット(データセットを公開予定)を構築した。
サイズとスタイルの点で、ビルドサンプルには大きなバリエーションがあるため、セマンティックセグメンテーションモデルの構築の一般化と堅牢性を評価する上で、データセットはより難しいベンチマークになり得る。
論文 参考訳(メタデータ) (2024-01-02T12:13:35Z) - Building Height Prediction with Instance Segmentation [0.0]
本稿では, 一つのRGB衛星画像からビルディングマスクを推定するために, ケースセグメンテーションに基づくビルディング高さ抽出手法を提案する。
我々は,移動学習手法を用いたオープンソースの衛星データセットとともに,特定の都市の標高アノテーションを組み込んだ衛星画像を用いた。
我々は,テストセット内の各高さクラスに属する建物の平均精度を70%とし,境界箱mAP 59,マスクmAP 52.6に到達した。
論文 参考訳(メタデータ) (2022-12-19T07:12:49Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - OmniCity: Omnipotent City Understanding with Multi-level and Multi-view
Images [72.4144257192959]
本稿では,マルチレベル・マルチビュー画像から全能都市理解のための新しいデータセットであるOmniCityを提案する。
データセットには100万画素以上の注釈付き画像が含まれており、ニューヨーク市の25万画素のジオロケーションから順に収集されている。
新たなOmniCityデータセットでは,フットプリント抽出や高さ推定,平面/インスタンス/きめ細かなセグメンテーションなど,さまざまなタスクのベンチマークが提供されている。
論文 参考訳(メタデータ) (2022-08-01T15:19:25Z) - TMBuD: A dataset for urban scene building detection [0.0]
本稿では,都市景観における人造構造物の画像処理に適したデータセットソリューションTMBuDを提案する。
提案したデータセットは、建物の街路ビューに焦点をあてた画像の健全なエッジとセマンティックセグメンテーションの適切な評価を可能にする。
このデータセットは、ルーマニアのティミショアラから160枚の建物を撮影したもので、解像度は768 x 1024ピクセルである。
論文 参考訳(メタデータ) (2021-10-27T17:08:11Z) - BuildingNet: Learning to Label 3D Buildings [19.641000866952815]
BuildingNet: (a)外装が一貫してラベル付けされている大規模な3Dビルディングモデル、(b)幾何学的プリミティブの分析と構造的関係をビルディングにラベル付けするニューラルネットワーク。
データセットは、家、教会、高層ビル、市役所、城などのカテゴリをカバーしている。
論文 参考訳(メタデータ) (2021-10-11T01:45:26Z) - FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning [49.30194762653723]
本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
まず、新しいデータセットをコンパイルし、トレーニングサンプルを合成する新しいデータ拡張スキームを開発する。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴を関連付けるマルチタスク学習ネットワークである。
論文 参考訳(メタデータ) (2021-07-06T08:17:59Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-08-28T03:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。