論文の概要: FGSSNet: Feature-Guided Semantic Segmentation of Real World Floorplans
- arxiv url: http://arxiv.org/abs/2507.10343v1
- Date: Mon, 14 Jul 2025 14:47:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:25.168939
- Title: FGSSNet: Feature-Guided Semantic Segmentation of Real World Floorplans
- Title(参考訳): FGSSNet: 現実世界のフロアプランの特徴誘導セマンティックセマンティックセグメンテーション
- Authors: Hugo Norrby, Gabriel Färm, Kevin Hernandez-Diaz, Fernando Alonso-Fernandez,
- Abstract要約: FGSSNetは,新規な特徴誘導セマンティックセマンティック・セマンティック・アーキテクチャである。
FGSSNetは、ドメイン固有の特徴マップを抽出する専用の特徴抽出器を備えたU-Netセグメンテーションバックボーンを備えている。
実験の結果,バニラU-Netと比較して,このようなインジェクション機能を用いることで性能が向上した。
- 参考スコア(独自算出の注目度): 43.754828313772876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce FGSSNet, a novel multi-headed feature-guided semantic segmentation (FGSS) architecture designed to improve the generalization ability of wall segmentation on floorplans. FGSSNet features a U-Net segmentation backbone with a multi-headed dedicated feature extractor used to extract domain-specific feature maps which are injected into the latent space of U-Net to guide the segmentation process. This dedicated feature extractor is trained as an encoder-decoder with selected wall patches, representative of the walls present in the input floorplan, to produce a compressed latent representation of wall patches while jointly trained to predict the wall width. In doing so, we expect that the feature extractor encodes texture and width features of wall patches that are useful to guide the wall segmentation process. Our experiments show increased performance by the use of such injected features in comparison to the vanilla U-Net, highlighting the validity of the proposed approach.
- Abstract(参考訳): FGSSNetは、フロアプランにおける壁分割の一般化能力を改善するために設計された、新しい多面的特徴誘導セマンティックセマンティックセマンティックセマンティクス(FGSS)アーキテクチャである。
FGSSNetはU-Netセグメンテーションのバックボーンと、そのセグメンテーションプロセスを導くためにU-Netの潜在空間に注入されるドメイン固有の特徴マップを抽出するために使用される多面的特徴抽出器を備えている。
本発明の専用特徴抽出器は、入力フロアプランに存在する壁の代表である、選択された壁パッチを持つエンコーダデコーダとして訓練され、壁幅を予測するために共同で訓練されながら、壁パッチの圧縮潜在表現を生成する。
そこで我々は,壁分割プロセスのガイドに役立つ壁面パッチのテクスチャや幅の特徴を,特徴抽出器が符号化することを期待している。
本実験は,バニラU-Netと比較し,これらのインジェクションによる性能向上を示し,提案手法の有効性を浮き彫りにした。
関連論文リスト
- Test-Time Optimization for Domain Adaptive Open Vocabulary Segmentation [15.941958367737408]
Seg-TTOはゼロショットでオープンなセマンティックセグメンテーションのためのフレームワークである。
このギャップに対処するために、セグメンテーション固有のテスト時間最適化にフォーカスします。
Seg-TTOは明確なパフォーマンス向上(いくつかのデータセットで最大27%のmIoU増加)を示し、新たな最先端の確立を実現している。
論文 参考訳(メタデータ) (2025-01-08T18:58:24Z) - Generalizable Entity Grounding via Assistance of Large Language Model [77.07759442298666]
本稿では,長いキャプションから密接な視覚的実体を抽出する手法を提案する。
本研究では,意味代名詞の抽出に大規模なマルチモーダルモデル,エンティティレベルのセグメンテーションを生成するクラス-aセグメンテーションモデル,および各セグメンテーション名詞と対応するセグメンテーションマスクを関連付けるマルチモーダル特徴融合モジュールを利用する。
論文 参考訳(メタデータ) (2024-02-04T16:06:05Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - SegViT: Semantic Segmentation with Plain Vision Transformers [91.50075506561598]
意味的セグメンテーションのための平易な視覚変換器(ViT)の能力について検討する。
本研究では,学習可能なクラストークンの集合と空間特徴マップの類似性をセグメンテーションマスクに転送するATMモジュールを提案する。
実験の結果,ATMモジュールを用いたSegVitは,通常のViTバックボーンよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-10-12T00:30:26Z) - Semantic Segmentation for Point Cloud Scenes via Dilated Graph Feature
Aggregation and Pyramid Decoders [15.860648472852597]
拡張グラフ特徴集合(DGFA)をルーツとするグラフ畳み込みネットワークDGFA-Netを提案する。
S3DIS、ShapeNetPart、Tronto-3Dの実験は、DGFA-Netがベースラインアプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-04-11T08:41:01Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - A De-raining semantic segmentation network for real-time foreground
segmentation [0.0]
本稿では,降雨環境におけるセグメンテーションのための軽量ネットワークであるDeraining Semantic Accuracy Network (DRSNet)を提案する。
雨滴の特性を解析することにより、MultiScaleSE Blockは入力画像のエンコードを目標としている。
異なるエンコーダ層とデコーダ層とのセマンティック情報を組み合わせるために,非対称スキップを用いることを提案する。
論文 参考訳(メタデータ) (2021-04-16T04:09:13Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Multi-layer Feature Aggregation for Deep Scene Parsing Models [19.198074549944568]
本稿では,深層解析ネットワークにおける多層特徴出力の空間-意味的整合性に対する有効利用について検討する。
提案モジュールは、空間情報と意味情報を相関付けるために、中間視覚特徴を自動選択することができる。
4つの公開シーン解析データセットの実験により、提案した機能集約モジュールを備えたディープパーシングネットワークは、非常に有望な結果が得られることが証明された。
論文 参考訳(メタデータ) (2020-11-04T23:07:07Z) - MACU-Net for Semantic Segmentation of Fine-Resolution Remotely Sensed
Images [11.047174552053626]
MACU-Netは、マルチスケールのスキップ接続と非対称畳み込みベースのU-Netで、微細解像度のリモートセンシング画像を提供する。
本設計では,(1)低レベル・高レベルの特徴写像に含まれる意味的特徴と,(2)非対称な畳み込みブロックは,標準畳み込み層の特徴表現と特徴抽出能力を強化する。
2つのリモートセンシングデータセットで行った実験では、提案したMACU-NetがU-Net、U-NetPPL、U-Net 3+、その他のベンチマークアプローチを超越していることが示されている。
論文 参考訳(メタデータ) (2020-07-26T08:56:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。