論文の概要: Supercharging Floorplan Localization with Semantic Rays
- arxiv url: http://arxiv.org/abs/2507.09291v2
- Date: Tue, 15 Jul 2025 13:35:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 13:21:48.45455
- Title: Supercharging Floorplan Localization with Semantic Rays
- Title(参考訳): セマンティック光を用いたスーパーチャージフロアプラン定位
- Authors: Yuval Grader, Hadar Averbuch-Elor,
- Abstract要約: 本稿では,深度とセマンティック線を共同で推定する意味認識フレームワークを提案する。
提案手法は最先端の手法よりも大幅に優れており,従来の手法と比較して,リコール基準の大幅な改善を実現している。
- 参考スコア(独自算出の注目度): 11.68879796145804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Floorplans provide a compact representation of the building's structure, revealing not only layout information but also detailed semantics such as the locations of windows and doors. However, contemporary floorplan localization techniques mostly focus on matching depth-based structural cues, ignoring the rich semantics communicated within floorplans. In this work, we introduce a semantic-aware localization framework that jointly estimates depth and semantic rays, consolidating over both for predicting a structural-semantic probability volume. Our probability volume is constructed in a coarse-to-fine manner: We first sample a small set of rays to obtain an initial low-resolution probability volume. We then refine these probabilities by performing a denser sampling only in high-probability regions and process the refined values for predicting a 2D location and orientation angle. We conduct an evaluation on two standard floorplan localization benchmarks. Our experiments demonstrate that our approach substantially outperforms state-of-the-art methods, achieving significant improvements in recall metrics compared to prior works. Moreover, we show that our framework can easily incorporate additional metadata such as room labels, enabling additional gains in both accuracy and efficiency.
- Abstract(参考訳): フロアプランは建物の構造をコンパクトに表現し、レイアウト情報だけでなく、窓やドアの位置などの詳細な意味も明らかにしている。
しかし、現代のフロアプランのローカライゼーション技術は主に、フロアプラン内で伝達されるリッチなセマンティクスを無視して、深度に基づく構造的手がかりのマッチングに焦点を当てている。
本研究では,構造的意味的確率量を予測するために,深度とセマンティック線を併用して推定するセマンティック・アウェア・ローカライゼーション・フレームワークを提案する。
我々の確率体積は粗大な方法で構成される: 最初は小さな光線をサンプリングし、最初の低分解能確率体積を得る。
次に、高確率領域のみに高密度サンプリングを行い、2次元位置および方位角を予測するための精細値を処理することにより、これらの確率を洗練する。
2つの標準フロアプランローカライゼーションベンチマークで評価を行う。
実験により,本手法は従来の手法よりも大幅に向上し,リコール指標の大幅な改善を実現していることが示された。
さらに,本フレームワークは,部屋ラベルなどの付加メタデータを容易に組み込むことができ,精度と効率の両面でさらなる向上が期待できることを示す。
関連論文リスト
- TGP: Two-modal occupancy prediction with 3D Gaussian and sparse points for 3D Environment Awareness [13.68631587423815]
3Dセマンティックな占有力は、ロボット工学と自律運転環境知覚の分野において、急速に研究の焦点となっている。
既存の占有予測タスクは、voxelやポイントクラウドベースのアプローチを使用してモデル化される。
本稿では空間的位置と体積構造情報のバランスをとる3次元ガウス集合とスパース点に基づく2次元モーダル予測法を提案する。
論文 参考訳(メタデータ) (2025-03-13T01:35:04Z) - Plane2Depth: Hierarchical Adaptive Plane Guidance for Monocular Depth Estimation [38.81275292687583]
平面情報を適応的に利用し,階層的なフレームワーク内での深度予測を改善するPlane2Depthを提案する。
提案する平面案内深度発生器 (PGDG) では, 現場の平面をソフトにモデル化し, 画素ごとの平面係数を予測するためのプロトタイプとして, 一連の平面クエリを設計する。
提案するアダプティブプレーンクエリアグリゲーション(APGA)モジュールでは,マルチスケール平面特徴のアグリゲーションを改善するために,新たな機能インタラクションアプローチを導入する。
論文 参考訳(メタデータ) (2024-09-04T07:45:06Z) - Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - Concrete Score Matching: Generalized Score Matching for Discrete Data [109.12439278055213]
コンクレトスコア(Concrete score)とは、個別の設定のためのスコア(ステイン)の一般化である。
コンクレトスコアマッチング(Concrete Score Matching)は、サンプルからこのようなスコアを学習するフレームワークである。
論文 参考訳(メタデータ) (2022-11-02T00:41:37Z) - BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation [46.678016537618845]
本稿では,分類回帰に基づく深度推定に適したBinsFormerという新しいフレームワークを提案する。
1)適応的なビンの適切な生成、2)確率分布とビン予測の間の十分な相互作用である。
KITTI、NYU、SUN RGB-Dデータセットの実験は、BinsFormerが最先端のモノクル深度推定法をはるかに上回っていることを示している。
論文 参考訳(メタデータ) (2022-04-03T04:38:02Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Bootstrap Representation Learning for Segmentation on Medical Volumes
and Sequences [15.133897897609735]
本稿では,隣接するスライスの予測可能性を活用することで,ブートストラップによる自己教師型表現学習手法を提案する。
提案手法のコアとなるのは,局所表現の予測に関する単純かつ直接的な自己スーパービジョンである。
本モデルでは, ACDCでは4.5%, 前立腺癌では1.7%, CAMUSでは2.3%の差で既存手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-23T04:37:28Z) - Interpretable Semantic Photo Geolocalization [4.286838964398275]
ジオローカリゼーションモデルの解釈性を改善するために,2つのコントリビューションを提案する。
本稿では,予測の理解を直感的に向上させる新しいセマンティックパーティショニング手法を提案する。
また,ある予測のための意味的視覚概念の重要性を評価するための新しい指標も導入する。
論文 参考訳(メタデータ) (2021-04-30T13:28:18Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Point-Level Temporal Action Localization: Bridging Fully-supervised
Proposals to Weakly-supervised Losses [84.2964408497058]
point-level temporal action localization (ptal) は、各アクションインスタンスに対して1つのタイムスタンプアノテーションで、未トリミングビデオ内のアクションをローカライズすることを目的としている。
既存の手法ではフレームレベルの予測パラダイムを採用し、スパース単一フレームラベルから学習する。
本稿では,ポイントレベルアノテーションの提案に基づく予測パラダイムを検討する。
論文 参考訳(メタデータ) (2020-12-15T12:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。