論文の概要: From Semi-supervised to Omni-supervised Room Layout Estimation Using
Point Clouds
- arxiv url: http://arxiv.org/abs/2301.13865v1
- Date: Tue, 31 Jan 2023 18:58:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 15:17:07.170430
- Title: From Semi-supervised to Omni-supervised Room Layout Estimation Using
Point Clouds
- Title(参考訳): 点雲を用いた半監督からオムニ監督室レイアウト推定へ
- Authors: Huan-ang Gao, Beiwen Tian, Pengfei Li, Xiaoxue Chen, Hao Zhao, Guyue
Zhou, Yurong Chen and Hongbin Zha
- Abstract要約: ポイントクラウド(PC)を用いた部屋レイアウト推定は、アノテーションの難しさにより、データ不足に悩まされている。
クワッドとPC間のハイブリッド距離尺度の分布を2成分に分解するオンライン擬似ラベル抽出アルゴリズムを提案する。
驚くべきことに、このフレームワークは、完全に教師された設定でも機能し、ScanNetベンチマークで新しいSOTAを達成する。
- 参考スコア(独自算出の注目度): 21.877157385576904
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Room layout estimation is a long-existing robotic vision task that benefits
both environment sensing and motion planning. However, layout estimation using
point clouds (PCs) still suffers from data scarcity due to annotation
difficulty. As such, we address the semi-supervised setting of this task based
upon the idea of model exponential moving averaging. But adapting this scheme
to the state-of-the-art (SOTA) solution for PC-based layout estimation is not
straightforward. To this end, we define a quad set matching strategy and
several consistency losses based upon metrics tailored for layout quads.
Besides, we propose a new online pseudo-label harvesting algorithm that
decomposes the distribution of a hybrid distance measure between quads and PC
into two components. This technique does not need manual threshold selection
and intuitively encourages quads to align with reliable layout points.
Surprisingly, this framework also works for the fully-supervised setting,
achieving a new SOTA on the ScanNet benchmark. Last but not least, we also push
the semi-supervised setting to the realistic omni-supervised setting,
demonstrating significantly promoted performance on a newly annotated
ARKitScenes testing set. Our codes, data and models are released in this
repository.
- Abstract(参考訳): ルームレイアウト推定は、環境センシングとモーションプランニングの両方のメリットを享受する、ロボットビジョンタスクである。
しかし、ポイントクラウド(pcs)を用いたレイアウト推定は、アノテーションの難しさにより、データ不足に苦しんでいる。
そこで我々は,モデル指数移動平均化の概念に基づいて,このタスクの半教師付き設定に対処する。
しかし、pcベースのレイアウト推定の最先端(sota)ソリューションにこのスキームを適用するのは簡単ではない。
この目的のために、レイアウトクワッドに適したメトリクスに基づいて、クワッドセットマッチング戦略といくつかの一貫性損失を定義する。
さらに,クワッドとpc間のハイブリッド距離尺度の分布を2成分に分解するオンライン擬似ラベル収穫アルゴリズムを提案する。
このテクニックは手作業によるしきい値選択を必要とせず、直感的にクワッドを信頼できるレイアウトポイントに合わせるように促す。
驚くべきことに、このフレームワークは、完全に教師された設定でも機能し、ScanNetベンチマークで新しいSOTAを達成する。
最後に、我々はセミ教師付きセッティングをリアルなオムニ教師付きセッティングに推し進め、新たに注釈付けされたARKitScenesテストセットでの大幅なパフォーマンス向上を示す。
私たちのコード、データ、モデルは、このリポジトリでリリースされます。
関連論文リスト
- OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Improving Path Planning Performance through Multimodal Generative Models
with Local Critics [1.3706331473063877]
本稿では,障害物のある未知のシーンにおける経路計画タスクを高速化する新しい手法を提案する。
自由条件構成空間の分布を近似するために,Wasserstein Generative Adversarial Networks (WGANs) と Gradient Penalty (GP) を用いる。
実験の結果,WGAN-GPで準最適経路を生成しながら,未知のシーンでの経路計画タスクを高速化する有望な結果が得られた。
論文 参考訳(メタデータ) (2023-06-15T19:51:35Z) - 360-MLC: Multi-view Layout Consistency for Self-training and
Hyper-parameter Tuning [40.93848397359068]
モノクラールームモデルを微調整するための多視点レイアウト整合性に基づく自己学習手法である360-MLCを提案する。
我々は,複数のレイアウト推定におけるエントロピー情報を定量的な指標として活用し,シーンの幾何的整合性を測定する。
論文 参考訳(メタデータ) (2022-10-24T03:31:48Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Plane Pair Matching for Efficient 3D View Registration [7.920114031312631]
室内シーンにおける重なり合う3次元ビュー間の動き行列を推定する新しい手法を提案する。
マンハッタンの世界仮定を用いて、平面の四角形の下での軽量な幾何学的制約を問題に導入する。
我々は,玩具の例にアプローチを検証し,最近の最先端手法と比較し,公開RGB-Dデータセットの定量的実験を行った。
論文 参考訳(メタデータ) (2020-01-20T11:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。