論文の概要: From Semi-supervised to Omni-supervised Room Layout Estimation Using
Point Clouds
- arxiv url: http://arxiv.org/abs/2301.13865v1
- Date: Tue, 31 Jan 2023 18:58:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 15:17:07.170430
- Title: From Semi-supervised to Omni-supervised Room Layout Estimation Using
Point Clouds
- Title(参考訳): 点雲を用いた半監督からオムニ監督室レイアウト推定へ
- Authors: Huan-ang Gao, Beiwen Tian, Pengfei Li, Xiaoxue Chen, Hao Zhao, Guyue
Zhou, Yurong Chen and Hongbin Zha
- Abstract要約: ポイントクラウド(PC)を用いた部屋レイアウト推定は、アノテーションの難しさにより、データ不足に悩まされている。
クワッドとPC間のハイブリッド距離尺度の分布を2成分に分解するオンライン擬似ラベル抽出アルゴリズムを提案する。
驚くべきことに、このフレームワークは、完全に教師された設定でも機能し、ScanNetベンチマークで新しいSOTAを達成する。
- 参考スコア(独自算出の注目度): 21.877157385576904
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Room layout estimation is a long-existing robotic vision task that benefits
both environment sensing and motion planning. However, layout estimation using
point clouds (PCs) still suffers from data scarcity due to annotation
difficulty. As such, we address the semi-supervised setting of this task based
upon the idea of model exponential moving averaging. But adapting this scheme
to the state-of-the-art (SOTA) solution for PC-based layout estimation is not
straightforward. To this end, we define a quad set matching strategy and
several consistency losses based upon metrics tailored for layout quads.
Besides, we propose a new online pseudo-label harvesting algorithm that
decomposes the distribution of a hybrid distance measure between quads and PC
into two components. This technique does not need manual threshold selection
and intuitively encourages quads to align with reliable layout points.
Surprisingly, this framework also works for the fully-supervised setting,
achieving a new SOTA on the ScanNet benchmark. Last but not least, we also push
the semi-supervised setting to the realistic omni-supervised setting,
demonstrating significantly promoted performance on a newly annotated
ARKitScenes testing set. Our codes, data and models are released in this
repository.
- Abstract(参考訳): ルームレイアウト推定は、環境センシングとモーションプランニングの両方のメリットを享受する、ロボットビジョンタスクである。
しかし、ポイントクラウド(pcs)を用いたレイアウト推定は、アノテーションの難しさにより、データ不足に苦しんでいる。
そこで我々は,モデル指数移動平均化の概念に基づいて,このタスクの半教師付き設定に対処する。
しかし、pcベースのレイアウト推定の最先端(sota)ソリューションにこのスキームを適用するのは簡単ではない。
この目的のために、レイアウトクワッドに適したメトリクスに基づいて、クワッドセットマッチング戦略といくつかの一貫性損失を定義する。
さらに,クワッドとpc間のハイブリッド距離尺度の分布を2成分に分解するオンライン擬似ラベル収穫アルゴリズムを提案する。
このテクニックは手作業によるしきい値選択を必要とせず、直感的にクワッドを信頼できるレイアウトポイントに合わせるように促す。
驚くべきことに、このフレームワークは、完全に教師された設定でも機能し、ScanNetベンチマークで新しいSOTAを達成する。
最後に、我々はセミ教師付きセッティングをリアルなオムニ教師付きセッティングに推し進め、新たに注釈付けされたARKitScenesテストセットでの大幅なパフォーマンス向上を示す。
私たちのコード、データ、モデルは、このリポジトリでリリースされます。
関連論文リスト
- Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Improving Path Planning Performance through Multimodal Generative Models
with Local Critics [1.3706331473063877]
本稿では,障害物のある未知のシーンにおける経路計画タスクを高速化する新しい手法を提案する。
自由条件構成空間の分布を近似するために,Wasserstein Generative Adversarial Networks (WGANs) と Gradient Penalty (GP) を用いる。
実験の結果,WGAN-GPで準最適経路を生成しながら,未知のシーンでの経路計画タスクを高速化する有望な結果が得られた。
論文 参考訳(メタデータ) (2023-06-15T19:51:35Z) - 360-MLC: Multi-view Layout Consistency for Self-training and
Hyper-parameter Tuning [40.93848397359068]
モノクラールームモデルを微調整するための多視点レイアウト整合性に基づく自己学習手法である360-MLCを提案する。
我々は,複数のレイアウト推定におけるエントロピー情報を定量的な指標として活用し,シーンの幾何的整合性を測定する。
論文 参考訳(メタデータ) (2022-10-24T03:31:48Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Plane Pair Matching for Efficient 3D View Registration [7.920114031312631]
室内シーンにおける重なり合う3次元ビュー間の動き行列を推定する新しい手法を提案する。
マンハッタンの世界仮定を用いて、平面の四角形の下での軽量な幾何学的制約を問題に導入する。
我々は,玩具の例にアプローチを検証し,最近の最先端手法と比較し,公開RGB-Dデータセットの定量的実験を行った。
論文 参考訳(メタデータ) (2020-01-20T11:15:26Z) - Indoor Layout Estimation by 2D LiDAR and Camera Fusion [3.2387553628943535]
本稿では,画像列とLiDARデータセットの融合による屋内レイアウト推定と再構築のためのアルゴリズムを提案する。
提案システムでは,2次元LiDAR情報とインテンシティ画像の両方を移動プラットフォームで収集する。
論文 参考訳(メタデータ) (2020-01-15T16:43:35Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。