論文の概要: Semi-Supervised 360 Layout Estimation with Panoramic Collaborative Perturbations
- arxiv url: http://arxiv.org/abs/2503.01114v1
- Date: Mon, 03 Mar 2025 02:49:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:18:41.381828
- Title: Semi-Supervised 360 Layout Estimation with Panoramic Collaborative Perturbations
- Title(参考訳): パノラマコラボレーティブ摂動を用いたセミスーパービジョン360レイアウト推定
- Authors: Junsong Zhang, Chunyu Lin, Zhijie Shen, Lang Nie, Kang Liao, Yao Zhao,
- Abstract要約: 協調摂動によるパノラマ配置と歪みの先行を組み込んだセミ教師付きセミ360を提案する。
提案手法が既存のSoTA(State-of-the-art (SoTA)) ソリューションに対して有意な優位性を示すことを示す。
- 参考スコア(独自算出の注目度): 56.84921040837699
- License:
- Abstract: The performance of existing supervised layout estimation methods heavily relies on the quality of data annotations. However, obtaining large-scale and high-quality datasets remains a laborious and time-consuming challenge. To solve this problem, semi-supervised approaches are introduced to relieve the demand for expensive data annotations by encouraging the consistent results of unlabeled data with different perturbations. However, existing solutions merely employ vanilla perturbations, ignoring the characteristics of panoramic layout estimation. In contrast, we propose a novel semi-supervised method named SemiLayout360, which incorporates the priors of the panoramic layout and distortion through collaborative perturbations. Specifically, we leverage the panoramic layout prior to enhance the model's focus on potential layout boundaries. Meanwhile, we introduce the panoramic distortion prior to strengthen distortion awareness. Furthermore, to prevent intense perturbations from hindering model convergence and ensure the effectiveness of prior-based perturbations, we divide and reorganize them as panoramic collaborative perturbations. Our experimental results on three mainstream benchmarks demonstrate that the proposed method offers significant advantages over existing state-of-the-art (SoTA) solutions.
- Abstract(参考訳): 既存の教師付きレイアウト推定手法の性能は、データアノテーションの品質に大きく依存している。
しかし、大規模かつ高品質なデータセットを取得することは、努力と時間を要する課題である。
この問題を解決するために、異なる摂動を伴うラベルなしデータの一貫性のある結果を奨励することにより、高価なデータアノテーションの需要を緩和する半教師付きアプローチが導入された。
しかし、既存の解は単にバニラ摂動を用いており、パノラマ配置推定の特性を無視している。
これとは対照的に,パノラマ的レイアウトの先行と協調的摂動による歪みを組み込んだ,SemiLayout360という半教師付き手法を提案する。
具体的には、パノラマ的なレイアウトを活用して、潜在的なレイアウト境界に対するモデルの焦点を強化する。
一方、歪み認識を強化するために、パノラマ歪みを導入する。
さらに,激しい摂動がモデル収束を妨げるのを防ぎ,事前の摂動の有効性を確保するために,それらをパノラマ的協調摂動として分割・再編成する。
提案手法が既存のSoTA(State-of-the-art (SoTA)) ソリューションに対して有意な優位性を示すことを示す。
関連論文リスト
- Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition [4.192370959537781]
本稿では,ラベル付きデータに制限のある下流タスクにおいて,事前学習した基礎モデルの性能向上を目的とした半教師付き微調整手法を提案する。
我々は、MNIST、その拡張されたバリエーション、CIFAR-10、SVHN、GalaxyMNISTを含む複数のデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2024-10-02T22:36:12Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - MSP-MVS: Multi-Granularity Segmentation Prior Guided Multi-View Stereo [8.303396507129266]
MSP-MVSは,マルチグラニュラリティセグメンテーションを導入する手法である。
相関信頼画素の等価分布と分解クラスタリングを実装した。
また,グローバルな最小マッチングコストの特定を支援するために,差分サンプリングの相乗的3次元最適化も導入する。
論文 参考訳(メタデータ) (2024-07-27T19:00:44Z) - Prototype Clustered Diffusion Models for Versatile Inverse Problems [11.55838697574475]
測定に基づく確率は、逆の確率的図形方向を通した復元に基づく確率で再現可能であることを示す。
提案手法は, サンプル品質を考慮に入れた逆問題に対処し, 精度の高い劣化制御を実現する。
論文 参考訳(メタデータ) (2024-07-13T04:24:53Z) - Latent Embedding Clustering for Occlusion Robust Head Pose Estimation [7.620379605206596]
頭部ポーズ推定は、幅広い応用において有用であることから、コンピュータビジョンにおいて重要な研究領域となっている。
この分野で最も難しい課題の1つは、現実世界のシナリオで頻繁に発生するヘッドオクルージョンの管理である。
我々は,現実の頭部閉塞のシナリオにおいて堅牢な,新規で効率的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-29T15:57:38Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。