論文の概要: PanoAffordanceNet: Towards Holistic Affordance Grounding in 360° Indoor Environments
- arxiv url: http://arxiv.org/abs/2603.09760v1
- Date: Tue, 10 Mar 2026 14:58:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.410659
- Title: PanoAffordanceNet: Towards Holistic Affordance Grounding in 360° Indoor Environments
- Title(参考訳): PanoAffordanceNet:360°屋内環境におけるホロラティスティックなAffordance Groundingを目指して
- Authors: Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun Yang,
- Abstract要約: 我々は,360度屋内環境におけるホロスティック・アフォーマンス・グラウンディングという新しい課題を紹介した。
このタスクは、等角射影(ERP)からの厳密な幾何学的歪み、意味的分散、大規模アライメント困難など、固有の課題に直面している。
我々は、緯度依存キャリブレーションのためのDASM(Distortion-Aware Spectral Modulator)とOmni-Spherical Densification Head(Omni-Spherical Densification Head)を備えたエンドツーエンドフレームワークであるPanoAffordanceNetを提案する。
- 参考スコア(独自算出の注目度): 18.94879808515964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Global perception is essential for embodied agents in 360° spaces, yet current affordance grounding remains largely object-centric and restricted to perspective views. To bridge this gap, we introduce a novel task: Holistic Affordance Grounding in 360° Indoor Environments. This task faces unique challenges, including severe geometric distortions from Equirectangular Projection (ERP), semantic dispersion, and cross-scale alignment difficulties. We propose PanoAffordanceNet, an end-to-end framework featuring a Distortion-Aware Spectral Modulator (DASM) for latitude-dependent calibration and an Omni-Spherical Densification Head (OSDH) to restore topological continuity from sparse activations. By integrating multi-level constraints comprising pixel-wise, distributional, and region-text contrastive objectives, our framework effectively suppresses semantic drift under low supervision. Furthermore, we construct 360-AGD, the first high-quality panoramic affordance grounding dataset. Extensive experiments demonstrate that PanoAffordanceNet significantly outperforms existing methods, establishing a solid baseline for scene-level perception in embodied intelligence. The source code and benchmark dataset will be made publicly available at https://github.com/GL-ZHU925/PanoAffordanceNet.
- Abstract(参考訳): グローバルな認識は、360度空間におけるエンボディエージェントにとって不可欠であるが、現在の空き地は、主にオブジェクト指向であり、視点の視点に限られている。
このギャップを埋めるために,360度屋内環境におけるホロスティック・アフォーマンス・グラウンディングという新しい課題を導入する。
このタスクは、等角射影(ERP)からの厳密な幾何学的歪み、意味的分散、大規模アライメント困難など、固有の課題に直面している。
我々は、緯度依存キャリブレーションのためのDASM(Distortion-Aware Spectral Modulator)とOmni-Spherical Densification Head(Omni-Spherical Densification Head)を備えたエンドツーエンドフレームワークであるPanoAffordanceNetを提案する。
画素ワイド,分布,領域テクストコントラストといった多段階制約を統合することにより,低監督下でのセマンティックドリフトを効果的に抑制する。
さらに,最初の高品質パノラマ測位データセットである360-AGDを構築した。
大規模な実験により、PanoAffordanceNetは既存の手法を著しく上回り、エンボディドインテリジェンスにおけるシーンレベルの認識のための確かなベースラインを確立した。
ソースコードとベンチマークデータセットはhttps://github.com/GL-ZHU925/PanoAffordanceNetで公開される。
関連論文リスト
- RePer-360: Releasing Perspective Priors for 360$^\circ$ Depth Estimation via Self-Modulation [20.850233169948634]
視線画像に基づいてトレーニングされた最近の深度基礎モデルは、強い性能を実現するが、360$circ$画像に乏しく一般化する。
単分子パノラマ深さ推定のための歪みを考慮した自己変調フレームワークRePer-360を提案する。
RePer-360は、相補的な射影融合から、保存された事前訓練された視点下でのパノラマ領域適応に焦点を移すことで、標準的な微調整法を超越している。
論文 参考訳(メタデータ) (2026-03-06T07:58:53Z) - Rethinking the Encoding and Annotating of 3D Bounding Box: Corner-Aware 3D Object Detection from Point Clouds [69.84768614060559]
中心方向の回帰はLiDARベースの3Dオブジェクト検出において依然として支配的だが、基本的な不安定さに悩まされている。
本稿では,予測対象を不安定な中心から幾何学的情報的コーナーへシフトするコーナーアライン回帰を提案する。
我々は、既存の検出器に差し込むことができる、シンプルで効果的なコーナー認識検出ヘッドを設計する。
論文 参考訳(メタデータ) (2025-11-18T13:49:30Z) - DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training [76.82789568988557]
DiT360は、パノラマ画像生成のための視点とパノラマデータを用いたハイブリッドトレーニングを行う、DiTベースのフレームワークである。
提案手法は,11の定量的指標間で境界の整合性と画像の忠実度を向上する。
論文 参考訳(メタデータ) (2025-10-13T17:59:15Z) - BEVUDA++: Geometric-aware Unsupervised Domain Adaptation for Multi-View 3D Object Detection [56.477525075806966]
視覚中心のBird's Eye View (BEV) の認識は、自律運転にかなりの可能性を秘めている。
近年の研究では、効率性や精度の向上が優先されているが、ドメインシフトの問題は見過ごされている。
本稿では,この問題を解消するために,革新的な幾何学的学習支援フレームワークであるBEVUDA++を紹介する。
論文 参考訳(メタデータ) (2025-09-17T16:31:40Z) - Revisiting 360 Depth Estimation with PanoGabor: A New Fusion Perspective [89.53522682640337]
本稿では,これらの課題に対処するため,指向性歪みを考慮したGabor Fusionフレームワーク(PGFuse)を提案する。
再帰的歪みに対処するために、線形緯度対応の歪み表現法を設計し、カスタマイズされた歪み対応ガボルフィルタを生成する。
ガボル変換の配向感度を考慮すると、この感度を安定させるために球面勾配制約を導入する。
論文 参考訳(メタデータ) (2024-08-29T02:58:35Z) - PanoNormal: Monocular Indoor 360° Surface Normal Estimation [12.992217830651988]
textitPanoNormalは、360deg画像用に設計された単分子表面正規推定アーキテクチャである。
球面特徴分布を考慮した多レベルグローバル自己注意方式を用いる。
提案手法は,複数の一般的な360deg単分子データセットにまたがって,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-05-29T04:07:14Z) - SGFormer: Spherical Geometry Transformer for 360 Depth Estimation [52.23806040289676]
パノラマ歪みは360度深度推定において大きな課題となる。
本稿では,SGFormer という球面形状変換器を提案し,上記の問題に対処する。
また、様々な解像度で空間構造を補うために、クエリベースの大域的条件位置埋め込みを提案する。
論文 参考訳(メタデータ) (2024-04-23T12:36:24Z) - Centralized Feature Pyramid for Object Detection [53.501796194901964]
視覚的特徴ピラミッドは、広範囲のアプリケーションにおいて、有効性と効率の両方において、その優位性を示している。
本稿では,オブジェクト検出のためのOLO特徴ピラミッドを提案する。
論文 参考訳(メタデータ) (2022-10-05T08:32:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。