論文の概要: SAP: Segment Any 4K Panorama
- arxiv url: http://arxiv.org/abs/2603.12759v1
- Date: Fri, 13 Mar 2026 08:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.988566
- Title: SAP: Segment Any 4K Panorama
- Title(参考訳): SAP:4Kパノラマのセグメンテーション
- Authors: Lutao Jiang, Zidong Cao, Weikai Chen, Xu Zheng, Yuanhuiyi Lyu, Zhenyang Li, Zeyu HU, Yingda Yin, Keyang Luo, Runze Zhang, Kai Yan, Shengju Qian, Haidi Fan, Yifan Peng, Xin Wang, Hui Xiong, Ying-Cong Chen,
- Abstract要約: SAP(Segment Any 4K Panorama)は4K高分解能パノラマ・インスタンスレベルのセグメンテーションの基礎モデルである。
本研究では,パノラマ画像分割を固定軌跡視点ビデオ分割として再構成し,パノラマを連続球面に沿ってサンプリングした重なり合う視点パッチに分解する。
このメモリアライメントの再構成は、4K解像度を保ちながら、安定したクロスビュー伝搬に必要なスムーズな視点遷移を復元する。
- 参考スコア(独自算出の注目度): 64.69300263307441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Promptable instance segmentation is widely adopted in embodied and AR systems, yet the performance of foundation models trained on perspective imagery often degrades on 360° panoramas. In this paper, we introduce Segment Any 4K Panorama (SAP), a foundation model for 4K high-resolution panoramic instance-level segmentation. We reformulate panoramic segmentation as fixed-trajectory perspective video segmentation, decomposing a panorama into overlapping perspective patches sampled along a continuous spherical traversal. This memory-aligned reformulation preserves native 4K resolution while restoring the smooth viewpoint transitions required for stable cross-view propagation. To enable large-scale supervision, we synthesize 183,440 4K-resolution panoramic images with instance segmentation labels using the InfiniGen engine. Trained under this trajectory-aligned paradigm, SAP generalizes effectively to real-world 360° images, achieving +17.2 zero-shot mIoU gain over vanilla SAM2 of different sizes on real-world 4K panorama benchmark.
- Abstract(参考訳): 確率的なインスタンスセグメンテーションは、エンボディとARシステムで広く採用されているが、視点画像に基づいてトレーニングされた基礎モデルの性能は、しばしば360度パノラマで劣化する。
本稿では,4K高分解能パノラマインスタンスレベルセグメンテーションの基礎モデルであるSegment Any 4K Panorama (SAP)を紹介する。
本研究では, パノラマ画像分割を固定軌跡視点ビデオ分割として再構成し, パノラマを連続球面軌道に沿ってサンプリングした重なり合う視点パッチに分解する。
このメモリアライメントの再構成は、4K解像度を保ちながら、安定したクロスビュー伝搬に必要なスムーズな視点遷移を復元する。
InfiniGenエンジンを用いて183,440個の4K解像度パノラマ画像をインスタンスセグメンテーションラベルで合成する。
この軌道に沿ったパラダイムの下で訓練されたSAPは、現実世界の360度画像に効果的に一般化し、現実世界の4Kパノラマベンチマークで異なる大きさのバニラSAM2よりも+17.2ゼロショットmIoUのゲインを達成している。
関連論文リスト
- Panoramic Out-of-Distribution Segmentation for Autonomous Driving [25.32165408678185]
パノラマ・アウト・オブ・ディストリビューション(PanOoS)を導入し,包括的で安全なシーン理解を実現する。
POSはテキスト誘導の即時分布学習によりパノラマ画像の特徴に適応する。
POSは、主要なクローズドセットセグメンテーション機能を実現し、パノラマ理解の開発を進める。
論文 参考訳(メタデータ) (2025-05-06T13:51:26Z) - HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation [29.579493980120173]
HoloTimeは、ビデオ拡散モデルを統合して、単一のプロンプトまたは参照イメージからパノラマビデオを生成するフレームワークである。
360Worldデータセットは、下流の4Dシーン再構築タスクに適したパノラマビデオの包括的なコレクションである。
パノラマアニメーションは、パノラマ画像を高品質のパノラマビデオに変換する2段階のイメージ・ツー・ビデオ拡散モデルである。
パノラマ空間時間再構成は、空間時間深度推定法を用いて、生成されたパノラマ映像を4次元の点雲に変換する。
論文 参考訳(メタデータ) (2025-04-30T13:55:28Z) - 4K4DGen: Panoramic 4D Generation at 4K Resolution [67.98105958108503]
一つのパノラマを没入的な4D体験に高めるという課題に取り組む。
初めて、4K解像度で360$circ$のビューで全方位動的シーンを生成する能力を実証した。
高品質なパノラマ・ト・4Dを4Kの解像度で初めて実現した。
論文 参考訳(メタデータ) (2024-06-19T13:11:02Z) - PanoGRF: Generalizable Spherical Radiance Fields for Wide-baseline
Panoramas [54.4948540627471]
広帯域パノラマのための一般化可能な球面放射場パノGRFを提案する。
パノGRFは、視線画像に基づいて訓練された一般化可能な放射場とは異なり、パノラマからパースペクティブへの変換から情報損失を回避する。
複数のパノラマデータセットの結果は、パノGRFが最先端の一般化可能なビュー合成法よりも著しく優れていることを示している。
論文 参考訳(メタデータ) (2023-06-02T13:35:07Z) - Behind Every Domain There is a Shift: Adapting Distortion-aware Vision Transformers for Panoramic Semantic Segmentation [73.48323921632506]
パノラマ的セマンティックセマンティックセグメンテーションは2つの重要な課題により未探索である。
まず、変形性パッチ埋め込み(DPE)と変形性(DMLPv2)モジュールを備えたパノラマセマンティックトランス4PASS+を改良したトランスフォーマーを提案する。
第2に、教師なしドメイン適応パノラマセグメンテーションのための擬似ラベル修正により、Mutual Prototypeal Adaptation(MPA)戦略を強化する。
第3に、Pinhole-to-Panoramic(Pin2Pan)適応とは別に、9,080パノラマ画像を用いた新しいデータセット(SynPASS)を作成します。
論文 参考訳(メタデータ) (2022-07-25T00:42:38Z) - Bending Reality: Distortion-aware Transformers for Adapting to Panoramic
Semantic Segmentation [26.09267582056609]
大量の高価なピクセル単位のアノテーションは、堅牢なパノラマセグメンテーションモデルの成功に不可欠である。
360度パノラマにおける歪みと画像-特徴分布は、アノテーションに富んだピンホールドメインからの転写を阻害する。
変形性パッチ埋め込み(DPE)および変形性変形性(DMLP)コンポーネントにおける物体変形とパノラマ画像歪みを学習する。
最後に、マルチスケールのプロトタイプ機能を生成することにより、ピンホールとパノラマの特徴埋め込みで共有セマンティクスを結合する。
論文 参考訳(メタデータ) (2022-03-02T23:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。