論文の概要: FreeOcc: Training-Free Embodied Open-Vocabulary Occupancy Prediction
- arxiv url: http://arxiv.org/abs/2604.28115v1
- Date: Thu, 30 Apr 2026 17:05:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.211191
- Title: FreeOcc: Training-Free Embodied Open-Vocabulary Occupancy Prediction
- Title(参考訳): FreeOcc: トレーニング不要なオープンボキャブラリ職業予測
- Authors: Zeyu Jiang, Changqing Zhou, Xingxing Zuo, Changhao Chen,
- Abstract要約: FreeOccは、単分子またはRGB-D配列からのオープン語彙占有予測のためのトレーニングフリーフレームワークである。
FreeOccは、3Dアノテーションなしで動作します。
FreeOccは、EmbodiedOcc-ScanNet上のIoUとmIoUの2ドル以上の改善を実現している。
- 参考スコア(独自算出の注目度): 11.503430067699442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing learning-based occupancy prediction methods rely on large-scale 3D annotations and generalize poorly across environments. We present FreeOcc, a training-free framework for open-vocabulary occupancy prediction from monocular or RGB-D sequences. Unlike prior approaches that require voxel-level supervision and ground-truth camera poses, FreeOcc operates without 3D annotations, pose ground truth, or any learning stage. FreeOcc incrementally builds a globally consistent occupancy map via a four-layer pipeline: a SLAM backbone estimates poses and sparse geometry; a geometrically consistent Gaussian update constructs dense 3D Gaussian maps; open-vocabulary semantics from off-the-shelf vision-language models are associated with Gaussian primitives; and a probabilistic Gaussian-to-occupancy projection produces dense voxel occupancy. Despite being entirely training-free and pose-agnostic, FreeOcc achieves over $2\times$ improvements in IoU and mIoU on EmbodiedOcc-ScanNet compared to prior self-supervised methods. We further introduce ReplicaOcc, a benchmark for indoor open-vocabulary occupancy prediction, and show that FreeOcc transfers zero-shot to novel environments, substantially outperforming both supervised and self-supervised baselines. Project page: https://the-masses.github.io/freeocc-web/.
- Abstract(参考訳): 既存の学習ベースの占有予測手法は、大規模な3Dアノテーションに依存し、環境全体にわたって不適切な一般化を行う。
単分子またはRGB-D配列からの開語彙占有予測のための学習自由フレームワークFreeOccを提案する。
ボクセルレベルの監視と地味なカメラのポーズを必要とする従来のアプローチとは異なり、FreeOccは3Dアノテーションなしで動作し、真実のポーズを取る。
SLAMのバックボーンはポーズとスパース幾何学を推定し、幾何学的に一貫したガウス的更新は密度の高い3次元ガウス的写像を構成する。
FreeOccは完全にトレーニング不要で、ポーズに依存しないにもかかわらず、以前の自己管理手法と比較して、EmbodiedOcc-ScanNet上でIoUとmIoUが2ドル以上改善されている。
さらに,室内におけるオープンボキャブラリ占有予測のベンチマークであるReplicaOccを紹介するとともに,FreeOccがゼロショットを新規環境に移行し,教師付きベースラインと自己監督ベースラインの両方を大幅に上回っていることを示す。
プロジェクトページ:https://the-masses.github.io/freeocc-web/.com
関連論文リスト
- FreeOcc: Training-free Panoptic Occupancy Prediction via Foundation Models [0.9345376836714131]
FreeOccは、マルチビューイメージからセマンティクスと幾何学を復元する、トレーニング不要のパイプラインである。
Occ3D-nuScenesでは、FreeOccは最先端の弱い監督手法と同等の16.9 mIoUと16.5 RayIoUである。
論文 参考訳(メタデータ) (2026-03-06T11:19:33Z) - Monocular Open Vocabulary Occupancy Prediction for Indoor Scenes [12.60608820766928]
オープン語彙の3D占有は、複雑な屋内環境を理解する必要があるエンボディエージェントにとって不可欠である。
二元的占有率ラベル(占有率対自由度)のみを使用する幾何学的監督パラダイムを提案する。
オープン語彙設定では59.50 IoU と 21.05 mIoU を達成し,既存の IoU の占有法を全て上回り,mIoU の広いマージンで先行したオープン語彙アプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-26T06:37:43Z) - TT-Occ: Test-Time Compute for Self-Supervised Occupancy via Spatio-Temporal Gaussian Splatting [32.57885385644153]
自己監督型3D占有予測は、コストのかかる3Dアノテーションを必要とせずに、シーンの運転を理解するための有望なソリューションを提供する。
TT-Occと呼ばれる実用的で柔軟なテストタイム占有予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-11T14:37:39Z) - GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.89653628311565]
GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。
提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文 参考訳(メタデータ) (2025-02-07T16:07:51Z) - EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [72.96388875744704]
3D占有予測は周囲のシーンを包括的に記述する。
既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。
具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-05T17:57:09Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。