論文の概要: GeoTeacher: Geometry-Guided Semi-Supervised 3D Object Detection
- arxiv url: http://arxiv.org/abs/2512.23147v1
- Date: Mon, 29 Dec 2025 02:24:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.378897
- Title: GeoTeacher: Geometry-Guided Semi-Supervised 3D Object Detection
- Title(参考訳): GeoTeacher:Geometry-Guided Semi-Supervised 3D Object Detection
- Authors: Jingyu Li, Xiaolong Zhao, Zhe Liu, Wenxiao Wu, Li Zhang,
- Abstract要約: 近年, 半教師付き3次元物体検出が活発な研究領域として出現している。
そこで我々は,GeoTeacherを提案し,限られた学習データでオブジェクトの幾何学的関係を捉える学生モデルの能力を高める。
本稿では,オブジェクトジオメトリの多様性を高めるために,ボクセル単位のデータ拡張戦略を提案する。
- 参考スコア(独自算出の注目度): 19.447180486374357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised 3D object detection, aiming to explore unlabeled data for boosting 3D object detectors, has emerged as an active research area in recent years. Some previous methods have shown substantial improvements by either employing heterogeneous teacher models to provide high-quality pseudo labels or enforcing feature-perspective consistency between the teacher and student networks. However, these methods overlook the fact that the model usually tends to exhibit low sensitivity to object geometries with limited labeled data, making it difficult to capture geometric information, which is crucial for enhancing the student model's ability in object perception and localization. In this paper, we propose GeoTeacher to enhance the student model's ability to capture geometric relations of objects with limited training data, especially unlabeled data. We design a keypoint-based geometric relation supervision module that transfers the teacher model's knowledge of object geometry to the student, thereby improving the student's capability in understanding geometric relations. Furthermore, we introduce a voxel-wise data augmentation strategy that increases the diversity of object geometries, thereby further improving the student model's ability to comprehend geometric structures. To preserve the integrity of distant objects during augmentation, we incorporate a distance-decay mechanism into this strategy. Moreover, GeoTeacher can be combined with different SS3D methods to further improve their performance. Extensive experiments on the ONCE and Waymo datasets indicate the effectiveness and generalization of our method and we achieve the new state-of-the-art results. Code will be available at https://github.com/SII-Whaleice/GeoTeacher
- Abstract(参考訳): 近年,3Dオブジェクト検出器の強化を目的としたラベルなしデータ探索を目的とした半教師付き3Dオブジェクト検出が活発な研究領域として浮上している。
従来の手法では、高品質な擬似ラベルを提供するために異質な教師モデルを採用するか、教師と学生のネットワーク間の特徴的一貫性を強制することによって、大幅に改善されている。
しかし、これらの手法は、通常、モデルが限られたラベル付きデータを持つオブジェクトジオメトリに対して低感度を示す傾向にあり、幾何学的情報の取得が困難であるという事実を見落としている。
本稿では,GeoTeacherを提案することで,学習対象の幾何学的関係を限られたトレーニングデータ,特にラベルなしデータで捉えることができる。
本研究では,教師モデルのオブジェクト幾何学知識を学生に伝達するキーポイントに基づく幾何学的関係監視モジュールを設計し,幾何学的関係を理解する能力を向上させる。
さらに,オブジェクトジオメトリの多様性を高め,幾何学的構造を理解するための学生モデルの能力をさらに向上するボクセル的データ拡張戦略を導入する。
拡張中の遠方物体の完全性を維持するため,この戦略に距離デカイ機構を組み込む。
さらに、GeoTeacherは様々なSS3Dメソッドと組み合わせてパフォーマンスをさらに向上することができる。
on the ONCEとWaymoデータセットの大規模な実験により,本手法の有効性と一般化が示され,新しい最先端の成果が得られた。
コードはhttps://github.com/SII-Whaleice/GeoTeacherで入手できる。
関連論文リスト
- GeoPurify: A Data-Efficient Geometric Distillation Framework for Open-Vocabulary 3D Segmentation [57.8059956428009]
2次元視覚言語モデルから3次元セマンティックセグメンテーションへ機能を移行しようとする最近の試みは、永続的なトレードオフを露呈している。
3次元教師モデルから抽出した幾何学的事前情報を用いて2次元VLM生成した3次元点特徴に小さな学生親和性ネットワークを適用したGeoPurifyを提案する。
遅延幾何学情報と学習された親和性ネットワークから恩恵を受けることで、GeoPurifyはトレードオフを効果的に軽減し、優れたデータ効率を実現する。
論文 参考訳(メタデータ) (2025-10-02T16:37:56Z) - GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding [53.42728468191711]
Open-Vocabulary 3D object affordance groundingは、任意の命令で3Dオブジェクト上のアクション可能性の領域を予測することを目的としている。
GREAT (GeometRy-intEntion collAboraTive Inference) を提案する。
論文 参考訳(メタデータ) (2024-11-29T11:23:15Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。