論文の概要: Generalized Zero-Shot Learning for Point Cloud Segmentation with Evidence-Based Dynamic Calibration
- arxiv url: http://arxiv.org/abs/2509.08280v1
- Date: Wed, 10 Sep 2025 04:37:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.307321
- Title: Generalized Zero-Shot Learning for Point Cloud Segmentation with Evidence-Based Dynamic Calibration
- Title(参考訳): エビデンスに基づく動的校正による点群分割のための一般化ゼロショット学習
- Authors: Hyeonseok Kim, Byeongkeun Kang, Yeejin Lee,
- Abstract要約: 3Dポイントクラウドの一般化されたゼロショットセマンティックセマンティックセマンティックセマンティクスは、各ポイントを目に見えないクラスと見えないクラスの両方に分類することを目的としている。
これらのモデルの重大な課題は、バイアスのある予測を行う傾向にあり、しばしばトレーニング中に遭遇するクラスを好んでいることである。
E3DPC-GZSLを提案する。これは、見知らぬデータに対して、別個の分類器に頼ることなく、見知らぬクラスに対する過信予測を減らす。
- 参考スコア(独自算出の注目度): 12.973924671425074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized zero-shot semantic segmentation of 3D point clouds aims to classify each point into both seen and unseen classes. A significant challenge with these models is their tendency to make biased predictions, often favoring the classes encountered during training. This problem is more pronounced in 3D applications, where the scale of the training data is typically smaller than in image-based tasks. To address this problem, we propose a novel method called E3DPC-GZSL, which reduces overconfident predictions towards seen classes without relying on separate classifiers for seen and unseen data. E3DPC-GZSL tackles the overconfidence problem by integrating an evidence-based uncertainty estimator into a classifier. This estimator is then used to adjust prediction probabilities using a dynamic calibrated stacking factor that accounts for pointwise prediction uncertainty. In addition, E3DPC-GZSL introduces a novel training strategy that improves uncertainty estimation by refining the semantic space. This is achieved by merging learnable parameters with text-derived features, thereby improving model optimization for unseen data. Extensive experiments demonstrate that the proposed approach achieves state-of-the-art performance on generalized zero-shot semantic segmentation datasets, including ScanNet v2 and S3DIS.
- Abstract(参考訳): 3Dポイントクラウドの一般化されたゼロショットセマンティックセマンティックセマンティックセマンティクスは、各ポイントを目に見えないクラスと見えないクラスの両方に分類することを目的としている。
これらのモデルの重大な課題は、バイアスのある予測を行う傾向にあり、しばしばトレーニング中に遭遇するクラスを好んでいることである。
この問題は3Dアプリケーションではより顕著であり、トレーニングデータのスケールは通常、画像ベースのタスクよりも小さい。
この問題に対処するため,E3DPC-GZSLと呼ばれる新しい手法を提案する。
E3DPC-GZSLは、エビデンスに基づく不確実性推定器を分類器に統合することにより、過信問題に取り組む。
この推定器は、ポイントワイズ予測の不確実性を考慮した動的キャリブレーションされた積み重ね係数を用いて予測確率を調整するために使用される。
さらに、E3DPC-GZSLは、意味空間を精製することで不確実性評価を改善する新しいトレーニング戦略を導入した。
これは、学習可能なパラメータとテキスト由来の機能を組み合わせることで実現され、未確認データのモデル最適化が改善される。
広汎な実験により,ScanNet v2 や S3DIS など,一般化されたゼロショットセマンティックセマンティックセグメンテーションデータセットの最先端性能が得られた。
関連論文リスト
- CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation [67.36817440834251]
我々はtextbfCLass-incremental textbfIm Balance-aware textbf3DIS の統一フレームワークを提案する。
提案手法は, 先行研究を最大16.76%まで上回り, セマンティックセマンティックセマンティックセマンティクスでは約30%のmIoUを達成している。
論文 参考訳(メタデータ) (2025-02-24T18:58:58Z) - CFSSeg: Closed-Form Solution for Class-Incremental Semantic Segmentation of 2D Images and 3D Point Clouds [9.765104818970277]
クラスインクリメンタルセマンティックセグメンテーション(CSS)では、事前知識を維持しながら、新たなセマンティックカテゴリを漸進的に学習する必要がある。
CFSSegは, クローズド・フォーム・ソリューションを応用した, 斬新な外見のない手法である。
これにより、反復的な勾配ベースの最適化と過去のデータの保存が不要になり、ステップ毎に新しいサンプルを1回だけ通過する必要がなくなる。
論文 参考訳(メタデータ) (2024-12-14T13:39:56Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Guided Point Contrastive Learning for Semi-supervised Point Cloud
Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。
近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-10-15T16:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。