論文の概要: Exploring 3D Dataset Pruning
- arxiv url: http://arxiv.org/abs/2603.00651v1
- Date: Sat, 28 Feb 2026 13:42:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.309001
- Title: Exploring 3D Dataset Pruning
- Title(参考訳): 3次元データ・プルーニングの探求
- Authors: Xiaohan Zhao, Xinyi Shang, Jiacheng Liu, Zhiqiang Shen,
- Abstract要約: 本研究では,3次元データに対するデータセットのプルーニングについて検討する。
重み付けされたサブセットで全データ予測リスクを近似すると、表現力の不足によるカバレッジエラーと、サブセットによるクラス重みとターゲットメトリクスの不整合による事前ミスマッチバイアスの2つの重要なエラーが明らかになる。
- 参考スコア(独自算出の注目度): 42.345465506597044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dataset pruning has been widely studied for 2D images to remove redundancy and accelerate training, while particular pruning methods for 3D data remain largely unexplored. In this work, we study dataset pruning for 3D data, where its observed common long-tail class distribution nature make optimization under conventional evaluation metrics Overall Accuracy (OA) and Mean Accuracy (mAcc) inherently conflicting, and further make pruning particularly challenging. To address this, we formulate pruning as approximating the full-data expected risk with a weighted subset, which reveals two key errors: coverage error from insufficient representativeness and prior-mismatch bias from inconsistency between subset-induced class weights and target metrics. We propose representation-aware subset selection with per-class retention quotas for long-tail coverage, and prior-invariant teacher supervision using calibrated soft labels and embedding-geometry distillation. The retention quota also serves as a switch to control the OA-mAcc trade-off. Extensive experiments on 3D datasets show that our method can improve both metrics across multiple settings while adapting to different downstream preferences. Our code is available at https://github.com/XiaohanZhao123/3D-Dataset-Pruning.
- Abstract(参考訳): データ・プルーニングは冗長性を除去し、トレーニングを加速するために2次元画像に対して広く研究されてきたが、特に3次元データのプルーニング法は探索されていない。
本研究では, 3次元データに対するデータセットのプルーニングについて検討し, 従来の評価指標である総合的精度 (OA) と平均精度 (mAcc) は本質的に矛盾しており, さらに, プルーニングを特に困難にしている。
これを解決するために、我々は、プレニングを重み付きサブセットで完全なデータ予測リスクを近似するものとして定式化し、これは2つの重要なエラーを明らかにする: 表現性の不足によるカバレッジエラーと、サブセット誘発クラス重みとターゲットメトリクスの不整合による事前ミスマッチバイアスである。
そこで本稿では, 校正ソフトラベルと埋込み幾何蒸留を用いた教師の教師監督と, クラスごとの保持クォータを用いた表現対応サブセット選択を提案する。
保持クォータはOA-mAccトレードオフを制御するスイッチとしても機能する。
3Dデータセットの大規模な実験により、異なる下流の好みに適応しながら、複数の設定で両方の指標を改善できることが示されている。
私たちのコードはhttps://github.com/XiaohanZhao123/3D-Dataset-Pruning.orgで公開されています。
関連論文リスト
- Leveraging 2D Masked Reconstruction for Domain Adaptation of 3D Pose Estimation [8.365430750061506]
RGBベースの3Dポーズ推定手法はディープラーニングの開発で成功している。
既存のほとんどの手法は、トレーニングデータとは程遠い分布のイメージをテストするためにうまく動作しない。
本稿では,3次元ポーズ推定のための教師なし領域適応フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-14T19:56:43Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Distilling Long-tailed Datasets [13.330572317331198]
本稿では,偏りのある専門家の軌道と直接一致することを避けるために,分布に依存しないマッチングを提案する。
また, 蒸留指導をエキスパートデカップリングで改善し, テールクラス性能を向上する。
この研究は長い尾のデータセット蒸留の分野を開拓し、長い尾のデータセットを蒸留する最初の効果的な試みとなった。
論文 参考訳(メタデータ) (2024-08-24T15:36:36Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。