論文の概要: Tail-Aware Post-Training Quantization for 3D Geometry Models
- arxiv url: http://arxiv.org/abs/2602.01741v1
- Date: Mon, 02 Feb 2026 07:21:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.97526
- Title: Tail-Aware Post-Training Quantization for 3D Geometry Models
- Title(参考訳): 3次元幾何モデルのためのテイルアウェアポストトレーニング量子化
- Authors: Sicheng Pan, Chen Tang, Shuzhao Xie, Ke Yang, Weixiang Zhang, Jiawei Li, Bin Chen, Shu-Tao Xia, Zhi Wang,
- Abstract要約: ポストトレーニング量子化(PTQ)は、再トレーニングなしに効率的な推論を可能にする。
PTQは複雑な特徴分布と禁止キャリブレーションオーバーヘッドのために、3Dモデルに効果的に転送できない。
3次元幾何学学習のためのTail-Aware Post-Training Quantization PipelineであるTAPTQを提案する。
- 参考スコア(独自算出の注目度): 58.79500829118265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The burgeoning complexity and scale of 3D geometry models pose significant challenges for deployment on resource-constrained platforms. While Post-Training Quantization (PTQ) enables efficient inference without retraining, conventional methods, primarily optimized for 2D Vision Transformers, fail to transfer effectively to 3D models due to intricate feature distributions and prohibitive calibration overhead. To address these challenges, we propose TAPTQ, a Tail-Aware Post-Training Quantization pipeline specifically engineered for 3D geometric learning. Our contribution is threefold: (1) To overcome the data-scale bottleneck in 3D datasets, we develop a progressive coarse-to-fine calibration construction strategy that constructs a highly compact subset to achieve both statistical purity and geometric representativeness. (2) We reformulate the quantization interval search as an optimization problem and introduce a ternary-search-based solver, reducing the computational complexity from $\mathcal{O}(N)$ to $\mathcal{O}(\log N)$ for accelerated deployment. (3) To mitigate quantization error accumulation, we propose TRE-Guided Module-wise Compensation, which utilizes a Tail Relative Error (TRE) metric to adaptively identify and rectify distortions in modules sensitive to long-tailed activation outliers. Extensive experiments on the VGGT and Pi3 benchmarks demonstrate that TAPTQ consistently outperforms state-of-the-art PTQ methods in accuracy while significantly reducing calibration time. The code will be released soon.
- Abstract(参考訳): 3次元幾何学モデルの急成長する複雑さと規模は、リソース制約のあるプラットフォームへの展開に重大な課題をもたらす。
PTQ(Post-Training Quantization)は、再トレーニングなしに効率的な推論を可能にするが、従来の2次元ビジョントランスフォーマーに最適化された手法は、複雑な特徴分布と不規則なキャリブレーションオーバーヘッドのために、3Dモデルに効果的に転送できない。
これらの課題に対処するために,3次元幾何学学習に特化したTail-Aware Post-Training Quantization PipelineであるTAPTQを提案する。
1) 3次元データセットにおけるデータスケールのボトルネックを克服するため、統計的純度と幾何学的代表性の両方を達成するために、高度にコンパクトなサブセットを構築するプログレッシブ・粗大キャリブレーション・コンストラクション・ストラテジーを開発した。
2) 最適化問題として量子化区間探索を再構成し, 3次探索に基づく解法を導入し, 計算複雑性を$\mathcal{O}(N)$から$\mathcal{O}(\log N)$に減らした。
(3) 量子化誤差の蓄積を軽減するため,TRE(Tail Relative Error) 測定値を用いて,長い尾のアクティベーションオフレイアに敏感なモジュールの歪みを適応的に識別・修正するTRE-Guided Module-wise Compensationを提案する。
VGGTとPi3ベンチマークの大規模な実験により、TAPTQはキャリブレーション時間を大幅に短縮しつつ、最先端のPTQ手法よりも一貫して精度が高いことが示されている。
コードはまもなくリリースされる。
関連論文リスト
- ITS3D: Inference-Time Scaling for Text-Guided 3D Diffusion Models [88.04431808574581]
ITS3Dは、最も効果的なガウス雑音入力を特定するための最適化問題としてタスクを定式化するフレームワークである。
安定性, 効率, 探索能力を向上させるための3つの技術を紹介する。
実験により、ITS3Dはテキストから3D生成の品質を向上させることが示された。
論文 参考訳(メタデータ) (2025-11-27T13:46:16Z) - Quantized Visual Geometry Grounded Transformer [67.15451442018258]
本稿では,VGGTの最初の量子化フレームワーク,すなわちQuantVGGTを提案する。
球状前アダマール回転と局所流路平滑化を統合したDual-Smoothed Fine-Grained Quantizationを導入する。
また、重層統計量を用いて外周をフィルタするノイズフィルタディバースサンプリングを設計する。
論文 参考訳(メタデータ) (2025-09-25T15:17:11Z) - Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - Spectral Compression Transformer with Line Pose Graph for Monocular 3D Human Pose Estimation [1.8999296421549172]
本稿では,SCT(Spectral Compression Transformer)を導入し,シーケンス長を削減し,計算を高速化する。
LPGは、入力された2D関節位置を補完する骨格位置情報を生成する。
本モデルでは,計算効率を向上し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-05-27T15:08:03Z) - Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.93661496405653]
我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。
具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。
実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文 参考訳(メタデータ) (2024-07-03T10:42:09Z) - Taming 3DGS: High-Quality Radiance Fields with Limited Resources [50.92437599516609]
3D Gaussian Splatting (3DGS)は、高速で解釈可能で高忠実なレンダリングで新規ビュー合成を変換した。
予算で3DGSモデルをトレーニングし、レンダリングするという課題に取り組みます。
我々は、勾配計算と属性更新のための高速で数値的に等価な解を導出する。
論文 参考訳(メタデータ) (2024-06-21T20:44:23Z) - LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object
Detection [35.35457515189062]
ポストトレーニング量子化(PTQ)は2次元視覚タスクで広く採用されている。
センターポイントに適用した場合、LiDAR-PTQは最先端の量子化性能が得られる。
LiDAR-PTQは、量子化対応のトレーニング手法よりも30倍高速である。
論文 参考訳(メタデータ) (2024-01-29T03:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。