論文の概要: CompTrack: Information Bottleneck-Guided Low-Rank Dynamic Token Compression for Point Cloud Tracking
- arxiv url: http://arxiv.org/abs/2511.15580v1
- Date: Wed, 19 Nov 2025 16:12:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.894593
- Title: CompTrack: Information Bottleneck-Guided Low-Rank Dynamic Token Compression for Point Cloud Tracking
- Title(参考訳): CompTrack: ポイントクラウド追跡のためのインフォメーションブートネックガイド付き低ランクダイナミックトーケン圧縮
- Authors: Sifan Zhou, Yichao Cao, Jiahao Nie, Yuqian Fu, Ziyu Zhao, Xiaobo Lu, Shuo Wang,
- Abstract要約: LiDARポイントクラウドにおける3Dオブジェクトトラッキングは、コンピュータビジョンと自律運転において重要なタスクである。
成功をおさめたにもかかわらず、ポイントクラウドの本質的な分散性は、二重冗長性の問題をもたらす。
我々は、ポイントクラウドにおける両方の冗長性を体系的に排除する、新しいエンドツーエンドフレームワークであるCompTrackを提案する。
- 参考スコア(独自算出の注目度): 43.89894227481455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 3D single object tracking (SOT) in LiDAR point clouds is a critical task in computer vision and autonomous driving. Despite great success having been achieved, the inherent sparsity of point clouds introduces a dual-redundancy challenge that limits existing trackers: (1) vast spatial redundancy from background noise impairs accuracy, and (2) informational redundancy within the foreground hinders efficiency. To tackle these issues, we propose CompTrack, a novel end-to-end framework that systematically eliminates both forms of redundancy in point clouds. First, CompTrack incorporates a Spatial Foreground Predictor (SFP) module to filter out irrelevant background noise based on information entropy, addressing spatial redundancy. Subsequently, its core is an Information Bottleneck-guided Dynamic Token Compression (IB-DTC) module that eliminates the informational redundancy within the foreground. Theoretically grounded in low-rank approximation, this module leverages an online SVD analysis to adaptively compress the redundant foreground into a compact and highly informative set of proxy tokens. Extensive experiments on KITTI, nuScenes and Waymo datasets demonstrate that CompTrack achieves top-performing tracking performance with superior efficiency, running at a real-time 90 FPS on a single RTX 3090 GPU.
- Abstract(参考訳): LiDARポイントクラウドにおける3Dシングルオブジェクトトラッキング(SOT)は、コンピュータビジョンと自律運転において重要なタスクである。
大きな成功を収めたにもかかわらず、点雲の固有な分散性は、既存のトラッカーに制限を与える二重冗長性をもたらす:(1)背景雑音からの広い空間冗長性は、精度を損なう。
これらの問題に対処するために、ポイントクラウドにおける両方の冗長性を体系的に排除する新しいエンドツーエンドフレームワークであるCompTrackを提案する。
CompTrackは、情報エントロピーに基づいて無関係な背景ノイズを除去し、空間冗長性に対処するために、空間前景予測器(Spatial Foreground Predictor:SFP)モジュールを組み込んでいる。
その後、そのコアはInformation Bottleneck-guided Dynamic Token Compression (IB-DTC)モジュールで、フォアグラウンド内での情報冗長性を排除している。
理論的には低ランク近似に基づいており、このモジュールはオンラインSVD分析を利用して冗長な前景をコンパクトで高情報性の高いプロキシトークンの集合に適応的に圧縮する。
KITTI、nuScenes、Waymoデータセットに関する大規模な実験は、CompTrackが1つのRTX 3090 GPU上で90 FPSのリアルタイム実行で、優れた効率で最高パフォーマンスのトラッキングパフォーマンスを達成することを示した。
関連論文リスト
- Beyond Frame-wise Tracking: A Trajectory-based Paradigm for Efficient Point Cloud Tracking [13.622939944601393]
TrajTrackは、歴史的なバウンディングボックストラジェクトリだけで動きの連続性を暗黙的に学習することで、ベース2フレームトラッカーを強化する軽量フレームワークである。
新たな最先端性能を実現し、56FPSで走行しながら強力なベースライン上での追跡精度を4.48%向上させた。
論文 参考訳(メタデータ) (2025-09-14T21:57:16Z) - LiDAR MOT-DETR: A LiDAR-based Two-Stage Transformer for 3D Multiple Object Tracking [4.65812324892521]
ライダーをベースとした2段式DETRインバータ,スムーズかつトラッカーを提案する。
よりスムーズなステージは、移動中の時間窓を越えて、市販の検出器からライダー物体の検出を洗練させる。
トラッカーステージはDETRベースのアテンションブロックを使用して、トラックされたオブジェクトと、ポイントクラウドをコンテキストとして洗練された検出とを関連付けることで、トラックを時間にわたって維持する。
論文 参考訳(メタデータ) (2025-05-19T06:25:48Z) - Two-stream Beats One-stream: Asymmetric Siamese Network for Efficient Visual Tracking [54.124445709376154]
効率的な追跡を行うために,textbfAsymTrack という新しい非対称なシームズトラッカーを提案する。
このアーキテクチャに基づいて、検索機能に重要な手がかりを注入する効率的なテンプレート変調機構を考案する。
実験によると、AsymTrackは異なるプラットフォーム間で、より優れたスピード精度のトレードオフを提供する。
論文 参考訳(メタデータ) (2025-03-01T14:44:54Z) - VoxelTrack: Exploring Voxel Representation for 3D Point Cloud Object Tracking [3.517993407670811]
現在のLiDARポイントクラウドベースの3Dオブジェクトトラッキング(SOT)手法は、通常、ポイントベースの表現ネットワークに依存している。
本稿では,VoxelTrackと呼ばれる新しいトラッキングフレームワークを紹介する。
本質的に乱れた点雲を3Dボクセルにボクセル化することで、VoxelTrackは正確で堅牢な3D空間情報を効果的にモデル化する。
論文 参考訳(メタデータ) (2024-08-05T06:38:43Z) - PointCompress3D: A Point Cloud Compression Framework for Roadside LiDARs in Intelligent Transportation Systems [24.783727646151583]
この研究は、ロードサイドのLiDARに特化した新しいポイントクラウド圧縮フレームワークであるPointCompress3Dを紹介した。
実世界のTUMTrafデータセットファミリを用いて,3つの最先端圧縮手法を適応し,拡張し,統合し,評価する。
大規模な実験およびアブレーション研究において、データセット上でPSNR d2の94.46とBPPの6.54を達成した。
論文 参考訳(メタデータ) (2024-05-02T21:35:45Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - Spatio-Temporal Bi-directional Cross-frame Memory for Distractor Filtering Point Cloud Single Object Tracking [2.487142846438629]
LIDARポイント内の1つのオブジェクトトラッキングは、コンピュータビジョンにおける重要なタスクである。
既存の手法は、ネットワーク経由の外観マッチングのみに依存するか、連続したフレームからの情報を利用するが、重大な課題に遭遇する。
我々は、これらの課題を緩和するために、STMD-Trackerという、革新的なクロスフレームバイテンポラルモーショントラッカーを設計する。
論文 参考訳(メタデータ) (2024-03-23T13:15:44Z) - BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in Bird's-Eye View [54.48052449493636]
3Dシングルオブジェクトトラッキング(SOT)はコンピュータビジョンの基本課題であり、自律運転のようなアプリケーションにおいて重要な役割を果たす。
BEVTrackは、シンプルだが効果的な動きに基づくトラッキング手法である。
我々は,BEVTrackが200FPSで動作しながら最先端の結果を達成し,リアルタイム適用性を実現していることを示す。
論文 参考訳(メタデータ) (2023-09-05T12:42:26Z) - CXTrack: Improving 3D Point Cloud Tracking with Contextual Information [59.55870742072618]
3Dオブジェクトトラッキングは、自律運転など、多くのアプリケーションにおいて重要な役割を果たす。
CXTrackは3次元オブジェクト追跡のためのトランスフォーマーベースのネットワークである。
CXTrackは29FPSで動作しながら最先端のトラッキング性能を実現する。
論文 参考訳(メタデータ) (2022-11-12T11:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。