論文の概要: Temporally Consistent Long-Term Memory for 3D Single Object Tracking
- arxiv url: http://arxiv.org/abs/2604.13789v1
- Date: Wed, 15 Apr 2026 12:30:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.527438
- Title: Temporally Consistent Long-Term Memory for 3D Single Object Tracking
- Title(参考訳): 3次元物体追跡のための時間的一貫した長期記憶
- Authors: Jaejoon Yoo, SuBeen Lee, Yerim Jeon, Miso Lee, Jae-Pil Heo,
- Abstract要約: 3D Single Object Trackingは、LiDARポイントクラウドのシーケンスで対象オブジェクトをローカライズすることを目的としている。
近年の手法では,対象物体の予め観測された特徴を利用するメモリベースの手法が採用されている。
我々は,時間的特徴の一貫性を保ちつつ,多様な特徴を効率的に集約する,堅牢な3D-SOTフレームワークであるChronoTrackを提案する。
- 参考スコア(独自算出の注目度): 33.6335926122924
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: 3D Single Object Tracking (3D-SOT) aims to localize a target object across a sequence of LiDAR point clouds, given its 3D bounding box in the first frame. Recent methods have adopted a memory-based approach to utilize previously observed features of the target object, but remain limited to only a few recent frames. This work reveals that their temporal capacity is fundamentally constrained to short-term context due to severe temporal feature inconsistency and excessive memory overhead. To this end, we propose a robust long-term 3D-SOT framework, ChronoTrack, which preserves the temporal feature consistency while efficiently aggregating the diverse target features via long-term memory. Based on a compact set of learnable memory tokens, ChronoTrack leverages long-term information through two complementary objectives: a temporal consistency loss and a memory cycle consistency loss. The former enforces feature alignment across frames, alleviating temporal drift and improving the reliability of proposed long-term memory. In parallel, the latter encourages each token to encode diverse and discriminative target representations observed throughout the sequence via memory-point-memory cyclic walks. As a result, ChronoTrack achieves new state-of-the-art performance on multiple 3D-SOT benchmarks, demonstrating its effectiveness in long-term target modeling with compact memory while running at real-time speed of 42 FPS on a single RTX 4090 GPU. The code is available at https://github.com/ujaejoon/ChronoTrack
- Abstract(参考訳): 3D Single Object Tracking (3D-SOT)は、最初のフレームに3Dバウンディングボックスがあるため、LiDARポイントクラウドのシーケンスにターゲットオブジェクトをローカライズすることを目的としている。
近年の手法では,対象オブジェクトの既観測特性を利用するメモリベースの手法が採用されているが,近年のフレームに限られている。
この研究は、時間的容量が時間的特徴の不整合と過剰なメモリオーバーヘッドのために、基本的に短期的コンテキストに制約されていることを明らかにした。
そこで本稿では,時間的特徴の一貫性を保ちながら,長期記憶による多様な特徴を効率的に集約する,堅牢な3D-SOTフレームワークであるChronoTrackを提案する。
学習可能なメモリトークンのコンパクトなセットに基づいて、ChronoTrackは、時間的一貫性損失とメモリサイクル一貫性損失という2つの相補的な目的を通じて、長期的な情報を活用する。
前者はフレーム間の機能アライメントを強制し、時間的ドリフトを緩和し、提案した長期記憶の信頼性を向上させる。
並行して、後者は各トークンに対して、メモリポイントメモリサイクリックウォークを通じてシーケンス全体で観察される多様で差別的なターゲット表現をエンコードするよう推奨する。
その結果、ChronoTrackは複数の3D-SOTベンチマークで新たな最先端性能を実現し、1つのRTX 4090 GPU上で42 FPSのリアルタイム速度で実行しながら、コンパクトメモリによる長期ターゲットモデリングの有効性を実証した。
コードはhttps://github.com/ujaejoon/ChronoTrackで入手できる。
関連論文リスト
- RELIC: Interactive Video World Model with Long-Horizon Memory [74.81433479334821]
真のインタラクティブな世界モデルは、リアルタイムの長距離ストリーミング、一貫した空間記憶、正確なユーザ制御を必要とする。
この3つの課題を完全に解決する統合フレームワークであるRELICを紹介します。
単一の画像とテキスト記述が与えられた後、RELICは任意のシーンをリアルタイムにメモリを意識した長期探索を可能にする。
論文 参考訳(メタデータ) (2025-12-03T18:29:20Z) - Online Dense Point Tracking with Streaming Memory [54.22820729477756]
デンスポイントトラッキングは、ビデオのかなりの部分を通して、初期フレーム内のすべてのポイントの連続的な追跡を必要とする、困難なタスクである。
最近の点追跡アルゴリズムは、通常、最初のフレームから現在のフレームへの間接的な情報伝達のためにスライドウィンドウに依存する。
我々は、高密度のtextbfPOint textbfTracking とオンラインビデオ処理のための textbfStreaming メモリを備えた軽量で高速なモデルを提案する。
論文 参考訳(メタデータ) (2025-03-09T06:16:49Z) - TF-SASM: Training-free Spatial-aware Sparse Memory for Multi-object Tracking [6.91631684487121]
コンピュータビジョンにおけるマルチオブジェクト追跡(MOT)は依然として重要な課題であり、ビデオシーケンス内の複数のオブジェクトの正確な位置決めと連続的な追跡が必要である。
本稿では,オブジェクトの動きと重なり合う認識に基づいて,重要な特徴を選択的に記憶するメモリベースの新しいアプローチを提案する。
提案手法はDanceTrackテストセットのMOTRv2よりも有意に改善し,AsAスコアが2.0%,IFF1スコアが2.1%向上した。
論文 参考訳(メタデータ) (2024-07-05T07:55:19Z) - PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection [66.94819989912823]
時間的3次元物体検出を効率的に行うために,長期記憶が可能な点トラジェクトリ変換器を提案する。
私たちは、メモリバンクのストレージ要件を最小限に抑えるために、現在のフレームオブジェクトのポイントクラウドとその履歴トラジェクトリを入力として使用します。
大規模データセットに対する広範な実験を行い、我々のアプローチが最先端の手法に対してうまく機能することを実証した。
論文 参考訳(メタデータ) (2023-12-13T18:59:13Z) - Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.48716096286417]
本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。
各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。
頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-14T02:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。