論文の概要: GLT-T: Global-Local Transformer Voting for 3D Single Object Tracking in
Point Clouds
- arxiv url: http://arxiv.org/abs/2211.10927v1
- Date: Sun, 20 Nov 2022 09:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:26:31.173150
- Title: GLT-T: Global-Local Transformer Voting for 3D Single Object Tracking in
Point Clouds
- Title(参考訳): GLT-T:ポイントクラウドにおける3次元単一物体追跡のためのグローバルローカル変圧器投票
- Authors: Jiahao Nie, Zhiwei He, Yuxiang Yang, Mingyu Gao, Jing Zhang
- Abstract要約: 現在の3Dシングルオブジェクト追跡手法は、一般的に3D領域の提案ネットワークであるVoteNetに基づいている。
この成功にもかかわらず、VoteNetのオフセット学習のキューとして単一のシードポイント機能を使用することで、高品質な3D提案が生成されるのを防ぐことができる。
そこで本研究では,より情報的な手がかりを提供し,潜在的なシードポイントにもっと注意を払うための,新しいグローバル・ローカル・トランスフォーマー投票方式を提案する。
- 参考スコア(独自算出の注目度): 8.441580622105601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current 3D single object tracking methods are typically based on VoteNet, a
3D region proposal network. Despite the success, using a single seed point
feature as the cue for offset learning in VoteNet prevents high-quality 3D
proposals from being generated. Moreover, seed points with different importance
are treated equally in the voting process, aggravating this defect. To address
these issues, we propose a novel global-local transformer voting scheme to
provide more informative cues and guide the model pay more attention on
potential seed points, promoting the generation of high-quality 3D proposals.
Technically, a global-local transformer (GLT) module is employed to integrate
object- and patch-aware prior into seed point features to effectively form
strong feature representation for geometric positions of the seed points, thus
providing more robust and accurate cues for offset learning. Subsequently, a
simple yet effective training strategy is designed to train the GLT module. We
develop an importance prediction branch to learn the potential importance of
the seed points and treat the output weights vector as a training constraint
term. By incorporating the above components together, we exhibit a superior
tracking method GLT-T. Extensive experiments on challenging KITTI and NuScenes
benchmarks demonstrate that GLT-T achieves state-of-the-art performance in the
3D single object tracking task. Besides, further ablation studies show the
advantages of the proposed global-local transformer voting scheme over the
original VoteNet. Code and models will be available at
https://github.com/haooozi/GLT-T.
- Abstract(参考訳): 現在の3dシングルオブジェクト追跡手法は、3dリージョンの提案ネットワークである votenet に基づいている。
この成功にもかかわらず、単一シードポイント機能を投票ネットでオフセット学習の手がかりとして使用すると、高品質な3dプロポーザルが生成されない。
さらに、異なる重要度を持つ種点を投票過程で等しく処理し、この欠陥を悪化させる。
これらの課題に対処するため,我々は,より情報的な手がかりを提供し,潜在的なシードポイントにもっと注意を払うための新しいグローバルなトランスフォーマー投票方式を提案し,高品質な3Dプロポーザルの創出を促進する。
技術的には、グローバルローカルトランスフォーマー(GLT)モジュールは、シードポイントの幾何学的位置に対する強力な特徴表現を効果的に形成するために、シードポイントに先立ってオブジェクトとパッチの認識を組み込むために使用される。
その後、単純かつ効果的な訓練戦略がgltモジュールを訓練するために設計される。
我々は,シードポイントの潜在的重要性を学習し,出力重みベクトルを訓練制約項として扱うために,重要予測分岐を開発する。
上記の成分を一体化することにより,優れた追跡手法であるGLT-Tを示す。
KITTIとNuScenesベンチマークの大規模な実験は、GLT-Tが3Dオブジェクト追跡タスクで最先端のパフォーマンスを達成することを示した。
さらに、さらなるアブレーション研究は、元のVoteNetに対して提案されたグローバルローカルトランスフォーマー投票方式の利点を示している。
コードとモデルはhttps://github.com/haooozi/glt-tで入手できる。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - HGL: Hierarchical Geometry Learning for Test-time Adaptation in 3D Point Cloud Segmentation [20.1605364785155]
本稿では,3次元クラウドセグメンテーションのための階層幾何学学習(HGL)フレームワークを提案する。
HGLは、局所的、グローバルから時間的学習までの3つの相補的なモジュールをボトムアップで構成する。
SynLiDAR to Semantic KITTIタスクでは、HGLは46.91%のmIoUを達成し、GIPSOを3.0%改善し、必要な適応時間を80%削減した。
論文 参考訳(メタデータ) (2024-07-17T08:08:03Z) - Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の双方の最も高い需要において、これらの誤り貢献ゾーンを特定することができる。
LPMは特定ゾーンに点密度を適用し、これらの領域の前に位置する点の不透明度をリセットし、不条件点を補正する新たな機会を創出する。
特に、LPMはバニラ3DGSとSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - Weakly Supervised Point Clouds Transformer for 3D Object Detection [4.723682216326063]
本稿では3次元物体検出に使用される点雲変圧器の弱監督のための枠組みを提案する。
目的は、3Dデータセットのアノテートに高いコストがかかるため、トレーニングに必要な監督の必要な量を削減することである。
挑戦的なKITTIデータセットでは、実験結果は平均精度が最も高いレベルに達した。
論文 参考訳(メタデータ) (2023-09-08T03:56:34Z) - GLT-T++: Global-Local Transformer for 3D Siamese Tracking with Ranking
Loss [15.827430043402952]
3D領域提案ネットワーク(RPN)に基づくシームズトラッカーは、ディープ投票で顕著な成功を収めた。
しかし、投票のキューとして1つのシードポイント機能を使用することで、高品質な3D提案が得られない。
そこで我々は,より優れた提案を生成するために,トランスフォーマーに基づく投票方式を提案する。
論文 参考訳(メタデータ) (2023-04-01T06:39:58Z) - Exploring Point-BEV Fusion for 3D Point Cloud Object Tracking with
Transformer [62.68401838976208]
3Dオブジェクトトラッキングは、オブジェクトテンプレートが与えられた連続したフレームにおけるオブジェクトの位置と向きを予測することを目的としている。
トランスの成功に触発されたPTTR(Point Tracking TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-08-10T08:36:46Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Back-tracing Representative Points for Voting-based 3D Object Detection
in Point Clouds [42.24217764222523]
back-tracing Representative Points Network (BRNet) と呼ばれる新しい3Dオブジェクト検出手法を提案する。
brnetは投票所から代表ポイントを追跡し、これらの生成したポイントの周りの補完的なシードポイントを再検討する。
当社のBRNetはシンプルで効果的で、2つの大規模ポイントクラウドデータセットの最先端のメソッドを大幅に上回ります。
論文 参考訳(メタデータ) (2021-04-13T11:39:42Z) - 3D Object Detection with Pointformer [29.935891419574602]
本稿では,3dポイントクラウドのためのトランスフォーマーバックボーンであるpointformerを提案する。
ローカルトランスフォーマーモジュールは、オブジェクトレベルでコンテキスト依存の領域特徴を学習するローカル領域のポイント間の相互作用をモデル化するために使用される。
Global Transformerは、シーンレベルでコンテキスト対応の表現を学ぶように設計されている。
論文 参考訳(メタデータ) (2020-12-21T15:12:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。