論文の概要: GLT-T++: Global-Local Transformer for 3D Siamese Tracking with Ranking
Loss
- arxiv url: http://arxiv.org/abs/2304.00242v1
- Date: Sat, 1 Apr 2023 06:39:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 19:03:10.084257
- Title: GLT-T++: Global-Local Transformer for 3D Siamese Tracking with Ranking
Loss
- Title(参考訳): GLT-T++:3次元シームズ追跡のためのグローバルローカルトランスフォーマー
- Authors: Jiahao Nie, Zhiwei He, Yuxiang Yang, Xudong Lv, Mingyu Gao, Jing Zhang
- Abstract要約: 3D領域提案ネットワーク(RPN)に基づくシームズトラッカーは、ディープ投票で顕著な成功を収めた。
しかし、投票のキューとして1つのシードポイント機能を使用することで、高品質な3D提案が得られない。
そこで我々は,より優れた提案を生成するために,トランスフォーマーに基づく投票方式を提案する。
- 参考スコア(独自算出の注目度): 8.847068587755803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Siamese trackers based on 3D region proposal network (RPN) have shown
remarkable success with deep Hough voting. However, using a single seed point
feature as the cue for voting fails to produce high-quality 3D proposals.
Additionally, the equal treatment of seed points in the voting process,
regardless of their significance, exacerbates this limitation. To address these
challenges, we propose a novel transformer-based voting scheme to generate
better proposals. Specifically, a global-local transformer (GLT) module is
devised to integrate object- and patch-aware geometric priors into seed point
features, resulting in robust and accurate cues for offset learning of seed
points. To train the GLT module, we introduce an importance prediction branch
that learns the potential importance weights of seed points as a training
constraint. Incorporating this transformer-based voting scheme into 3D RPN, a
novel Siamese method dubbed GLT-T is developed for 3D single object tracking on
point clouds. Moreover, we identify that the highest-scored proposal in the
Siamese paradigm may not be the most accurate proposal, which limits tracking
performance. Towards this concern, we approach the binary score prediction task
as a ranking problem, and design a target-aware ranking loss and a
localization-aware ranking loss to produce accurate ranking of proposals. With
the ranking losses, we further present GLT-T++, an enhanced version of GLT-T.
Extensive experiments on multiple benchmarks demonstrate that our GLT-T and
GLT-T++ outperform state-of-the-art methods in terms of tracking accuracy while
maintaining a real-time inference speed. The source code will be made available
at https://github.com/haooozi/GLT-T.
- Abstract(参考訳): 3D領域提案ネットワーク(RPN)に基づくシームズトラッカーは、深いハフ投票で顕著な成功を収めている。
しかし、投票のキューとして1つのシードポイント機能を使用することで、高品質な3D提案が得られない。
さらに、投票過程におけるシードポイントの平等な処理は、その重要性にかかわらず、この制限を悪化させる。
これらの課題に対処するために,より優れた提案を生成するための新しいトランスフォーマーベースの投票方式を提案する。
特に、グローバルローカルトランスフォーマー(glt)モジュールは、オブジェクトとパッチ対応の幾何学的プリエントをシードポイントの特徴に統合するために考案され、結果として、シードポイントのオフセット学習のためのロバストで正確なヒントが得られる。
GLTモジュールをトレーニングするために,シードポイントの潜在的重要性重みをトレーニング制約として学習する重要予測分岐を導入する。
この変圧器を用いた投票方式を3D RPNに組み込んで,GLT-Tと呼ばれる新しいシームズ法を開発した。
さらに,シアームパラダイムにおける最上位の提案は,追従性能を制限した最も正確な提案ではないことを明らかにする。
そこで本研究では,二進数予測タスクをランキング問題としてアプローチし,目標対応ランキング損失とローカライズ対応ランキング損失を設計し,提案手法の正確なランキングを作成する。
GLT-T++はGLT-Tの強化版である。
複数のベンチマークにおいて、GLT-TとGLT-T++は、リアルタイムの推論速度を維持しながら、トラッキング精度において最先端の手法より優れていることを示す。
ソースコードはhttps://github.com/haooozi/glt-tで入手できる。
関連論文リスト
- Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の双方の最も高い需要において、これらの誤り貢献ゾーンを特定することができる。
LPMは特定ゾーンに点密度を適用し、これらの領域の前に位置する点の不透明度をリセットし、不条件点を補正する新たな機会を創出する。
特に、LPMはバニラ3DGSとSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - VST++: Efficient and Stronger Visual Saliency Transformer [74.26078624363274]
我々は,グローバルな長距離依存関係を探索する,効率的で強力なVST++モデルを開発した。
我々は、RGB、RGB-D、RGB-T SODベンチマークデータセット上で、トランスフォーマーベースのバックボーンにまたがってモデルを評価した。
論文 参考訳(メタデータ) (2023-10-18T05:44:49Z) - Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - G3Reg: Pyramid Graph-based Global Registration using Gaussian Ellipsoid Model [21.189016878269104]
本研究では,LiDAR点雲の高速かつ堅牢なグローバル登録のための新しいフレームワークであるG3Regを紹介する。
従来の複雑なキーポイントや記述子とは対照的に、基本的な幾何学的プリミティブを抽出する。
本稿では,グローバル登録のためのピラミッドグラフに基づく不信検証方式を提案する。
論文 参考訳(メタデータ) (2023-08-22T17:23:00Z) - Adversarial Erasing with Pruned Elements: Towards Better Graph Lottery
Ticket [29.566550489366875]
Graph Lottery Ticket (GLT) は、大きな入力グラフ上のディープグラフニューラルネットワーク(GNN)の計算コストを軽減するために提案されている。
刈り取られた情報を再評価・再考することなく、反復等級ベースプルーニング(IMP)を適用して、解答研究におけるGLTの勝利を得る。
我々は、GLTに再グループ化して最終的な性能を高めることができる予測、すなわち、刈り取られたグラフ接続とモデルパラメータに見落とされた価値情報を定式化する。
論文 参考訳(メタデータ) (2023-08-05T16:21:12Z) - GLT-T: Global-Local Transformer Voting for 3D Single Object Tracking in
Point Clouds [8.441580622105601]
現在の3Dシングルオブジェクト追跡手法は、一般的に3D領域の提案ネットワークであるVoteNetに基づいている。
この成功にもかかわらず、VoteNetのオフセット学習のキューとして単一のシードポイント機能を使用することで、高品質な3D提案が生成されるのを防ぐことができる。
そこで本研究では,より情報的な手がかりを提供し,潜在的なシードポイントにもっと注意を払うための,新しいグローバル・ローカル・トランスフォーマー投票方式を提案する。
論文 参考訳(メタデータ) (2022-11-20T09:53:24Z) - Exploring Point-BEV Fusion for 3D Point Cloud Object Tracking with
Transformer [62.68401838976208]
3Dオブジェクトトラッキングは、オブジェクトテンプレートが与えられた連続したフレームにおけるオブジェクトの位置と向きを予測することを目的としている。
トランスの成功に触発されたPTTR(Point Tracking TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-08-10T08:36:46Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - PTTR: Relational 3D Point Cloud Object Tracking with Transformer [37.06516957454285]
ポイントクラウドシーケンスでは、3Dオブジェクトトラッキングは、テンプレートポイントクラウドが与えられた現在の検索ポイントクラウド内のオブジェクトの位置と向きを予測することを目的としている。
本稿では,高品位な3次元追跡結果を粗い方法で効率的に予測し,変圧器操作の助けを借りて,ポイントトラッキングTRansformer (PTTR)を提案する。
論文 参考訳(メタデータ) (2021-12-06T08:28:05Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。