論文の概要: Point-Query Quadtree for Crowd Counting, Localization, and More
- arxiv url: http://arxiv.org/abs/2308.13814v1
- Date: Sat, 26 Aug 2023 08:38:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 18:59:17.765698
- Title: Point-Query Quadtree for Crowd Counting, Localization, and More
- Title(参考訳): クラウドカウントやローカライゼーションなどのためのPoint-Query Quadtree
- Authors: Chengxin Liu, Hao Lu, Zhiguo Cao, Tongliang Liu
- Abstract要約: 群集カウントは分解可能な点問合せプロセスとみなすことができる。
PET(Point quEry Transformer)と呼ばれる新しいカウントモデルを提案する。
PETはデータ依存のクワッドツリー分割による分解可能なポイントクエリを実装している。
- 参考スコア(独自算出の注目度): 69.00707812641019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We show that crowd counting can be viewed as a decomposable point querying
process. This formulation enables arbitrary points as input and jointly reasons
whether the points are crowd and where they locate. The querying processing,
however, raises an underlying problem on the number of necessary querying
points. Too few imply underestimation; too many increase computational
overhead. To address this dilemma, we introduce a decomposable structure, i.e.,
the point-query quadtree, and propose a new counting model, termed Point quEry
Transformer (PET). PET implements decomposable point querying via
data-dependent quadtree splitting, where each querying point could split into
four new points when necessary, thus enabling dynamic processing of sparse and
dense regions. Such a querying process yields an intuitive, universal modeling
of crowd as both the input and output are interpretable and steerable. We
demonstrate the applications of PET on a number of crowd-related tasks,
including fully-supervised crowd counting and localization, partial annotation
learning, and point annotation refinement, and also report state-of-the-art
performance. For the first time, we show that a single counting model can
address multiple crowd-related tasks across different learning paradigms. Code
is available at https://github.com/cxliu0/PET.
- Abstract(参考訳): 群衆数を分解可能な点問合せプロセスとして見ることができることを示す。
この定式化は任意の点を入力とし、点が群であり、位置がどこにあるかという共同の理由を与える。
しかし、クエリ処理は、必要なクエリポイントの数に関する根本的な問題を引き起こす。
過小評価があまりにも少なく、計算オーバーヘッドが増加します。
このジレンマに対処するため,ポイントクエリ・クワッドツリー(point-query quadtree)という分解可能な構造を導入し,新しいカウントモデル(Point quEry Transformer,PET)を提案する。
PETはデータ依存のクワッドツリー分割による分解可能なポイントクエリを実装しており、各クエリポイントは必要に応じて4つの新しいポイントに分割できる。
このような問い合わせプロセスは、入出力と入出力の両方が解釈可能かつ操作可能なので、直感的で普遍的な群衆のモデリングをもたらす。
本報告では,PET の群衆関連タスクへの活用を実演し,完全教師付きクラウドカウントとローカライゼーション,部分アノテーション学習,ポイントアノテーションの改良,そして最先端のパフォーマンスの報告を行う。
単一のカウントモデルが、異なる学習パラダイムにまたがる複数のクラウド関連タスクに対処できることを初めて示す。
コードはhttps://github.com/cxliu0/PETで入手できる。
関連論文リスト
- KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。
我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文 参考訳(メタデータ) (2024-07-12T01:06:00Z) - CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Point Cloud Registration using Representative Overlapping Points [10.843159482657303]
本稿では,登録のための識別機能を備えた代表オーバーラップポイントを用いた新しいディープラーニングモデル ROPNetを提案する。
具体的には,エンコーダを用いてポイントオーバーラップスコアの予測にグローバルな特徴を抽出するコンテキスト誘導モジュールを提案する。
ノイズと部分重なり合う点雲を用いたModelNet40上での実験により,提案手法が従来の学習手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-07-06T12:52:22Z) - Dense Point Prediction: A Simple Baseline for Crowd Counting and
Localization [17.92958745980573]
SCALNetという簡便かつ効果的なクラウドカウント・ローカリゼーションネットワークを提案します。
これらのタスクをピクセル単位での密集した予測問題と考え,エンドツーエンドのフレームワークに統合する。
近年の大規模ベンチマークであるNWPU-Crowdの実験により, 提案手法は, 群集のローカライゼーションおよびカウントタスクにおいて, それぞれ5%以上, 10%以上向上していることがわかった。
論文 参考訳(メタデータ) (2021-04-26T12:08:08Z) - TransCrowd: Weakly-Supervised Crowd Counting with Transformer [56.84516562735186]
今回提案するTransCrowdは、Transformerに基づくシーケンス・ツー・カウントの観点から、監視の弱い群衆カウント問題を再構成する。
5つのベンチマークデータセットの実験は、提案されたTransCrowdが、弱い監視されたCNNベースのカウント方法すべてと比較して優れたパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-19T08:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。