論文の概要: Efficient grouping for keypoint detection
- arxiv url: http://arxiv.org/abs/2010.12390v1
- Date: Fri, 23 Oct 2020 13:25:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:19:55.666562
- Title: Efficient grouping for keypoint detection
- Title(参考訳): キーポイント検出のための効率的なグループ化
- Authors: Alexey Sidnev, Ekaterina Krasikova, Maxim Kazakov
- Abstract要約: 本稿では,キーポイントグループ化手法と,それがCenterNetアーキテクチャの性能に与える影響について検討する。
本稿では,効率的なポストプロセッシング手法を用いた簡易かつ効率的な自動グループ化手法を提案する。
これにより、推論中のメモリ消費と処理時間をそれぞれ19%と30%削減できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of deep neural networks in the traditional keypoint detection
task encourages researchers to solve new problems and collect more complex
datasets. The size of the DeepFashion2 dataset poses a new challenge on the
keypoint detection task, as it comprises 13 clothing categories that span a
wide range of keypoints (294 in total). The direct prediction of all keypoints
leads to huge memory consumption, slow training, and a slow inference time.
This paper studies the keypoint grouping approach and how it affects the
performance of the CenterNet architecture. We propose a simple and efficient
automatic grouping technique with a powerful post-processing method and apply
it to the DeepFashion2 fashion landmark task and the MS COCO pose estimation
task. This reduces memory consumption and processing time during inference by
up to 19% and 30% respectively, and during the training stage by 28% and 26%
respectively, without compromising accuracy.
- Abstract(参考訳): 従来のキーポイント検出タスクにおけるディープニューラルネットワークの成功により、研究者は新たな問題を解決し、より複雑なデータセットを集めることができる。
deepfashion2データセットのサイズは、キーポイント検出タスクにおいて新たな課題となる。
すべてのキーポイントの直接予測は、巨大なメモリ消費、遅いトレーニング、そして遅い推論時間につながる。
本稿では,キーポイントグループ化手法がCenterNetアーキテクチャの性能に与える影響について検討する。
本稿では,強力なポストプロセッシング手法を用いた簡易かつ効率的な自動グループ化手法を提案し,それをDeepFashion2ファッションランドマークタスクとMS COCOポーズ推定タスクに適用する。
これにより、推論中のメモリ使用量と処理時間が、それぞれ19%と30%削減され、トレーニング段階ではそれぞれ28%と26%削減される。
関連論文リスト
- A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Learning Better Keypoints for Multi-Object 6DoF Pose Estimation [1.0878040851638]
グラフネットワークをトレーニングして、同様に分散された投票で分散されたキーポイントのセットを選択する。
これらの投票は、キーポイントの位置の証拠を蓄積するために回帰ネットワークによって学習され、より正確に回帰することができる。
実験では、KeyGNetが選択したキーポイントが、テストされた7つのデータセットのすべての評価指標の精度を改善した。
論文 参考訳(メタデータ) (2023-08-15T15:11:13Z) - Mixed-Precision Neural Network Quantization via Learned Layer-wise
Importance [50.00102219630088]
混合精度量子化(MPQ)は各層に対して最適なビット幅を決定するのを難しくする。
本稿では,すべての指標を同時に取得できる共同学習手法を提案する。
例えば、ResNet18上のインデックスによるMPQ検索は、わずか0.06秒しかかからない。
論文 参考訳(メタデータ) (2022-03-16T03:23:50Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Self-supervised Learning with Fully Convolutional Networks [24.660086792201263]
セマンティックセグメンテーションのためのラベルのないデータから表現を学習する問題に焦点を当てる。
2つのパッチベース手法に着想を得て,新しい自己教師付き学習フレームワークを開発した。
ベースラインモデルに対して5.8ポイント改善を達成しました。
論文 参考訳(メタデータ) (2020-12-18T02:31:28Z) - Temporal Attention-Augmented Graph Convolutional Network for Efficient
Skeleton-Based Human Action Recognition [97.14064057840089]
グラフネットワーク(GCN)はユークリッド以外のデータ構造をモデル化するのに非常に成功した。
ほとんどのGCNベースのアクション認識手法は、計算量の多いディープフィードフォワードネットワークを使用して、全てのスケルトンをアクションで処理する。
本稿では,骨格に基づく行動認識の効率を高めるための時間的アテンションモジュール(TAM)を提案する。
論文 参考訳(メタデータ) (2020-10-23T08:01:55Z) - CoKe: Localized Contrastive Learning for Robust Keypoint Detection [24.167397429511915]
特徴空間における3種類の距離を最適化するためにキーポイントカーネルを選択することができることを示す。
我々は、教師付きコントラスト学習を含むフレームワーク内で、この最適化プロセスを定式化する。
CoKeは、すべてのキーポイントを論理的に共同で表現するアプローチと比較して、最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-29T16:00:43Z) - Joint Object Contour Points and Semantics for Instance Segmentation [1.2117737635879038]
本稿では,物体境界に対するニューラルネットワークの注意を促すことを目的としたMask Point R-CNNを提案する。
具体的には、従来の人間のキーポイント検出タスクを、任意のオブジェクトの輪郭点検出に革新的に拡張する。
その結果、モデルはオブジェクトの端に対してより敏感になり、より幾何学的な特徴を捉えることができる。
論文 参考訳(メタデータ) (2020-08-02T11:11:28Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。