論文の概要: Super Resolution in Human Pose Estimation: Pixelated Poses to a
Resolution Result?
- arxiv url: http://arxiv.org/abs/2107.02108v1
- Date: Mon, 5 Jul 2021 16:06:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 14:56:56.593299
- Title: Super Resolution in Human Pose Estimation: Pixelated Poses to a
Resolution Result?
- Title(参考訳): 人間の視点推定における超解像--解像結果の正解か?
- Authors: Peter Hardy, Srinandan Dasmahapatra, Hansung Kim
- Abstract要約: キーポイント検出時にSRを使用するタイミングを決定するための新しいMask-RCNN手法を提案する。
その結果,低分解能者に対しては,SRが適用されればキーポイント検出性能が向上することがわかった。
そこで我々は,キーポイント検出ステップ中にSRをいつ使用するかを決定するためにセグメンテーション領域しきい値を利用する,新しいMask-RCNNアプローチを導入した。
- 参考スコア(独自算出の注目度): 9.577509224534323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The results obtained from state of the art human pose estimation (HPE) models
degrade rapidly when evaluating people of a low resolution, but can super
resolution (SR) be used to help mitigate this effect? By using various SR
approaches we enhanced two low resolution datasets and evaluated the change in
performance of both an object and keypoint detector as well as end-to-end HPE
results. We remark the following observations. First we find that for low
resolution people their keypoint detection performance improved once SR was
applied. Second, the keypoint detection performance gained is dependent on the
persons initial resolution (segmentation area in pixels) in the original image;
keypoint detection performance was improved when SR was applied to people with
a small initial segmentation area, but degrades as this becomes larger. To
address this we introduced a novel Mask-RCNN approach, utilising a segmentation
area threshold to decide when to use SR during the keypoint detection step.
This approach achieved the best results for each of our HPE performance
metrics.
- Abstract(参考訳): art human pose estimation(hpe)モデルから得られた結果は、低解像度の人を評価する際に急速に劣化するが、この効果を緩和するためにスーパーレゾリューション(sr)が使用できるか?
様々なSR手法を用いて2つの低解像度データセットを拡張し、オブジェクトとキーポイント検出器の両方の性能およびエンドツーエンドのHPE結果の変化を評価した。
我々は以下の観察を述べる。
まず、低解像度の人にとって、SRが適用されればキーポイント検出性能が向上することがわかった。
第2に、得られたキーポイント検出性能は、元の画像の人物の初期解像度(画素のセグメンテーション領域)に依存し、SRが小さい初期セグメンテーション領域の人に適用されるとキーポイント検出性能が向上するが、それに伴い劣化する。
そこで我々は,キーポイント検出ステップ中にSRをいつ使用するかを決定するためにセグメンテーション領域しきい値を利用する新しいMask-RCNN手法を提案する。
このアプローチは、HPEパフォーマンスメトリクス毎に最高の結果を得ました。
関連論文リスト
- SHaRPose: Sparse High-Resolution Representation for Human Pose
Estimation [39.936860590417346]
Sparse High- resolution Representations のみを人間の姿勢推定に用いるフレームワーク(SHaRPose)を提案する。
我々のモデルであるSHaRPose-Baseは、検証セット上で77.4 AP(+0.5 AP)、COCOテストデブセット上で76.7 AP(+0.5 AP)を達成し、ViTPose-Baseより1.4Times$速い速度で推論する。
論文 参考訳(メタデータ) (2023-12-17T16:29:16Z) - Improving Performance of Object Detection using the Mechanisms of Visual
Recognition in Humans [0.4297070083645048]
我々はまず、画像解像度の関数として最先端のディープオブジェクト認識ネットワークであるFaster-RCNNの性能を追跡する。
また、認識過程において、異なる空間周波数が物体に関する異なる情報を伝えることも示している。
単分解能ネットワークではなく,多分解能オブジェクト認識フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-23T19:09:36Z) - MrSARP: A Hierarchical Deep Generative Prior for SAR Image
Super-resolution [0.5161531917413706]
SAR画像のための新しい階層的深部生成モデルMrSARPを提案する。
MrSARPは、異なる解像度でターゲットの現実的なイメージであるかどうかを判断するために、複数の解像度の画像を共同でスコアする批評家と共同で訓練されている。
我々は,この深部生成モデルを用いて,同じターゲットの低解像度画像から高解像度画像を取得する方法を示す。
論文 参考訳(メタデータ) (2022-11-30T19:12:21Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Boosting High-Level Vision with Joint Compression Artifacts Reduction
and Super-Resolution [10.960291115491504]
任意の品質係数で圧縮された低解像度画像から、アーティファクトフリーの高解像度画像を生成する。
文脈認識型CARとSRニューラルネットワーク(CAJNN)は、局所的特徴と非局所的特徴を統合し、CARとSRを1段階で解く。
高品質で高解像度な画像を予測するために、ディープ・リコンストラクション・ネットワークが採用されている。
論文 参考訳(メタデータ) (2020-10-18T04:17:08Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Feature-Driven Super-Resolution for Object Detection [13.748941620767452]
本稿では,低解像度(LR)画像の検出性能を向上させるために,シンプルだが強力な機能駆動型超解像(FDSR)を提案する。
FDSRは、MS COCOバリデーション、VOC2007データベースにおける検出性能mAPより優れ、他の検出ネットワークによく一般化されている。
論文 参考訳(メタデータ) (2020-04-01T16:33:07Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。