論文の概要: Human Pose Estimation on Privacy-Preserving Low-Resolution Depth Images
- arxiv url: http://arxiv.org/abs/2007.08340v2
- Date: Fri, 20 Aug 2021 10:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 23:24:10.419539
- Title: Human Pose Estimation on Privacy-Preserving Low-Resolution Depth Images
- Title(参考訳): プライバシ保存型低解像度深度画像のヒューマンポース推定
- Authors: Vinkle Srivastav, Afshin Gangi, Nicolas Padoy
- Abstract要約: HPE(Human pose Estimation)は、オペレーティングルーム(OR)内でAIベースのコンテキスト認識システムを開発するための重要なビルディングブロックである。
低解像度のプライバシー保護画像のみを使用できることは、これらの懸念に対処する。
マルチスケールの超解像ネットワークと2次元のポーズ推定ネットワークを統合するエンド・ツー・エンドのソリューションを提案する。
- 参考スコア(独自算出の注目度): 2.8802646903517957
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human pose estimation (HPE) is a key building block for developing AI-based
context-aware systems inside the operating room (OR). The 24/7 use of images
coming from cameras mounted on the OR ceiling can however raise concerns for
privacy, even in the case of depth images captured by RGB-D sensors. Being able
to solely use low-resolution privacy-preserving images would address these
concerns and help scale up the computer-assisted approaches that rely on such
data to a larger number of ORs. In this paper, we introduce the problem of HPE
on low-resolution depth images and propose an end-to-end solution that
integrates a multi-scale super-resolution network with a 2D human pose
estimation network. By exploiting intermediate feature-maps generated at
different super-resolution, our approach achieves body pose results on
low-resolution images (of size 64x48) that are on par with those of an approach
trained and tested on full resolution images (of size 640x480).
- Abstract(参考訳): ヒューマンポーズ推定(HPE)は、オペレーティングルーム(OR)内でAIベースのコンテキスト認識システムを開発するための重要なビルディングブロックである。
OR天井に搭載されたカメラからの24/7画像の使用は、RGB-Dセンサーが捉えた奥行き画像であってもプライバシーの懸念を引き起こす可能性がある。
低解像度のプライバシー保存イメージのみを使用できることで、これらの懸念に対処し、より多くのorsにデータに依存するコンピュータ支援アプローチのスケールアップに役立ちます。
本稿では,低解像度深度画像におけるhpeの問題を紹介し,マルチスケール超高解像度ネットワークと2次元人格推定ネットワークを統合するエンドツーエンドソリューションを提案する。
提案手法は, 異なる超解像度で生成した中間特徴写像を利用して, フル解像度画像(640×480)でトレーニング, テストしたアプローチと同等の低解像度画像(64x48)のボディポーズ結果を得る。
関連論文リスト
- Visual Place Recognition with Low-Resolution Images [17.847661026367767]
画像解像度が手作りビジュアルプレイス認識パイプラインの精度と堅牢性に与える影響を解析する。
本稿では、ハードウェア・ソフトウェア産業の研究者や企業がVPRソリューションを共同設計し、商用製品におけるVPRアルゴリズムの利用を拡大することを目的とする。
論文 参考訳(メタデータ) (2023-05-09T21:34:38Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Generating Superpixels for High-resolution Images with Decoupled Patch
Calibration [82.21559299694555]
Patch Networks (PCNet) は高解像度のスーパーピクセルセグメンテーションを効率的かつ正確に実装するように設計されている。
DPCは高解像度画像から局所パッチを取得し、動的にバイナリマスクを生成し、ネットワークを領域境界に集中させる。
特に、DPCは高解像度画像からローカルパッチを取り、動的にバイナリマスクを生成して、ネットワークを領域境界に集中させる。
論文 参考訳(メタデータ) (2021-08-19T10:33:05Z) - High-Resolution Depth Maps Based on TOF-Stereo Fusion [27.10059147107254]
そこで本研究では,効率的な種子育成アルゴリズムに基づくTOF-ステレオ融合法を提案する。
提案アルゴリズムは2次元画像に基づくステレオアルゴリズムよりも優れていることを示す。
このアルゴリズムは、単一のCPU上でリアルタイムのパフォーマンスを示す可能性がある。
論文 参考訳(メタデータ) (2021-07-30T15:11:42Z) - Lighter Stacked Hourglass Human Pose Estimation [0.0]
我々はNewellらによって提案された人間のポーズ推定の深層学習に基づくアプローチの1つに焦点をあてる。
彼らのアプローチは多くの応用で広く使われており、この分野で最も優れた作品の1つと考えられている。
本研究では,アーキテクチャ変更がネットワークの計算速度と精度に与える影響について検討する。
論文 参考訳(メタデータ) (2021-07-28T21:05:34Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - Multi-Scale Progressive Fusion Learning for Depth Map Super-Resolution [11.072332820377612]
深度カメラが収集する深度マップの解像度は、RGBカメラの解像度よりも低いことが多い。
深度マップの超解法における大きな問題は、明らかにギザギザと細部が過剰に失われることである。
本稿では,各領域に階層的特徴を統合する構造を持つ深度マップSRのためのマルチスケールプログレッシブ・フュージョン・ネットワークを提案する。
論文 参考訳(メタデータ) (2020-11-24T03:03:07Z) - 3D Human Shape and Pose from a Single Low-Resolution Image with
Self-Supervised Learning [105.49950571267715]
3次元人物形状とポーズ推定のための既存のディープラーニング手法は、比較的高解像度な入力画像に依存している。
本稿では,レゾリューション・アウェア・ネットワーク,セルフ・スーパービジョン・ロス,コントラッシブ・ラーニング・スキームからなるRCC-Netを提案する。
これら2つの新たなトレーニング損失は,3次元形状を学習し,弱教師ありの姿勢を示す。
論文 参考訳(メタデータ) (2020-07-27T16:19:52Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。