論文の概要: Subject-independent Human Pose Image Construction with Commodity Wi-Fi
- arxiv url: http://arxiv.org/abs/2012.11812v1
- Date: Tue, 22 Dec 2020 03:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:47:17.275770
- Title: Subject-independent Human Pose Image Construction with Commodity Wi-Fi
- Title(参考訳): 商品Wi-Fiを用いた被写体非依存型人物画像構築
- Authors: Shuang Zhou, Lingchao Guo, Zhaoming Lu, Xiangming Wen, Wei Zheng,
Yiming Wang
- Abstract要約: 本稿では,人間のポーズイメージ構築における主観一般化問題の解決に焦点を当てる。
ドメイン非依存ニューラルネットワーク(DINN)を設計し、被写体非依存の特徴を抽出し、それらをきめ細かい人間のポーズ画像に変換する。
プロトタイプシステムを構築し,実験結果から,コモディティWi-Fiを用いた新しい被験者の人物ポーズ画像のきめ細かい構築が可能であることを実証した。
- 参考スコア(独自算出の注目度): 24.099783319415913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, commodity Wi-Fi devices have been shown to be able to construct
human pose images, i.e., human skeletons, as fine-grained as cameras. Existing
papers achieve good results when constructing the images of subjects who are in
the prior training samples. However, the performance drops when it comes to new
subjects, i.e., the subjects who are not in the training samples. This paper
focuses on solving the subject-generalization problem in human pose image
construction. To this end, we define the subject as the domain. Then we design
a Domain-Independent Neural Network (DINN) to extract subject-independent
features and convert them into fine-grained human pose images. We also propose
a novel training method to train the DINN and it has no re-training overhead
comparing with the domain-adversarial approach. We build a prototype system and
experimental results demonstrate that our system can construct fine-grained
human pose images of new subjects with commodity Wi-Fi in both the visible and
through-wall scenarios, which shows the effectiveness and the
subject-generalization ability of our model.
- Abstract(参考訳): 近年、コモディティWi-Fiデバイスは人間のポーズ画像、すなわち人間の骨格をカメラのようにきめ細かいものにすることができることが示されている。
既存の論文は、事前のトレーニングサンプルの被験者の画像を作成する際に良い結果が得られる。
しかし、新しい被験者、すなわちトレーニングサンプルにいない被験者については、パフォーマンスが低下する。
本稿では,人間のポーズ画像構築における主題一般化問題の解決に焦点をあてる。
この目的のために、我々は主題をドメインとして定義する。
次に,被写体非依存の特徴を抽出し,人間のポーズ画像に変換するために,ドメイン非依存ニューラルネットワーク(dinn)を設計する。
また,dinnをトレーニングするための新しいトレーニング手法を提案するとともに,ドメイン敵アプローチと比較して,オーバヘッドの再トレーニングを行わない。
プロトタイプシステムを構築し, 実験結果から, 可視・壁面の両方のシナリオにおいて, 商品Wi-Fiを有する被験者の詳細な人物ポーズ画像が構築可能であることを示し, モデルの有効性と対象一般化能力を示す。
関連論文リスト
- Evaluating Multiview Object Consistency in Humans and Image Models [68.36073530804296]
我々は、物体の形状に関するゼロショット視覚的推論を必要とする認知科学の実験的設計を活用する。
我々は500人以上の参加者から行動データの35万件の試行を収集した。
次に、一般的な視覚モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-09-09T17:59:13Z) - Comparison of self-supervised in-domain and supervised out-domain transfer learning for bird species recognition [0.19183348587701113]
別のタスクを支援するために事前訓練されたモデルの重みを移すことは、現代のディープラーニングの重要な部分となっている。
本実験は,鳥種認識のためのドメイン内モデルとデータセットの有用性を実証するものである。
論文 参考訳(メタデータ) (2024-04-26T08:47:28Z) - Multi Positive Contrastive Learning with Pose-Consistent Generated Images [0.873811641236639]
我々は、同一の人間のポーズで視覚的に異なる画像を生成することを提案する。
そこで我々は,これまで生成した画像を最適に活用する,新しいマルチ陽性コントラスト学習を提案する。
GenPoCCLは、現在の最先端技術に比べて1%未満のデータしか利用していないが、人間の身体の構造的特徴をより効果的に捉えている。
論文 参考訳(メタデータ) (2024-04-04T07:26:26Z) - UniHuman: A Unified Model for Editing Human Images in the Wild [49.896715833075106]
実環境における画像編集の複数の側面に対処する統一モデルUniHumanを提案する。
モデルの生成品質と一般化能力を向上させるために,人間の視覚エンコーダからのガイダンスを利用する。
ユーザスタディでは、UniHumanは平均して77%のケースでユーザに好まれる。
論文 参考訳(メタデータ) (2023-12-22T05:00:30Z) - Cross-view and Cross-pose Completion for 3D Human Understanding [22.787947086152315]
画像のみを用いて人間中心のデータを扱う自己教師付き学習に基づく事前学習手法を提案する。
身体中心タスクのためのモデルと手中心タスクのためのモデルを事前訓練する。
汎用的なトランスフォーマーアーキテクチャでは、これらのモデルは、広範囲の人間中心の下流タスクにおいて、既存の自己教師付き事前学習方法より優れている。
論文 参考訳(メタデータ) (2023-11-15T16:51:18Z) - Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文 参考訳(メタデータ) (2023-06-15T17:59:51Z) - Neural Novel Actor: Learning a Generalized Animatable Neural
Representation for Human Actors [98.24047528960406]
本稿では,複数の人物の多視点画像のスパース集合から,汎用的アニマタブルなニューラル表現を学習するための新しい手法を提案する。
学習された表現は、カメラのスパースセットから任意の人の新しいビューイメージを合成し、さらにユーザのポーズ制御でアニメーション化することができる。
論文 参考訳(メタデータ) (2022-08-25T07:36:46Z) - Neural Rendering of Humans in Novel View and Pose from Monocular Video [68.37767099240236]
本稿では,新しい視点下で写真リアルな人間を生成し,モノクロ映像を入力として提示する新しい手法を提案する。
提案手法は,モノクラー映像を入力として,見知らぬポーズや新しい視点下での既存手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-04T03:09:20Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Structure-aware Person Image Generation with Pose Decomposition and
Semantic Correlation [29.727033198797518]
高品質な人物画像生成のための構造認識フローベース手法を提案する。
人体を異なる意味部分に分解し、異なるネットワークを適用してこれらの部分のフロー場を別々に予測する。
提案手法は,ポーズの相違が大きい場合に高品質な結果を生成することができ,定性比較と定量的比較の両方において最先端の手法より優れる。
論文 参考訳(メタデータ) (2021-02-05T03:07:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。