論文の概要: A Unified Framework for Domain Adaptive Pose Estimation
- arxiv url: http://arxiv.org/abs/2204.00172v1
- Date: Fri, 1 Apr 2022 02:47:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-04 13:53:24.119437
- Title: A Unified Framework for Domain Adaptive Pose Estimation
- Title(参考訳): ドメイン適応型Pose推定のための統一フレームワーク
- Authors: Donghyun Kim, Kaihong Wang, Kate Saenko, Margrit Betke, Stan Sclaroff
- Abstract要約: 本稿では,ドメイン適応型ポーズ推定問題によく対応できる統一フレームワークを提案する。
提案手法は,ヒトのポーズ推定における既存のベースラインを最大4.5ポイント(pp),手ポーズ推定を最大7.4pp,動物ポーズ推定を最大4.8pp,羊3.3ppで上回る。
- 参考スコア(独自算出の注目度): 70.54942818742
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While pose estimation is an important computer vision task, it requires
expensive annotation and suffers from domain shift. In this paper, we
investigate the problem of domain adaptive 2D pose estimation that transfers
knowledge learned on a synthetic source domain to a target domain without
supervision. While several domain adaptive pose estimation models have been
proposed recently, they are not generic but only focus on either human pose or
animal pose estimation, and thus their effectiveness is somewhat limited to
specific scenarios. In this work, we propose a unified framework that
generalizes well on various domain adaptive pose estimation problems. We
propose to align representations using both input-level and output-level cues
(pixels and pose labels, respectively), which facilitates the knowledge
transfer from the source domain to the unlabeled target domain. Our experiments
show that our method achieves state-of-the-art performance under various domain
shifts. Our method outperforms existing baselines on human pose estimation by
up to 4.5 percent points (pp), hand pose estimation by up to 7.4 pp, and animal
pose estimation by up to 4.8 pp for dogs and 3.3 pp for sheep. These results
suggest that our method is able to mitigate domain shift on diverse tasks and
even unseen domains and objects (e.g., trained on horse and tested on dog).
- Abstract(参考訳): ポーズ推定は重要なコンピュータビジョンタスクであるが、高価なアノテーションが必要であり、ドメインシフトに苦しむ。
本稿では,合成音源領域から学習した知識を,教師なしの目的領域に転送するドメイン適応型2Dポーズ推定の問題について検討する。
最近、いくつかのドメイン適応ポーズ推定モデルが提案されているが、それは一般的なものではなく、人間のポーズまたは動物のポーズ推定にのみ焦点を当てている。
本稿では,様々な領域適応ポーズ推定問題に対してよく一般化した統一フレームワークを提案する。
本稿では,入力レベルと出力レベルの手がかり(ピクセルとポーズラベル)の両方を用いて表現を調整し,ソースドメインからラベルなしのターゲットドメインへの知識伝達を容易にすることを提案する。
実験の結果,本手法は様々なドメインシフト下での最先端性能を実現する。
提案手法は,最大4.5ポイント (pp), 手のポーズ推定を7.4pp, 動物のポーズ推定を最大4.8pp, ヒツジを3.3ppと, 既存のヒトのポーズ推定基準を上回った。
これらの結果から,本手法は様々なタスクや未認識のドメインやオブジェクト(例えば馬で訓練され,犬でテストされたり)に対するドメインシフトを軽減できることが示唆された。
関連論文リスト
- Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Domain adaptive pose estimation via multi-level alignment [7.107028574274364]
ドメイン適応ポーズ推定は、ソースドメイン(合成された)データセットでトレーニングされたディープモデルが、ターゲットドメイン(現実世界)データセットで同様の結果を生成することを目的としている。
画像,特徴,ポーズのレベルで異なる領域をアライメントするマルチレベルドメイン適応アプラッハを提案する。
実験により,ポーズ推定における多レベルアライメント法により,顕著な改善が達成できることが示された。
論文 参考訳(メタデータ) (2024-04-23T10:13:31Z) - DomainInv: Domain Invariant Fine Tuning and Adversarial Label Correction
For QA Domain Adaptation [27.661609140918916]
既存の質問回答システム(QA)は、目に見えない領域やドメイン外分布からの質問に答える能力によって制限される。
最も重要なことは、既存のQAドメイン適応手法は、合成データを生成するか、ターゲットのドメインデータに擬似ラベルを付けたものである。
本稿では,未ラベル対象領域に対する教師なし領域適応を,ソースドメインの監督を引き続き用いながら,ソースドメイン近傍のターゲット表現を転送することで提案する。
論文 参考訳(メタデータ) (2023-05-04T18:13:17Z) - Anatomy-guided domain adaptation for 3D in-bed human pose estimation [62.3463429269385]
3次元人間のポーズ推定は臨床モニタリングシステムにおいて重要な要素である。
ラベル付きソースからシフトしたラベル付きターゲットドメインにモデルを適応させる新しいドメイン適応方式を提案する。
我々の手法は、様々な最先端のドメイン適応法より一貫して優れています。
論文 参考訳(メタデータ) (2022-11-22T11:34:51Z) - Improving Transferability of Domain Adaptation Networks Through Domain
Alignment Layers [1.3766148734487902]
マルチソースアン教師付きドメイン適応(MSDA)は、ソースモデルの袋から弱い知識を割り当てることで、ラベルのないドメインの予測子を学習することを目的としている。
我々は,DomaIn Alignment Layers (MS-DIAL) のマルチソースバージョンを予測器の異なるレベルに埋め込むことを提案する。
我々の手法は最先端のMSDA法を改善することができ、分類精度の相対利得は+30.64%に達する。
論文 参考訳(メタデータ) (2021-09-06T18:41:19Z) - Self-Adversarial Disentangling for Specific Domain Adaptation [52.1935168534351]
ドメイン適応は、ソースとターゲットドメイン間のドメインシフトをブリッジすることを目的としています。
最近の手法では、特定の次元について明示的な事前知識を考慮しないのが一般的である。
論文 参考訳(メタデータ) (2021-08-08T02:36:45Z) - Prototypical Cross-domain Self-supervised Learning for Few-shot
Unsupervised Domain Adaptation [91.58443042554903]
FUDA(Unsupervised Domain Adaptation)のためのPCS(Prototypical Cross-Domain Self-Supervised Learning)フレームワークを提案する。
PCSは、クロスドメインのローレベルな機能アライメントを行うだけでなく、ドメイン間の共有埋め込み空間におけるセマンティック構造をエンコードおよびアライメントする。
最新の手法と比較して、pcsは、fuda上の異なるドメインペアの平均分類精度を10.5%、office、office-home、visda-2017、domainnetで3.5%、9.0%、13.2%改善している。
論文 参考訳(メタデータ) (2021-03-31T02:07:42Z) - Differential Treatment for Stuff and Things: A Simple Unsupervised
Domain Adaptation Method for Semantic Segmentation [105.96860932833759]
最先端のアプローチは、セマンティックレベルのアライメントの実行がドメインシフトの問題に取り組むのに役立つことを証明している。
我々は,物事領域や物事に対する異なる戦略による意味レベルのアライメントを改善することを提案する。
提案手法に加えて,提案手法は,ソースとターゲットドメイン間の最も類似した機能やインスタンス機能を最小化することにより,この問題の緩和に有効であることを示す。
論文 参考訳(メタデータ) (2020-03-18T04:43:25Z) - Unsupervised Domain Adaptive Object Detection using Forward-Backward
Cyclic Adaptation [13.163271874039191]
本稿では,フォワード・バック・サイクリック(FBC)トレーニングによる物体検出のための教師なし領域適応手法を提案する。
近年, 対角訓練に基づく領域適応法は, 限界特徴分布アライメントによる領域差最小化に有効であることが示された。
本稿では,後方ホッピングによるソースからターゲットへの適応と,前方通過によるターゲットからソースへの適応を反復的に計算するフォワード・バック・サイクル適応を提案する。
論文 参考訳(メタデータ) (2020-02-03T06:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。