論文の概要: Transfer Learning for Pose Estimation of Illustrated Characters
- arxiv url: http://arxiv.org/abs/2108.01819v1
- Date: Wed, 4 Aug 2021 02:37:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-05 23:02:14.076117
- Title: Transfer Learning for Pose Estimation of Illustrated Characters
- Title(参考訳): 絵柄のポーズ推定のための伝達学習
- Authors: Shuhong Chen, Matthias Zwicker
- Abstract要約: 図示された文字領域のポーズ推定器は、補助的なコンテンツ作成タスクに貴重な事前情報を提供する。
ドメイン固有のソースモデルとタスク固有のソースモデルの両方から効率的に転送学習することで、ドメインギャップを橋渡しします。
ポーズ誘導図形検索の新たな課題を解決するために,得られた最先端キャラクタのポーズ推定手法を適用した。
- 参考スコア(独自算出の注目度): 37.04208600867858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human pose information is a critical component in many downstream image
processing tasks, such as activity recognition and motion tracking. Likewise, a
pose estimator for the illustrated character domain would provide a valuable
prior for assistive content creation tasks, such as reference pose retrieval
and automatic character animation. But while modern data-driven techniques have
substantially improved pose estimation performance on natural images, little
work has been done for illustrations. In our work, we bridge this domain gap by
efficiently transfer-learning from both domain-specific and task-specific
source models. Additionally, we upgrade and expand an existing illustrated pose
estimation dataset, and introduce two new datasets for classification and
segmentation subtasks. We then apply the resultant state-of-the-art character
pose estimator to solve the novel task of pose-guided illustration retrieval.
All data, models, and code will be made publicly available.
- Abstract(参考訳): 人間のポーズ情報は、アクティビティ認識やモーショントラッキングなど、下流の多くの画像処理タスクにおいて重要な要素である。
同様に、イラストレイテッドキャラクタドメインのポーズ推定器は、参照ポーズ検索や自動キャラクタアニメーションといった、補助的なコンテンツ作成タスクのための貴重な事前情報を提供する。
しかし、現代のデータ駆動技術は、自然画像のポーズ推定性能を大幅に向上させたが、イラストレーションの作業はほとんど行われていない。
我々の研究では、ドメイン固有およびタスク固有のソースモデルから効率的に移行学習することで、このドメインギャップを橋渡しします。
さらに,既存のポーズ推定データセットのアップグレードと拡張を行い,分類とセグメンテーションサブタスクのための2つの新しいデータセットを導入する。
次に, 提案手法を応用し, ポーズガイド付挿絵検索の新たな課題を解決する。
すべてのデータ、モデル、コードは公開される予定だ。
関連論文リスト
- Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models [0.65268245109828]
アクティブラーニングCDALにおける文脈多様性の概念を導入する。
モデルバイアスを低減するために、文脈的に公正なデータをキュレートするデータ修復アルゴリズムを提案する。
我々は、野生生物カメラトラップ画像の画像検索システムと、質の悪い農村道路に対する信頼性の高い警告システムの開発に取り組んでいる。
論文 参考訳(メタデータ) (2024-11-04T09:43:33Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z) - Combining Semantic Guidance and Deep Reinforcement Learning For
Generating Human Level Paintings [22.889059874754242]
脳卒中に基づく非フォトリアリスティック画像の生成は、コンピュータビジョンコミュニティにおいて重要な問題である。
従来の手法は、前景オブジェクトの位置、規模、正当性にほとんど変化のないデータセットに限られていた。
本研究では,1)前景と背景の筆画の区別を学習するための2段階の塗装手順を備えたセマンティック・ガイダンス・パイプラインを提案する。
論文 参考訳(メタデータ) (2020-11-25T09:00:04Z) - Adversarially-Trained Deep Nets Transfer Better: Illustration on Image
Classification [53.735029033681435]
トランスファーラーニングは、訓練済みのディープニューラルネットワークを画像認識タスクに新しいドメインに適用するための強力な方法論である。
本研究では,非逆学習モデルよりも逆学習モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2020-07-11T22:48:42Z) - Adversarial Transfer of Pose Estimation Regression [11.117357750374035]
本研究では,シーン不変の画像表現を学習するための深層適応ネットワークを開発し,モデル転送のための表現を生成する。
我々は、Cambridge Landmarksと7Sceneの2つの公開データセット上でネットワークを評価し、いくつかのベースラインよりもその優位性を実証し、アート手法の状況と比較した。
論文 参考訳(メタデータ) (2020-06-20T21:16:37Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z) - Multi-task pre-training of deep neural networks for digital pathology [8.74883469030132]
私たちはまず、多くのデジタル病理データセットを22の分類タスクと約900kの画像のプールに組み立て、変換しました。
特徴抽出器として使用されるモデルは、ImageNet事前訓練されたモデルよりも大幅に改善されるか、同等のパフォーマンスを提供するかを示す。
論文 参考訳(メタデータ) (2020-05-05T08:50:17Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。