論文の概要: Unsupervised Domain Adaptation Learning for Hierarchical Infant Pose
Recognition with Synthetic Data
- arxiv url: http://arxiv.org/abs/2205.01892v1
- Date: Wed, 4 May 2022 04:59:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 14:24:54.753597
- Title: Unsupervised Domain Adaptation Learning for Hierarchical Infant Pose
Recognition with Synthetic Data
- Title(参考訳): 合成データを用いた階層型幼児ポーズ認識のための教師なしドメイン適応学習
- Authors: Cheng-Yen Yang, Zhongyu Jiang, Shih-Yu Gu, Jenq-Neng Hwang, Jang-Hee
Yoo
- Abstract要約: 幼児の画像を入力とし、粗いポーズラベルと細かなポーズラベルを予測するCNNベースのモデルを提案する。
実験の結果,提案手法は,合成および実世界のデータセットの分布を著しく整合させることができることがわかった。
- 参考スコア(独自算出の注目度): 28.729049747477085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Alberta Infant Motor Scale (AIMS) is a well-known assessment scheme that
evaluates the gross motor development of infants by recording the number of
specific poses achieved. With the aid of the image-based pose recognition
model, the AIMS evaluation procedure can be shortened and automated, providing
early diagnosis or indicator of potential developmental disorder. Due to
limited public infant-related datasets, many works use the SMIL-based method to
generate synthetic infant images for training. However, this domain mismatch
between real and synthetic training samples often leads to performance
degradation during inference. In this paper, we present a CNN-based model which
takes any infant image as input and predicts the coarse and fine-level pose
labels. The model consists of an image branch and a pose branch, which
respectively generates the coarse-level logits facilitated by the unsupervised
domain adaptation and the 3D keypoints using the HRNet with SMPLify
optimization. Then the outputs of these branches will be sent into the
hierarchical pose recognition module to estimate the fine-level pose labels. We
also collect and label a new AIMS dataset, which contains 750 real and 4000
synthetic infants images with AIMS pose labels. Our experimental results show
that the proposed method can significantly align the distribution of synthetic
and real-world datasets, thus achieving accurate performance on fine-grained
infant pose recognition.
- Abstract(参考訳): アルバータ・インファント・モーター・スケール(Alberta Infant Motor Scale, AIMS)は、乳児の運動発達を、特定のポーズの数を記録することで評価する、よく知られた評価手法である。
画像に基づくポーズ認識モデルの支援により、目的評価手順を短縮し、自動化し、早期診断や潜在的な発達障害の指標を提供する。
パブリックな幼児関連データセットが限られているため、多くの研究はSMILベースの方法で幼児の合成画像を生成する。
しかし、実際のトレーニングサンプルと合成トレーニングサンプルのこのドメインミスマッチは、しばしば推論時に性能劣化を引き起こす。
本稿では,乳幼児のイメージを入力とし,粗いポーズラベルと細粒度のポーズラベルを予測できるcnnモデルを提案する。
このモデルは画像分岐とポーズ分岐から成り、教師なし領域適応によって促進される粗いレベルのロジットと、SMPLify最適化を備えたHRNetを用いた3Dキーポイントを生成する。
その後、これらのブランチの出力は階層的なポーズ認識モジュールに送られ、詳細なポーズラベルを推定する。
750のリアルと4000の合成幼児画像とAIMSポーズラベルを含む新しいAIMSデータセットの収集とラベル付けも行います。
実験の結果,提案手法は合成データと実世界のデータセットの分布を著しく調整でき,細粒度乳幼児のポーズ認識における精度が向上した。
関連論文リスト
- Improving Interpretability and Robustness for the Detection of AI-Generated Images [6.116075037154215]
凍結したCLIP埋め込みに基づいて、既存の最先端AIGI検出手法を解析する。
さまざまなAIジェネレータが生成する画像が実際の画像とどのように異なるかを示す。
論文 参考訳(メタデータ) (2024-06-21T10:33:09Z) - Scaling Laws of Synthetic Images for Model Training ... for Now [54.43596959598466]
本研究では, 合成画像のスケーリング法則について, テクスト・ツー・イメージ・モデルの現状から検討した。
合成画像は、CLIPトレーニングの実際の画像と似ているが、やや効果の低いスケーリング傾向を示す。
論文 参考訳(メタデータ) (2023-12-07T18:59:59Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Semi-supervised Body Parsing and Pose Estimation for Enhancing Infant
General Movement Assessment [11.33138866472943]
乳児運動ビデオ(IMV)の一般運動評価(GMA)は、乳幼児の脳性麻痺(CP)の早期発見に有効な方法である。
本稿では、画像シーケンス認識のためのエンドツーエンドのトレーニング可能なニューラルネットワークが、GMAの優れた結果を得るために適用可能であることを実証する。
本研究では,SiamParseNet(SPN)と呼ばれる半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2022-10-14T18:46:30Z) - High-resolution semantically-consistent image-to-image translation [0.0]
本稿では,スタイル変換フェーズにおける画像のセマンティック一貫性と画素単位の品質を保った教師なし領域適応モデルを提案する。
提案モデルでは,SemI2Iモデルと比較してかなりの性能向上を示し,最先端のCyCADAモデルと同様の結果を得た。
論文 参考訳(メタデータ) (2022-09-13T19:08:30Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Generative Self-training for Cross-domain Unsupervised Tagged-to-Cine
MRI Synthesis [10.636015177721635]
クロスドメイン画像合成のための連続値予測と回帰目標を用いた新たな自己学習フレームワークを提案する。
具体的には,疑似ラベルを不確実性マスクでフィルタリングし,実際のベイズ学習を用いて生成した画像の予測信頼度を定量化する。
論文 参考訳(メタデータ) (2021-06-23T16:19:00Z) - You Only Need Adversarial Supervision for Semantic Image Synthesis [84.83711654797342]
我々は,高品質な結果を得るためには敵対的監督のみを必要とする,新しい簡易ganモデルを提案する。
本モデルによって合成された画像はより多様であり,実画像の色やテクスチャに密接に従っている。
論文 参考訳(メタデータ) (2020-12-08T23:00:48Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z) - Invariant Representation Learning for Infant Pose Estimation with Small
Data [14.91506452479778]
合成乳児ポーズと合成乳幼児ポーズとを併用したハイブリッド合成乳幼児ポーズデータセットを作成した。
我々は,SyRIPデータセットでトレーニングしたモデルと同一ネットワーク構造を用いたアブレーション調査を行い,他の公立幼児ポーズデータセットでトレーニングしたモデルよりも顕著に改善したことを示した。
最新のDarkPoseモデルを用いた幼児のポーズ推定では、平均的精度(mAP)は93.6である。
論文 参考訳(メタデータ) (2020-10-13T01:10:14Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。