論文の概要: SPAC-Net: Synthetic Pose-aware Animal ControlNet for Enhanced Pose
Estimation
- arxiv url: http://arxiv.org/abs/2305.17845v2
- Date: Wed, 31 May 2023 11:09:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 11:58:29.825846
- Title: SPAC-Net: Synthetic Pose-aware Animal ControlNet for Enhanced Pose
Estimation
- Title(参考訳): spac-net:ポーズ推定の強化を目的とした合成ポーズ認識動物制御ネット
- Authors: Le Jiang and Sarah Ostadabbas
- Abstract要約: 我々は、SPAC-Net(Synthetic Pose-aware Animal ControlNet)と呼ばれる新しいアプローチを提案する。
本研究では,変分オートエンコーダ(VAE)ベースのデータ生成パイプラインが生成した可塑性ポーズデータを利用して,実データに近いポーズラベルを持つ合成データを生成する。
さらに、動物と背景のHED境界を別々に検出し、生成したデータの精度と安定性を向上させるBi-ControlNet構造を提案する。
- 参考スコア(独自算出の注目度): 19.035988285379116
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Animal pose estimation has become a crucial area of research, but the
scarcity of annotated data is a significant challenge in developing accurate
models. Synthetic data has emerged as a promising alternative, but it
frequently exhibits domain discrepancies with real data. Style transfer
algorithms have been proposed to address this issue, but they suffer from
insufficient spatial correspondence, leading to the loss of label information.
In this work, we present a new approach called Synthetic Pose-aware Animal
ControlNet (SPAC-Net), which incorporates ControlNet into the previously
proposed Prior-Aware Synthetic animal data generation (PASyn) pipeline. We
leverage the plausible pose data generated by the Variational Auto-Encoder
(VAE)-based data generation pipeline as input for the ControlNet
Holistically-nested Edge Detection (HED) boundary task model to generate
synthetic data with pose labels that are closer to real data, making it
possible to train a high-precision pose estimation network without the need for
real data. In addition, we propose the Bi-ControlNet structure to separately
detect the HED boundary of animals and backgrounds, improving the precision and
stability of the generated data. Using the SPAC-Net pipeline, we generate
synthetic zebra and rhino images and test them on the AP10K real dataset,
demonstrating superior performance compared to using only real images or
synthetic data generated by other methods. Our work demonstrates the potential
for synthetic data to overcome the challenge of limited annotated data in
animal pose estimation.
- Abstract(参考訳): 動物のポーズ推定は研究の重要領域となっているが、注釈付きデータの不足は正確なモデルを開発する上で大きな課題である。
合成データは有望な代替手段として登場したが、しばしば実際のデータとドメインの相違を示す。
この問題を解決するためにスタイル転送アルゴリズムが提案されているが、空間的対応が不十分でラベル情報が失われる。
本研究では,従来提案されていた合成動物データ生成(pasyn)パイプラインに制御ネットを組み込む合成ポーズ認識動物制御ネット(spac-net)という新しい手法を提案する。
可変オートエンコーダ(vae)ベースのデータ生成パイプラインが生成する可算なポーズデータから、コントロールネットのホリスティックネストエッジ検出(hed)境界タスクモデルへの入力として活用し、実データに近いポーズラベルを用いた合成データを生成し、実データを必要としない高精度ポーズ推定ネットワークのトレーニングを可能にする。
さらに、動物と背景のHED境界を別々に検出し、生成したデータの精度と安定性を向上させるBi-ControlNet構造を提案する。
SPAC-Netパイプラインを用いて合成ゼブラ画像とサイ画像を生成し、AP10K実データセット上でテストし、他の方法で生成された実画像や合成データよりも優れた性能を示す。
本研究は,動物のポーズ推定における限定的な注釈データの課題を克服するための合成データの可能性を示す。
関連論文リスト
- DODA: Diffusion for Object-detection Domain Adaptation in Agriculture [4.549305421261851]
本稿では,農業の新しい領域を対象とした高品質なオブジェクト検出データを生成するデータシンセサイザーであるDODAを提案する。
具体的には、画像としてレイアウトを符号化することでレイアウト・ツー・イメージの制御性を向上し、ラベルの品質を向上させる。
論文 参考訳(メタデータ) (2024-03-27T08:16:33Z) - ParGANDA: Making Synthetic Pedestrians A Reality For Object Detection [2.7648976108201815]
本稿では,GAN(Generative Adversarial Network)を用いて,実データと合成データのギャップを埋めることを提案する。
我々のアプローチは、視覚的に可視なサンプルを生成するだけでなく、実際のドメインのラベルも必要としない。
論文 参考訳(メタデータ) (2023-07-21T05:26:32Z) - CasTGAN: Cascaded Generative Adversarial Network for Realistic Tabular
Data Synthesis [0.4999814847776097]
近年,GAN(Generative Adversarial Network)が注目されている。
合成データの妥当性と基礎となるプライバシーに関する懸念は、十分に対処されていない主要な課題を表している。
論文 参考訳(メタデータ) (2023-07-01T16:52:18Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。