論文の概要: Using Motion Cues to Supervise Single-Frame Body Pose and Shape
Estimation in Low Data Regimes
- arxiv url: http://arxiv.org/abs/2402.02736v1
- Date: Mon, 5 Feb 2024 05:37:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 17:49:25.126450
- Title: Using Motion Cues to Supervise Single-Frame Body Pose and Shape
Estimation in Low Data Regimes
- Title(参考訳): モーションキューを用いた低データレジームにおけるシングルフレームボディポースと形状推定
- Authors: Andrey Davydov, Alexey Sidnev, Artsiom Sanakoyeu, Yuhua Chen, Mathieu
Salzmann, Pascal Fua
- Abstract要約: 十分な注釈付きトレーニングデータが得られた場合、教師付きディープラーニングアルゴリズムは、単一のカメラを使用して人間の身体のポーズと形状を推定する。
このような場合、必要な監視信号を提供するために、アノテーションのないビデオを簡単に作成できることが示される。
- 参考スコア(独自算出の注目度): 93.69730589828532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When enough annotated training data is available, supervised deep-learning
algorithms excel at estimating human body pose and shape using a single camera.
The effects of too little such data being available can be mitigated by using
other information sources, such as databases of body shapes, to learn priors.
Unfortunately, such sources are not always available either. We show that, in
such cases, easy-to-obtain unannotated videos can be used instead to provide
the required supervisory signals. Given a trained model using too little
annotated data, we compute poses in consecutive frames along with the optical
flow between them. We then enforce consistency between the image optical flow
and the one that can be inferred from the change in pose from one frame to the
next. This provides enough additional supervision to effectively refine the
network weights and to perform on par with methods trained using far more
annotated data.
- Abstract(参考訳): 十分な注釈付きトレーニングデータが得られた場合、教師付きディープラーニングアルゴリズムは、単一のカメラを使用して人間の身体のポーズと形状を推定する。
このようなデータがあまりにも少なすぎる影響は、ボディ形状のデータベースのような他の情報ソースを使用して事前学習することで軽減することができる。
残念ながら、そのような情報源は必ずしも利用可能ではない。
このような場合、必要な監視信号を提供するために、アノテーションのないビデオを簡単に作成できることが示される。
注釈付きデータが少なすぎると、連続したフレームでポーズを計算し、それらの間の光の流れを計算します。
次に、画像光の流れと、あるフレームから次のフレームへのポーズの変化から推測できるものとの間の一貫性を強制する。
これにより、ネットワークの重みを効果的に洗練し、より注釈付きデータを使って訓練された方法と同等に実行するのに十分な監督が与えられる。
関連論文リスト
- Enhancing pretraining efficiency for medical image segmentation via transferability metrics [0.0]
医用画像のセグメンテーションタスクでは、ラベル付きトレーニングデータの不足が大きな課題となっている。
本稿では,事前学習したモデルが対象データをいかに頑健に表現できるかを計測する,対照的な学習に基づく新しい伝達可能性指標を提案する。
論文 参考訳(メタデータ) (2024-10-24T12:11:52Z) - EfficientTrain++: Generalized Curriculum Learning for Efficient Visual Backbone Training [79.96741042766524]
訓練カリキュラムをソフトセレクション機能として再構築する。
自然画像の内容の露光は,データ拡張の強度によって容易に達成できることを示す。
結果のメソッドであるEfficientTrain++は単純で汎用的だが驚くほど効果的である。
論文 参考訳(メタデータ) (2024-05-14T17:00:43Z) - Premonition: Using Generative Models to Preempt Future Data Changes in
Continual Learning [63.850451635362425]
継続的な学習には、データ分散の継続的な変化に対応するためのモデルが必要である。
本稿では,大規模言語モデルと画像生成モデルの組み合わせが有用であることを示す。
トレーニング済みネットワークのバックボーンは、下流の連続学習問題に有用な表現を学習できることがわかった。
論文 参考訳(メタデータ) (2024-03-12T06:29:54Z) - Learning from One Continuous Video Stream [70.30084026960819]
1つの連続ビデオストリームからオンライン学習のためのフレームワークを導入する。
連続するビデオフレーム間の高い相関を考えると、これは大きな課題となる。
プリトレーニングとシングルストリーム評価を切り替える実用的で柔軟な方法として,ピクセル・ツー・ピクセル・モデリングを採用している。
論文 参考訳(メタデータ) (2023-12-01T14:03:30Z) - Less is More: On the Feature Redundancy of Pretrained Models When
Transferring to Few-shot Tasks [120.23328563831704]
事前訓練されたモデルを下流タスクに転送することは、ターゲットデータと線形探索を行うのと同じくらい簡単である。
線形探索では, 下流データが少ない場合に, 事前学習した特徴が極めて冗長であることを示す。
論文 参考訳(メタデータ) (2023-10-05T19:00:49Z) - Contrastive Learning for Self-Supervised Pre-Training of Point Cloud
Segmentation Networks With Image Data [7.145862669763328]
ラベルのないデータに対する自己教師付き事前トレーニングは、手動アノテーションの量を減らす方法のひとつだ。
画像と点の雲のモダリティを、まず自己教師付き画像の特徴を学習し、これらの特徴を使って3Dモデルを訓練する。
我々の事前学習法はシーンの1つのスキャンしか必要とせず、ローカライゼーション情報が利用できないケースにも適用できる。
論文 参考訳(メタデータ) (2023-01-18T03:14:14Z) - Self-Supervised Pretraining for 2D Medical Image Segmentation [0.0]
自己教師付き学習は、不正なデータに対して特定のドメインのモデルを事前訓練することで、手動でアノテートされたデータの必要性を下げる手段を提供する。
自然画像と対象領域固有の画像による自己教師付き事前学習は、最も速く、最も安定した下流収束をもたらす。
低データシナリオでは、教師付きImageNet事前トレーニングが最も正確であり、最小限のエラーに近づくためには100以上の注釈付きサンプルが必要である。
論文 参考訳(メタデータ) (2022-09-01T09:25:22Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Improving generalization with synthetic training data for deep learning
based quality inspection [0.0]
教師付きディープラーニングは、トレーニングのために大量の注釈付きイメージを必要とする。
実際には、そのようなデータの収集と注釈付けは費用がかかり、手間がかかる。
ランダムに生成した合成訓練画像を用いることで、領域不安定性に対処できることを示す。
論文 参考訳(メタデータ) (2022-02-25T16:51:01Z) - Decoupled Appearance and Motion Learning for Efficient Anomaly Detection
in Surveillance Video [9.80717374118619]
我々は、純粋に教師なしの方法で正常な振る舞いを学習する新しいニューラルネットワークアーキテクチャを提案する。
我々のモデルは、関連するアプローチの16倍から45倍のフレームを毎秒処理できる。
論文 参考訳(メタデータ) (2020-11-10T11:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。