論文の概要: Unsupervised Skin Feature Tracking with Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2405.04943v1
- Date: Wed, 8 May 2024 10:27:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 14:54:31.140429
- Title: Unsupervised Skin Feature Tracking with Deep Neural Networks
- Title(参考訳): ディープニューラルネットワークを用いた非教師なし皮膚特徴追跡
- Authors: Jose Chang, Torbjörn E. M. Nordling,
- Abstract要約: 深層畳み込みニューラルネットワークは、トラッキングタスクにおいて顕著な精度を示している。
我々のパイプラインは、画像作物とターゲット特徴を含む参照作物とを一致させるために、畳み込み重ねられたオートエンコーダを使用している。
我々の教師なし学習アプローチは、重要な運動条件下での様々な皮膚の特徴の追跡に優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial feature tracking is essential in imaging ballistocardiography for accurate heart rate estimation and enables motor degradation quantification in Parkinson's disease through skin feature tracking. While deep convolutional neural networks have shown remarkable accuracy in tracking tasks, they typically require extensive labeled data for supervised training. Our proposed pipeline employs a convolutional stacked autoencoder to match image crops with a reference crop containing the target feature, learning deep feature encodings specific to the object category in an unsupervised manner, thus reducing data requirements. To overcome edge effects making the performance dependent on crop size, we introduced a Gaussian weight on the residual errors of the pixels when calculating the loss function. Training the autoencoder on facial images and validating its performance on manually labeled face and hand videos, our Deep Feature Encodings (DFE) method demonstrated superior tracking accuracy with a mean error ranging from 0.6 to 3.3 pixels, outperforming traditional methods like SIFT, SURF, Lucas Kanade, and the latest transformers like PIPs++ and CoTracker. Overall, our unsupervised learning approach excels in tracking various skin features under significant motion conditions, providing superior feature descriptors for tracking, matching, and image registration compared to both traditional and state-of-the-art supervised learning methods.
- Abstract(参考訳): 顔の特徴追跡は、正確な心拍数推定のためにバリストグラフィーにおいて必須であり、皮膚の特徴追跡を通じてパーキンソン病における運動量の定量化を可能にする。
深層畳み込みニューラルネットワークは、追跡タスクにおいて顕著な精度を示してきたが、典型的には、教師付きトレーニングのために広範囲のラベル付きデータを必要とする。
提案するパイプラインでは,画像作物と対象特徴を含む参照作物とを照合するために,畳み込み型オートエンコーダを用いて,対象カテゴリ固有の深い特徴符号化を教師なしで学習し,データ要求を低減した。
収穫量に依存するエッジ効果を克服するため,損失関数を計算する際の画素残差に対するガウス重みを導入した。
顔画像のオートエンコーダをトレーニングし、手動でラベル付けされた顔と手動のビデオのパフォーマンスを検証するDFE(Deep Feature Encodings)法では、平均誤差が0.6から3.3ピクセルであり、SIFT、SURF、Lucas Kanade、PIPs++、CoTrackerといった最新のトランスフォーマーよりも優れていた。
全体として、教師なし学習アプローチは、様々な皮膚の特徴を重要な動作条件下で追跡し、従来のものと最先端の教師付き学習方法と比較して、追跡、マッチング、画像登録に優れた特徴記述子を提供する。
関連論文リスト
- Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - A Bayesian Detect to Track System for Robust Visual Object Tracking and
Semi-Supervised Model Learning [1.7268829007643391]
ニューラルネットワークの出力によってパラメータ化されたベイズ追跡・検出フレームワークにおける副次的問題について述べる。
本稿では,粒子フィルタを用いた物体状態推定のための近似サンプリングアルゴリズムを提案する。
粒子フィルタ推論アルゴリズムを用いて,間欠的なラベル付きフレーム上でのトラッキングネットワークの学習に半教師付き学習アルゴリズムを用いる。
論文 参考訳(メタデータ) (2022-05-05T00:18:57Z) - Skin feature point tracking using deep feature encodings [0.0]
本稿では,画像中の最も類似した作物を特徴量を含む参照作物に識別するために,畳み込み積み重ねオートエンコーダを適用した特徴追跡用パイプラインを提案する。
顔画像上でオートエンコーダを訓練し、手動でラベル付けされた顔と手動のビデオを用いて皮膚の特徴を追跡できることを検証する。
提案手法は,従来のアルゴリズムよりも特徴追跡,特徴マッチング,画像登録に優れた特徴記述子を生成する。
論文 参考訳(メタデータ) (2021-12-28T14:29:08Z) - Deep Feature Tracker: A Novel Application for Deep Convolutional Neural
Networks [0.0]
本稿では,特徴を確実に追跡する方法を学習できる,新しい,統合されたディープラーニングベースのアプローチを提案する。
Deep-PTと呼ばれる提案ネットワークは、畳み込みニューラルネットワークの相互相関であるトラッカーネットワークで構成されている。
ネットワークは、特徴追跡データセットに特別なデータセットがないため、複数のデータセットを使用してトレーニングされている。
論文 参考訳(メタデータ) (2021-07-30T23:24:29Z) - Coarse-to-Fine Object Tracking Using Deep Features and Correlation
Filters [2.3526458707956643]
本稿では,新しいディープラーニング追跡アルゴリズムを提案する。
対象の翻訳を大まかに推定するために,深層特徴の一般化能力を利用する。
そして,相関フィルタの識別力を利用して追跡対象を正確に局所化する。
論文 参考訳(メタデータ) (2020-12-23T16:43:21Z) - DAQ: Distribution-Aware Quantization for Deep Image Super-Resolution
Networks [49.191062785007006]
画像超解像のための深い畳み込みニューラルネットワークの定量化は、計算コストを大幅に削減する。
既存の作業は、4ビット以下の超低精度の厳しい性能低下に苦しむか、または性能を回復するために重い微調整プロセスを必要とします。
高精度なトレーニングフリー量子化を実現する新しい分散認識量子化方式(DAQ)を提案する。
論文 参考訳(メタデータ) (2020-12-21T10:19:42Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z) - Deep Feature Consistent Variational Autoencoder [46.25741696270528]
本稿では,変分オートエンコーダ(VAE)構築のための新しい手法を提案する。
ピクセル・バイ・ピクセル・ロスを使用する代わりに、入力とVAEの出力の深い特徴一貫性を強制する。
また,本手法は,顔表現の意味情報をキャプチャする潜在ベクトルを生成できることを示す。
論文 参考訳(メタデータ) (2016-10-02T15:48:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。