論文の概要: In-Bed Human Pose Estimation from Unseen and Privacy-Preserving Image
Domains
- arxiv url: http://arxiv.org/abs/2111.15124v1
- Date: Tue, 30 Nov 2021 04:56:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 13:52:27.548779
- Title: In-Bed Human Pose Estimation from Unseen and Privacy-Preserving Image
Domains
- Title(参考訳): 非知覚およびプライバシー保全画像領域からのベッド内人物ポーズ推定
- Authors: Ting Cao, Mohammad Ali Armin, Simon Denman, Lars Petersson, David
Ahmedt-Aristizabal
- Abstract要約: ベッド内の人間の姿勢推定は、医療状況の評価において潜在的な価値を持つ重要な健康関連指標を提供する。
本稿では,マルチモーダル条件変分オートエンコーダ(MC-VAE)を提案する。
本研究は, 身体位置が利用可能なモダリティから効果的に認識できることを示し, ベースラインモデルと同等の結果が得られることを示した。
- 参考スコア(独自算出の注目度): 22.92165116962952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical applications have benefited from the rapid advancement in computer
vision. For patient monitoring in particular, in-bed human posture estimation
provides important health-related metrics with potential value in medical
condition assessments. Despite great progress in this domain, it remains a
challenging task due to substantial ambiguity during occlusions, and the lack
of large corpora of manually labeled data for model training, particularly with
domains such as thermal infrared imaging which are privacy-preserving, and thus
of great interest. Motivated by the effectiveness of self-supervised methods in
learning features directly from data, we propose a multi-modal conditional
variational autoencoder (MC-VAE) capable of reconstructing features from
missing modalities seen during training. This approach is used with HRNet to
enable single modality inference for in-bed pose estimation. Through extensive
evaluations, we demonstrate that body positions can be effectively recognized
from the available modality, achieving on par results with baseline models that
are highly dependent on having access to multiple modes at inference time. The
proposed framework supports future research towards self-supervised learning
that generates a robust model from a single source, and expects it to
generalize over many unknown distributions in clinical environments.
- Abstract(参考訳): 医療応用はコンピュータビジョンの急速な進歩の恩恵を受けている。
特に患者のモニタリングにおいて、ベッド内姿勢推定は、医療状態評価において潜在的価値を持つ重要な健康関連指標を提供する。
この領域は大きな進歩を遂げているが、咬合時の曖昧さやモデルトレーニングのための大量の手作業によるラベル付きデータの欠如、特にプライバシ保護のサーマル赤外線イメージングのような領域において、非常に興味深い課題である。
データから直接特徴を学習する際の自己指導的手法の有効性を活かして、訓練中に見られるモダリティの欠如から特徴を再構築できるマルチモーダル条件変分オートエンコーダ(MC-VAE)を提案する。
このアプローチはHRNetと組み合わせて、ベッド内ポーズ推定のための単一モード推論を可能にする。
広範な評価を通じて,身体の位置を利用可能なモダリティから効果的に認識し,推定時の複数のモードへのアクセスに大きく依存するベースラインモデルと同等の結果が得られることを示す。
提案フレームワークは,単一ソースからロバストモデルを生成する自己教師型学習に向けた将来の研究を支援し,臨床環境における未知の分布を一般化することを期待している。
関連論文リスト
- Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Enhancing Apparent Personality Trait Analysis with Cross-Modal Embeddings [0.5461938536945723]
本稿では,ショートビデオ記録で訓練した人格特性予測のために,シームズ拡張を用いたマルチモーダルディープニューラルネットワークを提案する。
分析されたデータセットの高度に集中したターゲット分布のため、第3桁の変更は関連している。
論文 参考訳(メタデータ) (2024-05-06T20:51:28Z) - Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - On the Out of Distribution Robustness of Foundation Models in Medical
Image Segmentation [47.95611203419802]
視覚と言語の基礎は、様々な自然画像とテキストデータに基づいて事前訓練されており、有望なアプローチとして現れている。
一般化性能を,同じ分布データセット上で微調整した後,事前学習した各種モデルの未確認領域と比較した。
さらに,凍結モデルに対する新しいベイズ不確実性推定法を開発し,分布外データに基づくモデルの性能評価指標として利用した。
論文 参考訳(メタデータ) (2023-11-18T14:52:10Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal
Health Event Prediction [13.24834156675212]
本稿では,情報フローを組み込んだハイパーボリック埋め込み手法を提案する。
我々は、これらの事前学習された表現をグラフニューラルネットワークに組み込んで、疾患の合併症を検出する。
本稿では,EHRデータを完全に活用する自己教師付き学習フレームワークに,階層型で強化された履歴予測代行タスクを提案する。
論文 参考訳(メタデータ) (2021-06-09T00:42:44Z) - Concept-based model explanations for Electronic Health Records [1.6837409766909865]
概念活性化ベクトル(TCAV)を用いたテストは、人間に理解可能な説明を提供する手段として最近導入された。
本手法を時系列データに拡張し,TCAVの適用をEHRの逐次予測に適用する。
論文 参考訳(メタデータ) (2020-12-03T22:18:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。