論文の概要: Unsupervised domain adaptation for clinician pose estimation and
instance segmentation in the OR
- arxiv url: http://arxiv.org/abs/2108.11801v1
- Date: Thu, 26 Aug 2021 14:07:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 13:59:23.431313
- Title: Unsupervised domain adaptation for clinician pose estimation and
instance segmentation in the OR
- Title(参考訳): ORにおける臨床ポーズ推定と事例分割のための教師なしドメイン適応
- Authors: Vinkle Srivastav, Afshin Gangi, Nicolas Padoy
- Abstract要約: 本研究では,1倍から12倍の解像度の低解像度画像に対して,共同人物のポーズ推定とセグメンテーション・インスタンスの実行方法について検討した。
本稿では,EmphAdaptorと呼ばれる新しい教師なしドメイン適応手法を提案する。
本稿では,大規模なemphCOCOデータセット上での半教師付き学習(SSL)手法として,本手法の汎用性を示す。
- 参考スコア(独自算出の注目度): 4.024513066910992
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The fine-grained localization of clinicians in the operating room (OR) is a
key component to design the new generation of OR support systems. Computer
vision models for person pixel-based segmentation and body-keypoints detection
are needed to better understand the clinical activities and the spatial layout
of the OR. This is challenging, not only because OR images are very different
from traditional vision datasets, but also because data and annotations are
hard to collect and generate in the OR due to privacy concerns. To address
these concerns, we first study how joint person pose estimation and instance
segmentation can be performed on low resolutions images from 1x to 12x. Second,
to address the domain shift and the lack of annotations, we propose a novel
unsupervised domain adaptation method, called \emph{AdaptOR}, to adapt a model
from an \emph{in-the-wild} labeled source domain to a statistically different
unlabeled target domain. We propose to exploit explicit geometric constraints
on the different augmentations of the unlabeled target domain image to generate
accurate pseudo labels, and using these pseudo labels to train the model on
high- and low-resolution OR images in a \emph{self-training} framework.
Furthermore, we propose \emph{disentangled feature normalization} to handle the
statistically different source and target domain data. Extensive experimental
results with detailed ablation studies on the two OR datasets \emph{MVOR+} and
\emph{TUM-OR-test} show the effectiveness of our approach against strongly
constructed baselines, especially on the low-resolution privacy-preserving OR
images. Finally, we show the generality of our method as a semi-supervised
learning (SSL) method on the large-scale \emph{COCO} dataset, where we achieve
comparable results with as few as \textbf{1\%} of labeled supervision against a
model trained with 100\% labeled supervision.
- Abstract(参考訳): 手術室(OR)における臨床医の微細な局在化は,新世代のOR支援システムを設計する上で重要な要素である。
人物のピクセルに基づくセグメンテーションとボディーキーポイント検出のためのコンピュータビジョンモデルは、臨床活動とorの空間配置をよりよく理解するために必要である。
ORイメージが従来のビジョンデータセットと大きく異なるだけでなく、プライバシ上の懸念から、データやアノテーションの収集や生成が難しいため、これは難しい作業です。
これらの懸念に対処するため,まず1倍から12倍までの低解像度画像に対して,共同人物のポーズ推定とインスタンスセグメンテーションの実施について検討する。
第二に、ドメインシフトとアノテーションの欠如に対処するために、ラベル付きソースドメインから統計的に異なるラベルなしターゲットドメインにモデルを適応させる、新しい教師なしドメイン適応法である「emph{Adaptor}」を提案する。
本稿では,ラベル付き対象領域画像の異なる拡張に対する明示的な幾何学的制約を利用して,正確な擬似ラベルを生成することを提案し,これらの擬似ラベルを用いて,高解像度のOR画像と低解像度のOR画像を用いて,emph{self-training}フレームワークでモデルを訓練する。
さらに,統計的に異なるソースと対象ドメインデータを扱うために,emph{disentangled feature normalization}を提案する。
2つのデータセットである \emph{mvor+} と \emph{tum-or-test} に関する詳細なアブレーション実験の結果は、特に低解像度のプライバシー保護や画像において、強固に構築されたベースラインに対するアプローチの有効性を示している。
最後に,100\%のラベル付き教師付き教師付き教師付きモデルに対して,ラベル付き監督の最大数 \textbf{1\%} で比較結果が得られる大規模データ集合 \emph{coco} 上で,半教師付き学習 (ssl) 法として手法の汎用性を示す。
関連論文リスト
- Unsupervised Camouflaged Object Segmentation as Domain Adaptation [5.304455190825436]
本研究では,対象オブジェクトが共通属性,すなわちカモフラージュ(camouflage)を所有する,教師なしカモフラージュオブジェクトセグメンテーション(UCOS)という新しいタスクについて検討する。
現状の教師なしモデルは、ジェネリックオブジェクトとカモフラーグオブジェクトのドメインギャップのため、UCOSの適応に苦慮している。
我々は、UCOSをソースフリーな教師なしドメイン適応タスク(UCOS-DA)として定式化し、モデルトレーニングプロセス全体において、ソースラベルとターゲットラベルの両方が欠落している。
論文 参考訳(メタデータ) (2023-08-08T18:46:16Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Source-Free Domain Adaptive Fundus Image Segmentation with Denoised
Pseudo-Labeling [56.98020855107174]
ドメイン適応は通常、ソースドメインデータにアクセスして、ターゲットデータとのドメインアライメントのために配布情報を利用する必要があります。
多くの実世界のシナリオでは、プライバシの問題により、ターゲットドメインのモデル適応中にソースデータがアクセスできない場合がある。
本稿では,本問題に対する新たな擬似ラベル付け手法を提案する。
論文 参考訳(メタデータ) (2021-09-19T06:38:21Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Consistency Regularization with High-dimensional Non-adversarial
Source-guided Perturbation for Unsupervised Domain Adaptation in Segmentation [15.428323201750144]
BiSIDAは、未ラベルのターゲットデータセットからの情報を効率的に活用するために、一貫性の正則化を採用している。
BiSIDAは、一般的に使われている2つの合成-実領域適応ベンチマーク上で、新しい最先端を実現する。
論文 参考訳(メタデータ) (2020-09-18T03:26:44Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Domain Adaptive Medical Image Segmentation via Adversarial Learning of
Disease-Specific Spatial Patterns [6.298270929323396]
複数の領域にまたがる画像セグメンテーション性能を向上させるための教師なしドメイン適応フレームワークを提案する。
我々は,不適切なセグメンテーションパターンを拒絶し,意味情報や境界情報を通じて暗黙的に学習することで,新しいデータに適応するようにアーキテクチャを強制する。
対象領域からのラベルなし画像上でのディープネットワークの再構成により,セグメント化精度が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2020-01-25T13:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。