論文の概要: ProMask: Probability Mask for Skeleton Detection
- arxiv url: http://arxiv.org/abs/2012.03003v1
- Date: Sat, 5 Dec 2020 10:54:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 12:06:13.950385
- Title: ProMask: Probability Mask for Skeleton Detection
- Title(参考訳): ProMask:スケルトン検出のための確率マスク
- Authors: Xiuxiu Bai, Lele Ye, Zhe Liu
- Abstract要約: ProMaskは、スケルトンをセグメンテーション信号でエンコードする新しいスケルトン検出モデルである。
本手法をよく知られた骨格データセット上で評価し,最先端の手法よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 9.893072835741268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting object skeletons in natural images presents challenging, due to
varied object scales, the complexity of backgrounds and various noises. The
skeleton is a highly compressing shape representation, which can bring some
essential advantages but cause the difficulties of detection. This skeleton
line occupies a rare proportion of an image and is overly sensitive to spatial
position. Inspired by these issues, we propose the ProMask, which is a novel
skeleton detection model. The ProMask includes the probability mask and vector
router. The skeleton probability mask representation explicitly encodes
skeletons with segmentation signals, which can provide more supervised
information to learn and pay more attention to ground-truth skeleton pixels.
Moreover, the vector router module possesses two sets of orthogonal basis
vectors in a two-dimensional space, which can dynamically adjust the predicted
skeleton position. We evaluate our method on the well-known skeleton datasets,
realizing the better performance than state-of-the-art approaches. Especially,
ProMask significantly outperforms the competitive DeepFlux by 6.2% on the
challenging SYM-PASCAL dataset. We consider that our proposed skeleton
probability mask could serve as a solid baseline for future skeleton detection,
since it is very effective and it requires about 10 lines of code.
- Abstract(参考訳): 自然画像から物体の骨格を検出することは、様々な物体スケール、背景の複雑さ、様々なノイズのために困難である。
骨格は高度に圧縮された形状の表現であり、いくつかの重要な利点をもたらすが、検出の困難を引き起こす。
この骨格線は画像の稀な割合を占め、空間的位置に対して過度に敏感である。
これらの問題に触発されて,新しい骨格検出モデルであるProMaskを提案する。
ProMaskは確率マスクとベクトルルータを含む。
スケルトン確率マスク表現は、スケルトンをセグメンテーション信号で明示的に符号化し、より教師ありの情報を提供し、地下のスケルトンピクセルにより多くの注意を払うことができる。
さらに、ベクトルルータモジュールは2次元空間に2組の直交基底ベクトルを持ち、予測された骨格位置を動的に調整することができる。
本手法はよく知られたスケルトンデータセット上で評価し,最先端のアプローチよりも優れた性能を実現する。
特にProMaskは、競争力のあるDeepFluxを6.2%上回っている。
提案するスケルトン確率マスクは,非常に効果的で約10行のコードを必要とするため,将来のスケルトン検出のベースラインとして有効であると考えられる。
関連論文リスト
- SkeletonGait: Gait Recognition Using Skeleton Maps [7.335859292188816]
スケルトンマップ(SkeletonGait)と呼ばれる新しい骨格歩行表現を導入し、スケルトンマップから構造情報を利用するスケルトンマップ(SkeletonGait)を提案する。
骨格地図は、人間の関節の座標をガウス近似による熱マップとして表現し、正確な体の構造を持たないシルエットのようなイメージを示す。
SkeletonGait++は、さまざまなシナリオにおいて、既存の最先端メソッドよりも大きな差がある。
論文 参考訳(メタデータ) (2023-11-22T15:09:59Z) - Bayesian Deep Learning for Affordance Segmentation in images [3.15834651147911]
本稿では,画像の空き地を検出するための新しいベイズディープネットワークを提案する。
空間レベルでの動脈およびてんかんの分布を定量化する。
その結果,決定論的ネットワークの最先端性が向上した。
論文 参考訳(メタデータ) (2023-03-02T00:01:13Z) - SkeletonMAE: Spatial-Temporal Masked Autoencoders for Self-supervised
Skeleton Action Recognition [13.283178393519234]
自己監督型骨格に基づく行動認識が注目されている。
ラベルのないデータを利用することで、オーバーフィッティング問題を緩和するためにより一般化可能な特徴を学ぶことができる。
自己教師型3次元骨格に基づく行動認識のための空間時間マスク付きオートエンコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-01T20:54:27Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - OSSO: Obtaining Skeletal Shape from Outside [50.47978215230605]
OSSO(Obtaining Skeletal Shape from Outside)は、実データから3次元体表面から内部骨格へのマッピングを初めて学習する。
そこで本研究では,体表面を捉えるためにパラメトリックな3次元体形モデル (STAR) と,骨を捉えるために新しい部分ベースの3次元骨格モデルを構築した。
次に、身体形状パラメータから骨格形状パラメータへ回帰器を訓練し、身体的妥当性の制約を満たすために骨格を洗練させる。
論文 参考訳(メタデータ) (2022-04-21T14:33:42Z) - SimMC: Simple Masked Contrastive Learning of Skeleton Representations
for Unsupervised Person Re-Identification [63.903237777588316]
SimMC(Simple Masked Contrastive Learning)フレームワークを提案する。
具体的には、各骨格配列内の骨格の特徴を完全に活用するために、まずマスク付きプロトタイプコントラスト学習(MPC)方式を考案する。
そこで我々は,サブシーケンス間のシーケンス内パターンの整合性を捉えるために,マスク付きシーケンス内コントラスト学習(MIC)を提案する。
論文 参考訳(メタデータ) (2022-04-21T00:19:38Z) - Mask is All You Need: Rethinking Mask R-CNN for Dense and
Arbitrary-Shaped Scene Text Detection [11.390163890611246]
Mask R-CNNは、任意の形のシーンテキストの検出とスポッティングのための強力なベースラインとして広く採用されている。
1つの提案には複数のインスタンスが存在する可能性があるため、マスクヘッドが異なるインスタンスを区別し、パフォーマンスを劣化させるのが難しくなる。
本稿では,各画素をテキストや非テキストに分類するのではなく,マスクヘッドがインスタンス全体の形状を予測することを学習する事例認識型マスク学習を提案する。
論文 参考訳(メタデータ) (2021-09-08T04:32:29Z) - Contrastive Context-Aware Learning for 3D High-Fidelity Mask Face
Presentation Attack Detection [103.7264459186552]
顔認識システムには、顔提示攻撃検出(PAD)が不可欠である。
ほとんどの既存の3DマスクPADベンチマークにはいくつかの欠点があります。
現実世界のアプリケーションとのギャップを埋めるために、大規模なハイファイアリティマスクデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-13T12:48:38Z) - DCT-Mask: Discrete Cosine Transform Mask Representation for Instance
Segmentation [50.70679435176346]
本稿では、離散コサイン変換(DCT)を用いて、高分解能二元格子マスクをコンパクトなベクトルに符号化することで、新しいマスク表現を提案する。
DCT-Maskと呼ばれるこの手法は、ほとんどのピクセルベースのインスタンスセグメンテーション手法に簡単に統合できる。
論文 参考訳(メタデータ) (2020-11-19T15:00:21Z) - BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation [103.74690082121079]
本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
論文 参考訳(メタデータ) (2020-01-02T03:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。