論文の概要: Unsupervised part representation by Flow Capsules
- arxiv url: http://arxiv.org/abs/2011.13920v2
- Date: Fri, 19 Feb 2021 18:07:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 01:45:18.831991
- Title: Unsupervised part representation by Flow Capsules
- Title(参考訳): フローカプセルによる教師なし部分表現
- Authors: Sara Sabour, Andrea Tagliasacchi, Soroosh Yazdani, Geoffrey E. Hinton,
David J. Fleet
- Abstract要約: 単一画像から原子部品を検出する一次カプセルエンコーダを学習する方法を提案する。
我々は、階層化画像モデル内の部分生成のための表現型デコーダを用いて、部分定義のための強力な知覚的キューとして動きを利用する。
- 参考スコア(独自算出の注目度): 43.2934619818695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capsule networks aim to parse images into a hierarchy of objects, parts and
relations. While promising, they remain limited by an inability to learn
effective low level part descriptions. To address this issue we propose a way
to learn primary capsule encoders that detect atomic parts from a single image.
During training we exploit motion as a powerful perceptual cue for part
definition, with an expressive decoder for part generation within a layered
image model with occlusion. Experiments demonstrate robust part discovery in
the presence of multiple objects, cluttered backgrounds, and occlusion. The
part decoder infers the underlying shape masks, effectively filling in occluded
regions of the detected shapes. We evaluate FlowCapsules on unsupervised part
segmentation and unsupervised image classification.
- Abstract(参考訳): カプセルネットワークは、イメージをオブジェクト、部品、関係の階層に解析することを目的としている。
有望ではあるが、効果的な低レベルな部分記述を学習できないことで制限される。
この問題に対処するために、単一画像から原子部品を検出する一次カプセルエンコーダを学習する方法を提案する。
トレーニング中、私たちは部分定義のための強力な知覚手がかりとしてモーションを利用し、オクルージョンを伴う階層画像モデル内の部分生成のための表現豊かなデコーダを用いています。
実験は、複数の物体、散らかった背景、閉塞の存在下で堅牢な部分発見を示す。
部分デコーダは、下層の形状マスクを推測し、検出された形状の閉塞領域を効果的に充填する。
教師なし部分分割と教師なし画像分類に基づいてFlowCapsulesを評価する。
関連論文リスト
- Zero-Shot Image Segmentation via Recursive Normalized Cut on Diffusion Features [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - PDiscoNet: Semantically consistent part discovery for fine-grained
recognition [62.12602920807109]
画像レベルのクラスラベルのみを用いて,対象部品の発見を推奨する先行情報とともにPDiscoNetを提案する。
CUB,CelebA,PartImageNet で得られた結果から,提案手法は従来手法よりもかなり優れた部分発見性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-09-06T17:19:29Z) - Unsupervised Dense Nuclei Detection and Segmentation with Prior
Self-activation Map For Histology Images [5.3882963853819845]
事前自己アクティベーションモジュール(PSM)を用いた自己教師型学習手法を提案する。
PSMは入力画像から自己活性化マップを生成し、ラベル付けコストを回避し、下流タスク用の擬似マスクを生成する。
他の完全教師付き・弱教師付き手法と比較して,本手法は手動アノテーションを使わずに競争性能を達成できる。
論文 参考訳(メタデータ) (2022-10-14T14:34:26Z) - HP-Capsule: Unsupervised Face Part Discovery by Hierarchical Parsing
Capsule Network [76.92310948325847]
教師なしの顔部分発見のための階層型パーシングカプセルネットワーク(HP-Capsule Network)を提案する。
HP-Capsuleは、数字から人間の顔へのカプセルネットワークの適用を拡張し、ニューラルネットワークが人間の介入なしにオブジェクトを理解する方法を示す。
論文 参考訳(メタデータ) (2022-03-21T01:39:41Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - Unsupervised Part Discovery by Unsupervised Disentanglement [10.664434993386525]
部分分割は、個々のピクセルのレベルにおける部分ローカライゼーションに関する情報を提供する。
大きなアノテーションのコストは、教師付きアルゴリズムのスケーラビリティを他のオブジェクトカテゴリに制限します。
我々の研究は、監督なしに意味的部分のセグメンテーションを発見できる可能性を示している。
論文 参考訳(メタデータ) (2020-09-09T12:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。