論文の概要: Inference for Generative Capsule Models
- arxiv url: http://arxiv.org/abs/2103.06676v1
- Date: Thu, 11 Mar 2021 14:10:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 02:17:37.147327
- Title: Inference for Generative Capsule Models
- Title(参考訳): 生成カプセルモデルの推論
- Authors: Alfredo Nazabal and Christopher K.I. Williams
- Abstract要約: capsule networkは、オブジェクトとその部分の関係に関する知識と推論をエンコードすることを目的としている。
データは任意の翻訳、回転、スケールで複数の幾何学的オブジェクトから生成される。
我々は、各オブジェクトの変換とオブジェクトの部分への点の割り当てを推測するための変分アルゴリズムを導出する。
- 参考スコア(独自算出の注目度): 4.454557728745761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capsule networks (see e.g. Hinton et al., 2018) aim to encode knowledge and
reason about the relationship between an object and its parts. % In this paper
we focus on a clean version of this problem, where data is generated from
multiple geometric objects (e.g. triangles, squares) at arbitrary translations,
rotations and scales, and the observed datapoints (parts) come from the corners
of all objects, without any labelling of the objects.
We specify a generative model for this data, and derive a variational
algorithm for inferring the transformation of each object and the assignments
of points to parts of the objects.
Recent work by Kosiorek et al. [2019] has used amortized inference via
stacked capsule autoencoders (SCA) to tackle this problem -- our results show
that we significantly outperform them.
We also investigate inference for this problem using a RANSAC-type algorithm.
- Abstract(参考訳): capsule network (複数形 capsule networks)
Hinton et al., 2018) は、オブジェクトとその部分との関係に関する知識と理由をエンコードすることを目指している。
% この論文では、この問題のクリーンバージョンに焦点を当て、複数の幾何学的オブジェクトからデータを生成する。
三角形、四角形) 任意の翻訳、回転、スケール、および観測されたデータポイント(部分)は、オブジェクトのラベルを付けずに、すべてのオブジェクトの隅から来る。
このデータに対して生成モデルを指定し、各オブジェクトの変換とオブジェクトの部分への点の割り当てを推測するための変分アルゴリズムを導出する。
Kosiorekらによる最近の仕事。
この問題に対処するために [2019] は積み重ねたカプセルオートエンコーダ (SCA) による償却推論を使用しています。
また、RANSAC型アルゴリズムを用いてこの問題の推測を行う。
関連論文リスト
- Object-centric architectures enable efficient causal representation
learning [51.6196391784561]
観測対象が複数の物体である場合, 生成関数はもはや注入的ではなく, 実際に乱れは生じないことを示す。
スパース摂動からの弱い監督を利用して各オブジェクトのプロパティを乱すオブジェクト中心アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりもはるかに少ない摂動を必要とするという意味で、よりデータ効率が高い。
論文 参考訳(メタデータ) (2023-10-29T16:01:03Z) - Sensitivity of Slot-Based Object-Centric Models to their Number of Slots [15.990209329609275]
スロットベースの手法のK$に対する感度と、それがデータ内のオブジェクトへの学習対応に与える影響について検討する。
トレーニング中、特にK$の誤った選択は、望ましい対象分解を得られない。
目的関数の選択とインスタンスレベルのアノテーションの導入によって、この振る舞いを適度に軽減できることを示す。
論文 参考訳(メタデータ) (2023-05-30T09:44:12Z) - Category-level Shape Estimation for Densely Cluttered Objects [94.64287790278887]
そこで本研究では,密に散らばった物体のカテゴリレベルの形状推定手法を提案する。
我々のフレームワークは、多視点視覚情報融合によって、各オブジェクトをクラッタに分割する。
シミュレーション環境と実世界の実験から,本手法が高精度な形状推定を実現することが示された。
論文 参考訳(メタデータ) (2023-02-23T13:00:17Z) - Explicit3D: Graph Network with Spatial Inference for Single Image 3D
Object Detection [35.85544715234846]
本稿では,オブジェクトの幾何学的特徴と意味論的特徴に基づいて,Explicit3Dという動的スパースグラフパイプラインを提案する。
SUN RGB-Dデータセットによる実験結果から,我々のExplicit3Dは最先端技術よりも優れた性能バランスを実現することが示された。
論文 参考訳(メタデータ) (2023-02-13T16:19:54Z) - Inference and Learning for Generative Capsule Models [5.1081420619330515]
カプセルネットワークは、オブジェクトとその部分の関係に関する知識と推論を符号化することを目的としている。
このようなデータに対する生成モデルを定義し、各モデルオブジェクトの変換を推定するための変分アルゴリズムを導出する。
また、Fischler and Bolles (1981) のRANSAC法に基づく代替推論アルゴリズムについても検討した。
論文 参考訳(メタデータ) (2022-09-07T13:05:47Z) - Disentangled Representation Learning Using ($\beta$-)VAE and GAN [0.0]
dSpriteデータセットは、必要な実験に必要な機能を提供します。
VAEをGAN(Generative Adversarial Network)と組み合わせてトレーニングした後、隠れたベクトルの各次元が破壊され、各次元の歪みを探索した。
論文 参考訳(メタデータ) (2022-08-09T05:37:06Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - 3D Object Classification on Partial Point Clouds: A Practical
Perspective [91.81377258830703]
点雲は3次元オブジェクト分類において一般的な形状表現である。
本稿では,任意のポーズの下でオブジェクトインスタンスの部分点雲を分類する実践的な設定を提案する。
本稿では,アライメント分類手法による新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-18T04:00:56Z) - Continuous Surface Embeddings [76.86259029442624]
我々は、変形可能な対象カテゴリーにおける密接な対応を学習し、表現するタスクに焦点をあてる。
本稿では,高密度対応の新たな学習可能な画像ベース表現を提案する。
提案手法は,人間の身近なポーズ推定のための最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2020-11-24T22:52:15Z) - Geometry Constrained Weakly Supervised Object Localization [55.17224813345206]
弱教師付きオブジェクトローカライゼーションのための幾何制約付きネットワークであるGC-Netを提案する。
検出器は、幾何学的形状を記述する係数の集合によって定義された物体の位置を予測する。
ジェネレータは、得られたマスクされた画像を入力として、オブジェクトとバックグラウンドの2つの補完的な分類タスクを実行する。
従来のアプローチとは対照的に、GC-Netはエンドツーエンドでトレーニングされ、後処理なしでオブジェクトの位置を予測する。
論文 参考訳(メタデータ) (2020-07-19T17:33:42Z) - Ellipse R-CNN: Learning to Infer Elliptical Object from Clustering and
Occlusion [31.237782332036552]
楕円形物体を楕円形に表現し,推定するために,最初のCNNベースの楕円形検出器であるEllipse R-CNNを導入する。
まず、楕円形物体検出のためのMask R-CNNアーキテクチャに基づく、頑健でコンパクトな楕円回帰法を提案する。
論文 参考訳(メタデータ) (2020-01-30T22:04:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。