論文の概要: Inference for Generative Capsule Models
- arxiv url: http://arxiv.org/abs/2103.06676v1
- Date: Thu, 11 Mar 2021 14:10:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 02:17:37.147327
- Title: Inference for Generative Capsule Models
- Title(参考訳): 生成カプセルモデルの推論
- Authors: Alfredo Nazabal and Christopher K.I. Williams
- Abstract要約: capsule networkは、オブジェクトとその部分の関係に関する知識と推論をエンコードすることを目的としている。
データは任意の翻訳、回転、スケールで複数の幾何学的オブジェクトから生成される。
我々は、各オブジェクトの変換とオブジェクトの部分への点の割り当てを推測するための変分アルゴリズムを導出する。
- 参考スコア(独自算出の注目度): 4.454557728745761
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capsule networks (see e.g. Hinton et al., 2018) aim to encode knowledge and
reason about the relationship between an object and its parts. % In this paper
we focus on a clean version of this problem, where data is generated from
multiple geometric objects (e.g. triangles, squares) at arbitrary translations,
rotations and scales, and the observed datapoints (parts) come from the corners
of all objects, without any labelling of the objects.
We specify a generative model for this data, and derive a variational
algorithm for inferring the transformation of each object and the assignments
of points to parts of the objects.
Recent work by Kosiorek et al. [2019] has used amortized inference via
stacked capsule autoencoders (SCA) to tackle this problem -- our results show
that we significantly outperform them.
We also investigate inference for this problem using a RANSAC-type algorithm.
- Abstract(参考訳): capsule network (複数形 capsule networks)
Hinton et al., 2018) は、オブジェクトとその部分との関係に関する知識と理由をエンコードすることを目指している。
% この論文では、この問題のクリーンバージョンに焦点を当て、複数の幾何学的オブジェクトからデータを生成する。
三角形、四角形) 任意の翻訳、回転、スケール、および観測されたデータポイント(部分)は、オブジェクトのラベルを付けずに、すべてのオブジェクトの隅から来る。
このデータに対して生成モデルを指定し、各オブジェクトの変換とオブジェクトの部分への点の割り当てを推測するための変分アルゴリズムを導出する。
Kosiorekらによる最近の仕事。
この問題に対処するために [2019] は積み重ねたカプセルオートエンコーダ (SCA) による償却推論を使用しています。
また、RANSAC型アルゴリズムを用いてこの問題の推測を行う。
関連論文リスト
- Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.23575166061413]
KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文 参考訳(メタデータ) (2024-03-15T08:44:56Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Sensitivity of Slot-Based Object-Centric Models to their Number of Slots [15.990209329609275]
スロットベースの手法のK$に対する感度と、それがデータ内のオブジェクトへの学習対応に与える影響について検討する。
トレーニング中、特にK$の誤った選択は、望ましい対象分解を得られない。
目的関数の選択とインスタンスレベルのアノテーションの導入によって、この振る舞いを適度に軽減できることを示す。
論文 参考訳(メタデータ) (2023-05-30T09:44:12Z) - Category-level Shape Estimation for Densely Cluttered Objects [94.64287790278887]
そこで本研究では,密に散らばった物体のカテゴリレベルの形状推定手法を提案する。
我々のフレームワークは、多視点視覚情報融合によって、各オブジェクトをクラッタに分割する。
シミュレーション環境と実世界の実験から,本手法が高精度な形状推定を実現することが示された。
論文 参考訳(メタデータ) (2023-02-23T13:00:17Z) - Explicit3D: Graph Network with Spatial Inference for Single Image 3D
Object Detection [35.85544715234846]
本稿では,オブジェクトの幾何学的特徴と意味論的特徴に基づいて,Explicit3Dという動的スパースグラフパイプラインを提案する。
SUN RGB-Dデータセットによる実験結果から,我々のExplicit3Dは最先端技術よりも優れた性能バランスを実現することが示された。
論文 参考訳(メタデータ) (2023-02-13T16:19:54Z) - Inference and Learning for Generative Capsule Models [5.1081420619330515]
カプセルネットワークは、オブジェクトとその部分の関係に関する知識と推論を符号化することを目的としている。
このようなデータに対する生成モデルを定義し、各モデルオブジェクトの変換を推定するための変分アルゴリズムを導出する。
また、Fischler and Bolles (1981) のRANSAC法に基づく代替推論アルゴリズムについても検討した。
論文 参考訳(メタデータ) (2022-09-07T13:05:47Z) - Disentangled Representation Learning Using ($\beta$-)VAE and GAN [0.0]
dSpriteデータセットは、必要な実験に必要な機能を提供します。
VAEをGAN(Generative Adversarial Network)と組み合わせてトレーニングした後、隠れたベクトルの各次元が破壊され、各次元の歪みを探索した。
論文 参考訳(メタデータ) (2022-08-09T05:37:06Z) - 3D Object Classification on Partial Point Clouds: A Practical
Perspective [91.81377258830703]
点雲は3次元オブジェクト分類において一般的な形状表現である。
本稿では,任意のポーズの下でオブジェクトインスタンスの部分点雲を分類する実践的な設定を提案する。
本稿では,アライメント分類手法による新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-18T04:00:56Z) - Geometry Constrained Weakly Supervised Object Localization [55.17224813345206]
弱教師付きオブジェクトローカライゼーションのための幾何制約付きネットワークであるGC-Netを提案する。
検出器は、幾何学的形状を記述する係数の集合によって定義された物体の位置を予測する。
ジェネレータは、得られたマスクされた画像を入力として、オブジェクトとバックグラウンドの2つの補完的な分類タスクを実行する。
従来のアプローチとは対照的に、GC-Netはエンドツーエンドでトレーニングされ、後処理なしでオブジェクトの位置を予測する。
論文 参考訳(メタデータ) (2020-07-19T17:33:42Z) - Ellipse R-CNN: Learning to Infer Elliptical Object from Clustering and
Occlusion [31.237782332036552]
楕円形物体を楕円形に表現し,推定するために,最初のCNNベースの楕円形検出器であるEllipse R-CNNを導入する。
まず、楕円形物体検出のためのMask R-CNNアーキテクチャに基づく、頑健でコンパクトな楕円回帰法を提案する。
論文 参考訳(メタデータ) (2020-01-30T22:04:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。