論文の概要: Variational Capsule Encoder
- arxiv url: http://arxiv.org/abs/2010.09102v1
- Date: Sun, 18 Oct 2020 20:52:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:24:32.423569
- Title: Variational Capsule Encoder
- Title(参考訳): 可変カプセルエンコーダ
- Authors: Harish RaviPrakash, Syed Muhammad Anwar, Ulas Bagci
- Abstract要約: 我々はベイジアンカプセル(B-Caps)と呼ばれる新しいカプセルネットワークに基づく変分エンコーダアーキテクチャを提案する。
このアプローチは、従来のアプローチよりも潜在領域における機能のより優れた表現を学習できる、という仮説を立てた。
この結果から,VAE設定下では検討されていない表現学習におけるカプセルネットワークの強みが示唆された。
- 参考スコア(独自算出の注目度): 6.244396213953519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel capsule network based variational encoder architecture,
called Bayesian capsules (B-Caps), to modulate the mean and standard deviation
of the sampling distribution in the latent space. We hypothesized that this
approach can learn a better representation of features in the latent space than
traditional approaches. Our hypothesis was tested by using the learned latent
variables for image reconstruction task, where for MNIST and Fashion-MNIST
datasets, different classes were separated successfully in the latent space
using our proposed model. Our experimental results have shown improved
reconstruction and classification performances for both datasets adding
credence to our hypothesis. We also showed that by increasing the latent space
dimension, the proposed B-Caps was able to learn a better representation when
compared to the traditional variational auto-encoders (VAE). Hence our results
indicate the strength of capsule networks in representation learning which has
never been examined under the VAE settings before.
- Abstract(参考訳): 本研究では, 潜在空間におけるサンプリング分布の平均および標準偏差を変調する新しいカプセルネットワークベースの変分エンコーダアーキテクチャ, bayesian capsules (b-caps) を提案する。
このアプローチは、従来のアプローチよりも潜在領域における機能のより良い表現を学べると仮定した。
そこで,mnist と fashion-mnist のデータセットでは,提案するモデルを用いた潜在空間において異なるクラスを分離することに成功した。
実験の結果,両データセットの再構成と分類性能が向上し,信頼性が向上した。
また, 潜在空間次元を増加させることにより, 従来の変分オートエンコーダ (vae) と比較して, 提案する b-caps はより良い表現を学習できることを示した。
以上の結果から,VAE設定下では検討されていない表現学習におけるカプセルネットワークの強みが示唆された。
関連論文リスト
- Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Vector Quantized Wasserstein Auto-Encoder [57.29764749855623]
生成的視点から深層離散表現を学習する。
我々は,コードワード列上の離散分布を付与し,コードワード列上の分布をデータ分布に伝達する決定論的デコーダを学習する。
WS 距離のクラスタリングの観点と結びつけて,より優れた,より制御可能なクラスタリングソリューションを実現するための,さらなる理論を開発しています。
論文 参考訳(メタデータ) (2023-02-12T13:51:36Z) - Trading Information between Latents in Hierarchical Variational
Autoencoders [8.122270502556374]
変分オートエンコーダ(VAE)はもともと確率的生成モデルとして動機付けられ、ベイズ推定を近似的に行う。
$beta$-VAEsの提案はこの解釈を破り、VAEを生成モデリング以上のアプリケーションドメインに一般化する。
推論モデルの一般的なクラスを特定し、各レイヤからのコントリビューションにレートを分割し、独立に調整することができる。
論文 参考訳(メタデータ) (2023-02-09T18:56:11Z) - SAR Image Change Detection Based on Multiscale Capsule Network [33.524488071386415]
従来の合成開口レーダ画像変化検出法は、スペックルノイズと変形感度の課題に直面している。
可変画素間の識別情報を抽出するマルチスケールカプセルネットワーク(Ms-CapsNet)を提案する。
提案したMs-CapsNetの有効性は、3つの実SARデータセットで検証される。
論文 参考訳(メタデータ) (2022-01-22T01:30:36Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - ASPCNet: A Deep Adaptive Spatial Pattern Capsule Network for
Hyperspectral Image Classification [47.541691093680406]
本稿では,適応型空間パターンカプセルネットワーク(ASPCNet)アーキテクチャを提案する。
拡大された受容体に基づいて畳み込み核のサンプリング位置を回転させることができる。
3つの公開データセットの実験は、ASPCNetが最先端の方法よりも高い精度で競争力を発揮することを示しています。
論文 参考訳(メタデータ) (2021-04-25T07:10:55Z) - Subspace Capsule Network [85.69796543499021]
SubSpace Capsule Network (SCN) はカプセルネットワークのアイデアを利用して、エンティティの外観や暗黙的に定義された特性のバリエーションをモデル化する。
SCNは、テスト期間中にCNNと比較して計算オーバーヘッドを発生させることなく、識別モデルと生成モデルの両方に適用することができる。
論文 参考訳(メタデータ) (2020-02-07T17:51:56Z) - On the Replicability of Combining Word Embeddings and Retrieval Models [71.18271398274513]
我々は、Fisherカーネルフレームワークの使用に関する魅力的な仮説を実証しようとする最近の実験を再現する。
具体的には、von Mises-Fisher (VMF) 分布の混合モデルを使用することは、VMF とベクトル空間モデルの両方の余弦距離に焦点をあてることによって有益である。
論文 参考訳(メタデータ) (2020-01-13T19:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。