論文の概要: Autoencoding Conditional Neural Processes for Representation Learning
- arxiv url: http://arxiv.org/abs/2305.18485v1
- Date: Mon, 29 May 2023 12:10:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 20:26:38.779898
- Title: Autoencoding Conditional Neural Processes for Representation Learning
- Title(参考訳): 表現学習のための自動符号化条件付きニューラルプロセス
- Authors: Victor Prokhorov, Ivan Titov, N. Siddharth
- Abstract要約: 条件付きニューラルプロセス(CNP)は、観測から学習するフレキシブルで効率的なモデルのファミリーである。
CNPはどのピクセルを観察したいのか?
我々は、CNP学習と同時にこの状況を予測するために、補正された変分フレームワークである部分画素空間変分自動符号化(PPS-VAE)を構築した。
視覚データセットの集合上でPSS-VAEを評価し、CNPを適合させてコンテキストポイントを学習できるだけでなく、それらの空間配置と値が、それらに含まれる情報に対して強い信号を与えることを発見した。
- 参考スコア(独自算出の注目度): 55.82323745663286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional neural processes (CNPs) are a flexible and efficient family of
models that learn to learn a stochastic process from observations. In the
visual domain, they have seen particular application in contextual image
completion - observing pixel values at some locations to predict a distribution
over values at other unobserved locations. However, the choice of pixels in
learning such a CNP is typically either random or derived from a simple
statistical measure (e.g. pixel variance). Here, we turn the problem on its
head and ask: which pixels would a CNP like to observe? That is, which pixels
allow fitting CNP, and do such pixels tell us something about the underlying
image? Viewing the context provided to the CNP as fixed-size latent
representations, we construct an amortised variational framework, Partial Pixel
Space Variational Autoencoder (PPS-VAE), for predicting this context
simultaneously with learning a CNP. We evaluate PPS-VAE on a set of vision
datasets, and find that not only is it possible to learn context points while
also fitting CNPs, but that their spatial arrangement and values provides
strong signal for the information contained in the image - evaluated through
the lens of classification. We believe the PPS-VAE provides a promising avenue
to explore learning interpretable and effective visual representations.
- Abstract(参考訳): 条件付きニューラルプロセス(CNP)は、観測から確率過程を学ぶことを学ぶ、柔軟で効率的なモデルのファミリーである。
視覚領域では、コンテクスト画像補完において特定の応用が見られ、ある場所でピクセル値を観察し、他の観測されていない場所での値の分布を予測する。
しかし、そのようなCNPを学習する際のピクセルの選択は、通常、ランダムまたは単純な統計測度(例えば、ピクセル分散)から導出される。
ここでは、問題を頭を回して、どのピクセルをCNPが観察したいのかを尋ねます。
つまり、どのピクセルがCNPのフィッティングを許可し、そのようなピクセルが背景画像について何か教えてくれるのか?
固定サイズ潜在表現としてCNPに提供するコンテキストを考察し、CNPの学習と同時にこのコンテキストを予測するための補正された変分フレームワークである部分画素空間変分自動符号化(PPS-VAE)を構築した。
我々は,一連の視覚データセット上でPSS-VAEを評価し,CNPを装着しながらコンテキストポイントを学習できるだけでなく,その空間配置や値が画像に含まれる情報に対して強い信号を与えることを発見した。
我々は、PS-VAEが、解釈可能かつ効果的な視覚表現を学ぶための、有望な道を提供すると考えている。
関連論文リスト
- Learning Invariant Inter-pixel Correlations for Superpixel Generation [12.605604620139497]
学習可能な特徴は、制約付き判別能力を示し、不満足なピクセルグループ化性能をもたらす。
本稿では,不変画素間相関と統計特性を選択的に分離するContentangle Superpixelアルゴリズムを提案する。
4つのベンチマークデータセットの実験結果は、既存の最先端手法に対するアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-02-28T09:46:56Z) - Differentiable Registration of Images and LiDAR Point Clouds with
VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。
ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定
我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文 参考訳(メタデータ) (2023-12-07T05:46:10Z) - NP-SemiSeg: When Neural Processes meet Semi-Supervised Semantic
Segmentation [87.50830107535533]
半教師付きセマンティックセグメンテーションでは、トレーニング時にピクセルワイズラベルをラベル付けされていない画像に割り当てる。
モデルによるクラスワイズ確率分布から各画素の擬似ラベルを予測し,半教師付きセマンティックセマンティックセマンティクスへのアプローチ
本研究では,NPを半教師付きセマンティックセグメンテーションに適応させることにより一歩前進し,NP-SemiSegと呼ばれる新しいモデルを実現する。
論文 参考訳(メタデータ) (2023-08-05T12:42:15Z) - Versatile Neural Processes for Learning Implicit Neural Representations [57.090658265140384]
本稿では,近似関数の能力を大幅に向上させるVersatile Neural Processs (VNP)を提案する。
具体的には、より少ない情報的コンテキストトークンを生成するボトルネックエンコーダを導入し、高い計算コストを軽減した。
提案したVNPが1D, 2D, 3D信号を含む様々なタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2023-01-21T04:08:46Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Conditional Neural Processes for Molecules [0.0]
ニューラルプロセス(NPs)はガウス過程(GPs)に類似した特性を持つ伝達学習のモデルである
本稿では,MLモデルのベンチマークのためのドッキングスコアのデータセットであるDOCKSTRINGに対して,条件付きニューラルプロセス(CNP)を適用する。
CNPは、QSARモデリングに共通する教師付き学習ベースラインに対して、数ショットの学習タスクにおいて、競合する性能を示す。
論文 参考訳(メタデータ) (2022-10-17T16:10:12Z) - Visual Recognition with Deep Nearest Centroids [57.35144702563746]
我々は、概念的にエレガントで驚くほど効果的な大規模視覚認識ネットワークである深部セントロイド(DNC)を考案した。
パラメトリックと比較すると、DNCは画像分類(CIFAR-10, ImageNet)に優れ、画像認識(ADE20K, Cityscapes)を大いに起動する。
論文 参考訳(メタデータ) (2022-09-15T15:47:31Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - Neural Knitworks: Patched Neural Implicit Representation Networks [1.0470286407954037]
画像合成を実現する自然画像の暗黙的表現学習のためのアーキテクチャであるKnitworkを提案する。
私たちの知る限りでは、画像のインペインティング、超解像化、デノイングといった合成作業に適した座標ベースのパッチの実装は、これが初めてである。
その結果, ピクセルではなくパッチを用いた自然な画像のモデリングにより, 忠実度が高い結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T13:10:46Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。