論文の概要: Autoencoding Conditional Neural Processes for Representation Learning
- arxiv url: http://arxiv.org/abs/2305.18485v2
- Date: Sat, 17 Feb 2024 23:00:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 06:44:49.997069
- Title: Autoencoding Conditional Neural Processes for Representation Learning
- Title(参考訳): 表現学習のための自動符号化条件付きニューラルプロセス
- Authors: Victor Prokhorov, Ivan Titov, N. Siddharth
- Abstract要約: 条件付きニューラルプロセス(CNP)は、データから学習するフレキシブルで効率的なモデルのファミリーである。
PPS-VAE(Partial Pixel Space Variational Autoencoder)は、CNPコンテキストをCNPと同時に学習する潜時変数としてキャストするアモータイズされた変分フレームワークである。
- 参考スコア(独自算出の注目度): 31.63717849083666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional neural processes (CNPs) are a flexible and efficient family of
models that learn to learn a stochastic process from data. They have seen
particular application in contextual image completion - observing pixel values
at some locations to predict a distribution over values at other unobserved
locations. However, the choice of pixels in learning CNPs is typically either
random or derived from a simple statistical measure (e.g. pixel variance).
Here, we turn the problem on its head and ask: which pixels would a CNP like to
observe - do they facilitate fitting better CNPs, and do such pixels tell us
something meaningful about the underlying image? To this end we develop the
Partial Pixel Space Variational Autoencoder (PPS-VAE), an amortised variational
framework that casts CNP context as latent variables learnt simultaneously with
the CNP. We evaluate PPS-VAE over a number of tasks across different visual
data, and find that not only can it facilitate better-fit CNPs, but also that
the spatial arrangement and values meaningfully characterise image information
- evaluated through the lens of classification on both within and out-of-data
distributions. Our model additionally allows for dynamic adaption of
context-set size and the ability to scale-up to larger images, providing a
promising avenue to explore learning meaningful and effective visual
representations.
- Abstract(参考訳): 条件付き神経プロセス(conditional neural process, cnps)は、データから確率的プロセスを学習するフレキシブルで効率的なモデル群である。
ある場所でピクセル値を観測し、他の観測されていない場所での値の分布を予測する。
しかし、CNPを学習する際のピクセルの選択は、通常、ランダムまたは単純な統計測度(例えば、ピクセル分散)に由来する。
CNPは、より優れたCNPの適合を容易にし、そのようなピクセルは、基盤となる画像について意味のあることを教えてくれるのか?
この目的のために、CNPコンテキストを潜時変数として同時に学習するアモータイズされた変分フレームワークであるPartial Pixel Space Variational Autoencoder (PPS-VAE) を開発した。
異なる視覚データにまたがる複数のタスクについてpps-vaeを評価し,より適したcppを実現するだけでなく,空間的配置や値が画像情報に有意義な特徴付けを行うことを見出し,データ内分布と外分布の両方の分類レンズを通して評価した。
さらに,このモデルにより,コンテキストセットのサイズの動的適応と,より大きな画像へのスケールアップが可能となり,有意義で効果的な視覚表現の学習方法として期待できる。
関連論文リスト
- Learning Invariant Inter-pixel Correlations for Superpixel Generation [12.605604620139497]
学習可能な特徴は、制約付き判別能力を示し、不満足なピクセルグループ化性能をもたらす。
本稿では,不変画素間相関と統計特性を選択的に分離するContentangle Superpixelアルゴリズムを提案する。
4つのベンチマークデータセットの実験結果は、既存の最先端手法に対するアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-02-28T09:46:56Z) - Differentiable Registration of Images and LiDAR Point Clouds with
VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。
ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定
我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文 参考訳(メタデータ) (2023-12-07T05:46:10Z) - NP-SemiSeg: When Neural Processes meet Semi-Supervised Semantic
Segmentation [87.50830107535533]
半教師付きセマンティックセグメンテーションでは、トレーニング時にピクセルワイズラベルをラベル付けされていない画像に割り当てる。
モデルによるクラスワイズ確率分布から各画素の擬似ラベルを予測し,半教師付きセマンティックセマンティックセマンティクスへのアプローチ
本研究では,NPを半教師付きセマンティックセグメンテーションに適応させることにより一歩前進し,NP-SemiSegと呼ばれる新しいモデルを実現する。
論文 参考訳(メタデータ) (2023-08-05T12:42:15Z) - Versatile Neural Processes for Learning Implicit Neural Representations [57.090658265140384]
本稿では,近似関数の能力を大幅に向上させるVersatile Neural Processs (VNP)を提案する。
具体的には、より少ない情報的コンテキストトークンを生成するボトルネックエンコーダを導入し、高い計算コストを軽減した。
提案したVNPが1D, 2D, 3D信号を含む様々なタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2023-01-21T04:08:46Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Conditional Neural Processes for Molecules [0.0]
ニューラルプロセス(NPs)はガウス過程(GPs)に類似した特性を持つ伝達学習のモデルである
本稿では,MLモデルのベンチマークのためのドッキングスコアのデータセットであるDOCKSTRINGに対して,条件付きニューラルプロセス(CNP)を適用する。
CNPは、QSARモデリングに共通する教師付き学習ベースラインに対して、数ショットの学習タスクにおいて、競合する性能を示す。
論文 参考訳(メタデータ) (2022-10-17T16:10:12Z) - Visual Recognition with Deep Nearest Centroids [57.35144702563746]
我々は、概念的にエレガントで驚くほど効果的な大規模視覚認識ネットワークである深部セントロイド(DNC)を考案した。
パラメトリックと比較すると、DNCは画像分類(CIFAR-10, ImageNet)に優れ、画像認識(ADE20K, Cityscapes)を大いに起動する。
論文 参考訳(メタデータ) (2022-09-15T15:47:31Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - Neural Knitworks: Patched Neural Implicit Representation Networks [1.0470286407954037]
画像合成を実現する自然画像の暗黙的表現学習のためのアーキテクチャであるKnitworkを提案する。
私たちの知る限りでは、画像のインペインティング、超解像化、デノイングといった合成作業に適した座標ベースのパッチの実装は、これが初めてである。
その結果, ピクセルではなくパッチを用いた自然な画像のモデリングにより, 忠実度が高い結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T13:10:46Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。