論文の概要: An Energy-Based Prior for Generative Saliency
- arxiv url: http://arxiv.org/abs/2204.08803v3
- Date: Tue, 27 Jun 2023 06:51:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 18:16:42.454429
- Title: An Energy-Based Prior for Generative Saliency
- Title(参考訳): ジェネレーティブ・サリエンシーのためのエネルギーベースの事前
- Authors: Jing Zhang, Jianwen Xie, Nick Barnes, Ping Li
- Abstract要約: 本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
- 参考スコア(独自算出の注目度): 62.79775297611203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel generative saliency prediction framework that adopts an
informative energy-based model as a prior distribution. The energy-based prior
model is defined on the latent space of a saliency generator network that
generates the saliency map based on a continuous latent variables and an
observed image. Both the parameters of saliency generator and the energy-based
prior are jointly trained via Markov chain Monte Carlo-based maximum likelihood
estimation, in which the sampling from the intractable posterior and prior
distributions of the latent variables are performed by Langevin dynamics. With
the generative saliency model, we can obtain a pixel-wise uncertainty map from
an image, indicating model confidence in the saliency prediction. Different
from existing generative models, which define the prior distribution of the
latent variables as a simple isotropic Gaussian distribution, our model uses an
energy-based informative prior which can be more expressive in capturing the
latent space of the data. With the informative energy-based prior, we extend
the Gaussian distribution assumption of generative models to achieve a more
representative distribution of the latent space, leading to more reliable
uncertainty estimation. We apply the proposed frameworks to both RGB and RGB-D
salient object detection tasks with both transformer and convolutional neural
network backbones. We further propose an adversarial learning algorithm and a
variational inference algorithm as alternatives to train the proposed
generative framework. Experimental results show that our generative saliency
model with an energy-based prior can achieve not only accurate saliency
predictions but also reliable uncertainty maps that are consistent with human
perception. Results and code are available at
\url{https://github.com/JingZhang617/EBMGSOD}.
- Abstract(参考訳): 本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成性予測フレームワークを提案する。
エネルギーに基づく事前モデルは、連続潜在変数と観測画像に基づいて塩分マップを生成する塩分発生ネットワークの潜在空間上で定義される。
塩分発生器のパラメータとエネルギーに基づくプリアのパラメータは、マルコフ連鎖モンテカルロに基づく最大確率推定によって共に訓練され、潜在変数の難解な後方分布と事前分布からのサンプリングはランジュバンダイナミクスによって行われる。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
従属変数の先行分布を単純な等方的ガウス分布として定義する既存の生成モデルとは異なり、我々のモデルは、従属変数の潜在空間を捉える上でより表現力のあるエネルギーベースの情報伝達先を用いる。
情報的エネルギーベースの先行して、生成モデルのガウス分布仮定を拡張して、潜在空間のより代表的な分布を達成することにより、より信頼性の高い不確実性推定を行う。
提案するフレームワークは、トランスフォーマーと畳み込みニューラルネットワークのバックボーンを用いて、RGBとRGB-Dの両方に適応する。
また,提案手法を学習するための代替として,逆学習アルゴリズムと変分推論アルゴリズムを提案する。
実験の結果, エネルギーベースプリエントを持つ生成的サルマンシーモデルでは, 正確なサルマンシー予測だけでなく, 人間の知覚と一致する信頼性の高い不確実性マップを実現できることがわかった。
結果とコードは \url{https://github.com/jingzhang617/ebmgsod} で入手できる。
関連論文リスト
- Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間シーケンスデータを表現するために設計された深部力学モデルの新しいファミリを紹介する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
発振システム、ビデオ、実世界の状態シーケンス(MuJoCo)の実験は、学習可能なエネルギーベース以前のODEが既存のものより優れていることを示している。
論文 参考訳(メタデータ) (2024-09-05T18:14:22Z) - Correntropy-Based Improper Likelihood Model for Robust Electrophysiological Source Imaging [18.298620404141047]
既存のソースイメージングアルゴリズムは、観測ノイズに対するガウスの仮定を利用して、ベイズ推定の確率関数を構築する。
脳活動の電磁的測定は、通常、様々な人工物に影響され、観測ノイズの非ガウス分布につながる可能性がある。
非ガウス雑音に対して頑健な新しい確率モデルを提案する。
論文 参考訳(メタデータ) (2024-08-27T07:54:15Z) - A Non-negative VAE:the Generalized Gamma Belief Network [49.970917207211556]
ガンマ信念ネットワーク(GBN)は、テキストデータ中の多層解釈可能な潜在表現を明らかにする可能性を実証している。
本稿では、一般化ガンマ信念ネットワーク(Generalized GBN)を導入し、元の線形生成モデルをより表現力のある非線形生成モデルに拡張する。
また、潜伏変数の後方分布を近似する上向きのワイブル推論ネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-06T18:18:37Z) - Variational Potential Flow: A Novel Probabilistic Framework for Energy-Based Generative Modelling [10.926841288976684]
エネルギーをベースとした新しい生成フレームワークVAPOについて述べる。
VAPOは、勾配(流れ)が前のサンプルを導くポテンシャルエネルギー関数を学習することを目的としており、その密度の進化は近似的なデータ準同相性に従う。
イメージはポテンシャルエネルギーをトレーニングした後、ガウスのサンプルを初期化し、固定時間間隔で電位フローを管理するODEを解くことで生成することができる。
論文 参考訳(メタデータ) (2024-07-21T18:08:12Z) - Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Accurate generation of stochastic dynamics based on multi-model
Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。
ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。
重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文 参考訳(メタデータ) (2023-05-25T10:41:02Z) - Learning Generative Vision Transformer with Energy-Based Latent Space
for Saliency Prediction [51.80191416661064]
本稿では,有意な物体検出に先立って,潜伏変数を持つ新しい視覚変換器を提案する。
ビジョントランスネットワークとエネルギーベース先行モデルの両方は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。
生成型視覚変換器により、画像から容易に画素単位の不確実性マップを得ることができ、画像から唾液濃度を予測するためのモデル信頼度を示す。
論文 参考訳(メタデータ) (2021-12-27T06:04:33Z) - Energy-Based Generative Cooperative Saliency Prediction [44.85865238229076]
生成モデルの観点から,サリエンシ予測問題について検討する。
本稿では,生産協調ネットワークに基づく生産協調給付予測フレームワークを提案する。
実験結果から,我々の生成モデルは最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T02:11:50Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。