論文の概要: An Energy-Based Prior for Generative Saliency
- arxiv url: http://arxiv.org/abs/2204.08803v1
- Date: Tue, 19 Apr 2022 10:51:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 14:25:41.875890
- Title: An Energy-Based Prior for Generative Saliency
- Title(参考訳): ジェネレーティブ・サリエンシーのためのエネルギーベースの事前
- Authors: Jing Zhang, Jianwen Xie, Nick Barnes, Ping Li
- Abstract要約: そこで我々は, 潜伏変数が情報的エネルギーに基づく先行を追従する, 生成相性予測のための新しいエネルギーベース先行法を提案する。
塩分濃度生成器とエネルギーベースの前駆体は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
- 参考スコア(独自算出の注目度): 62.79775297611203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel energy-based prior for generative saliency prediction,
where the latent variables follow an informative energy-based prior. Both the
saliency generator and the energy-based prior are jointly trained via Markov
chain Monte Carlo-based maximum likelihood estimation, in which the sampling
from the intractable posterior and prior distributions of the latent variables
are performed by Langevin dynamics. With the generative saliency model, we can
obtain a pixel-wise uncertainty map from an image, indicating model confidence
in the saliency prediction. Different from existing generative models, which
define the prior distribution of the latent variable as a simple isotropic
Gaussian distribution, our model uses an energy-based informative prior which
can be more expressive in capturing the latent space of the data. With the
informative energy-based prior, we extend the Gaussian distribution assumption
of generative models to achieve a more representative distribution of the
latent space, leading to more reliable uncertainty estimation. We apply the
proposed frameworks to both RGB and RGB-D salient object detection tasks with
both transformer and convolutional neural network backbones. Experimental
results show that our generative saliency model with an energy-based prior can
achieve not only accurate saliency predictions but also reliable uncertainty
maps that are consistent with human perception.
- Abstract(参考訳): そこで本研究では, 潜在変数が有意なエネルギーベースプリアーに従う, ジェネレイティブ・サリエンシー予測のための新しいエネルギーベースプリアーを提案する。
サリエンシージェネレータとエネルギーベースのプリエントの両方をマルコフ連鎖モンテカルロに基づく最大確率推定により共同で訓練し、ランジュバンダイナミクスによって潜在変数の難解な後方分布および前値分布からのサンプリングを行う。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
従属変数の先行分布を単純な等方的ガウス分布として定義する既存の生成モデルとは異なり、我々のモデルは、従属変数の潜在空間を捉える上でより表現力のあるエネルギーベースの情報伝達先を用いる。
情報的エネルギーベースの先行して、生成モデルのガウス分布仮定を拡張して、潜在空間のより代表的な分布を達成することにより、より信頼性の高い不確実性推定を行う。
提案するフレームワークは、トランスフォーマーと畳み込みニューラルネットワークのバックボーンを用いて、RGBとRGB-Dの両方に適応する。
実験の結果, エネルギーベースプリエントを持つ生成的サルマンシーモデルでは, 正確なサルマンシー予測だけでなく, 人間の知覚と一致する信頼性の高い不確実性マップを実現できることがわかった。
関連論文リスト
- Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間シーケンスデータを表現するために設計された深部力学モデルの新しいファミリを紹介する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
発振システム、ビデオ、実世界の状態シーケンス(MuJoCo)の実験は、学習可能なエネルギーベース以前のODEが既存のものより優れていることを示している。
論文 参考訳(メタデータ) (2024-09-05T18:14:22Z) - Correntropy-Based Improper Likelihood Model for Robust Electrophysiological Source Imaging [18.298620404141047]
既存のソースイメージングアルゴリズムは、観測ノイズに対するガウスの仮定を利用して、ベイズ推定の確率関数を構築する。
脳活動の電磁的測定は、通常、様々な人工物に影響され、観測ノイズの非ガウス分布につながる可能性がある。
非ガウス雑音に対して頑健な新しい確率モデルを提案する。
論文 参考訳(メタデータ) (2024-08-27T07:54:15Z) - A Non-negative VAE:the Generalized Gamma Belief Network [49.970917207211556]
ガンマ信念ネットワーク(GBN)は、テキストデータ中の多層解釈可能な潜在表現を明らかにする可能性を実証している。
本稿では、一般化ガンマ信念ネットワーク(Generalized GBN)を導入し、元の線形生成モデルをより表現力のある非線形生成モデルに拡張する。
また、潜伏変数の後方分布を近似する上向きのワイブル推論ネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-06T18:18:37Z) - Variational Potential Flow: A Novel Probabilistic Framework for Energy-Based Generative Modelling [10.926841288976684]
エネルギーをベースとした新しい生成フレームワークVAPOについて述べる。
VAPOは、勾配(流れ)が前のサンプルを導くポテンシャルエネルギー関数を学習することを目的としており、その密度の進化は近似的なデータ準同相性に従う。
イメージはポテンシャルエネルギーをトレーニングした後、ガウスのサンプルを初期化し、固定時間間隔で電位フローを管理するODEを解くことで生成することができる。
論文 参考訳(メタデータ) (2024-07-21T18:08:12Z) - Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Accurate generation of stochastic dynamics based on multi-model
Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。
ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。
重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文 参考訳(メタデータ) (2023-05-25T10:41:02Z) - Learning Generative Vision Transformer with Energy-Based Latent Space
for Saliency Prediction [51.80191416661064]
本稿では,有意な物体検出に先立って,潜伏変数を持つ新しい視覚変換器を提案する。
ビジョントランスネットワークとエネルギーベース先行モデルの両方は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。
生成型視覚変換器により、画像から容易に画素単位の不確実性マップを得ることができ、画像から唾液濃度を予測するためのモデル信頼度を示す。
論文 参考訳(メタデータ) (2021-12-27T06:04:33Z) - Energy-Based Generative Cooperative Saliency Prediction [44.85865238229076]
生成モデルの観点から,サリエンシ予測問題について検討する。
本稿では,生産協調ネットワークに基づく生産協調給付予測フレームワークを提案する。
実験結果から,我々の生成モデルは最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T02:11:50Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。