論文の概要: An Energy-Based Prior for Generative Saliency
- arxiv url: http://arxiv.org/abs/2204.08803v1
- Date: Tue, 19 Apr 2022 10:51:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 14:25:41.875890
- Title: An Energy-Based Prior for Generative Saliency
- Title(参考訳): ジェネレーティブ・サリエンシーのためのエネルギーベースの事前
- Authors: Jing Zhang, Jianwen Xie, Nick Barnes, Ping Li
- Abstract要約: そこで我々は, 潜伏変数が情報的エネルギーに基づく先行を追従する, 生成相性予測のための新しいエネルギーベース先行法を提案する。
塩分濃度生成器とエネルギーベースの前駆体は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
- 参考スコア(独自算出の注目度): 62.79775297611203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel energy-based prior for generative saliency prediction,
where the latent variables follow an informative energy-based prior. Both the
saliency generator and the energy-based prior are jointly trained via Markov
chain Monte Carlo-based maximum likelihood estimation, in which the sampling
from the intractable posterior and prior distributions of the latent variables
are performed by Langevin dynamics. With the generative saliency model, we can
obtain a pixel-wise uncertainty map from an image, indicating model confidence
in the saliency prediction. Different from existing generative models, which
define the prior distribution of the latent variable as a simple isotropic
Gaussian distribution, our model uses an energy-based informative prior which
can be more expressive in capturing the latent space of the data. With the
informative energy-based prior, we extend the Gaussian distribution assumption
of generative models to achieve a more representative distribution of the
latent space, leading to more reliable uncertainty estimation. We apply the
proposed frameworks to both RGB and RGB-D salient object detection tasks with
both transformer and convolutional neural network backbones. Experimental
results show that our generative saliency model with an energy-based prior can
achieve not only accurate saliency predictions but also reliable uncertainty
maps that are consistent with human perception.
- Abstract(参考訳): そこで本研究では, 潜在変数が有意なエネルギーベースプリアーに従う, ジェネレイティブ・サリエンシー予測のための新しいエネルギーベースプリアーを提案する。
サリエンシージェネレータとエネルギーベースのプリエントの両方をマルコフ連鎖モンテカルロに基づく最大確率推定により共同で訓練し、ランジュバンダイナミクスによって潜在変数の難解な後方分布および前値分布からのサンプリングを行う。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
従属変数の先行分布を単純な等方的ガウス分布として定義する既存の生成モデルとは異なり、我々のモデルは、従属変数の潜在空間を捉える上でより表現力のあるエネルギーベースの情報伝達先を用いる。
情報的エネルギーベースの先行して、生成モデルのガウス分布仮定を拡張して、潜在空間のより代表的な分布を達成することにより、より信頼性の高い不確実性推定を行う。
提案するフレームワークは、トランスフォーマーと畳み込みニューラルネットワークのバックボーンを用いて、RGBとRGB-Dの両方に適応する。
実験の結果, エネルギーベースプリエントを持つ生成的サルマンシーモデルでは, 正確なサルマンシー予測だけでなく, 人間の知覚と一致する信頼性の高い不確実性マップを実現できることがわかった。
関連論文リスト
- Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.429396802848224]
本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文 参考訳(メタデータ) (2024-03-10T04:16:04Z) - Accurate generation of stochastic dynamics based on multi-model
Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。
ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。
重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文 参考訳(メタデータ) (2023-05-25T10:41:02Z) - Learning Probabilistic Models from Generator Latent Spaces with Hat EBM [81.35199221254763]
本研究では、エネルギーベースモデル(EBM)の基礎として、任意のジェネレータネットワークを使用する方法を提案する。
128x128解像度の非条件画像ネット合成,(2)既存の生成装置の出力の精細化,(3)非確率的生成装置を組み込んだ学習用EMMにおいて,提案手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-10-29T03:55:34Z) - Learning Generative Vision Transformer with Energy-Based Latent Space
for Saliency Prediction [51.80191416661064]
本稿では,有意な物体検出に先立って,潜伏変数を持つ新しい視覚変換器を提案する。
ビジョントランスネットワークとエネルギーベース先行モデルの両方は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。
生成型視覚変換器により、画像から容易に画素単位の不確実性マップを得ることができ、画像から唾液濃度を予測するためのモデル信頼度を示す。
論文 参考訳(メタデータ) (2021-12-27T06:04:33Z) - Quantifying Model Predictive Uncertainty with Perturbation Theory [21.591460685054546]
本稿では,ニューラルネットワークの予測不確実性定量化のためのフレームワークを提案する。
量子物理学の摂動理論を用いてモーメント分解問題を定式化する。
我々の手法は、より高精度でキャリブレーションの高い高速なモデル予測不確実性推定を提供する。
論文 参考訳(メタデータ) (2021-09-22T17:55:09Z) - Energy-Based Generative Cooperative Saliency Prediction [44.85865238229076]
生成モデルの観点から,サリエンシ予測問題について検討する。
本稿では,生産協調ネットワークに基づく生産協調給付予測フレームワークを提案する。
実験結果から,我々の生成モデルは最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T02:11:50Z) - Learning Interpretable Deep State Space Model for Probabilistic Time
Series Forecasting [98.57851612518758]
確率的時系列予測は、その歴史に基づいて将来の分布を推定する。
本稿では,非線形エミッションモデルと遷移モデルとをネットワークによってパラメータ化した,確率的時系列予測のための深部状態空間モデルを提案する。
実験では,我々のモデルが正確かつ鋭い確率予測を生成することを示す。
論文 参考訳(メタデータ) (2021-01-31T06:49:33Z) - Generative Model without Prior Distribution Matching [26.91643368299913]
変分オートエンコーダ(VAE)とその変分は、いくつかの先行分布を満たすために低次元の潜在表現を学習することによって古典的な生成モデルである。
我々は、先行変数に適合させるのではなく、先行変数が埋め込み分布と一致するように提案する。
論文 参考訳(メタデータ) (2020-09-23T09:33:24Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。