Fugu-MT 論文翻訳(概要): An Energy-Based Prior for Generative Saliency

論文の概要: An Energy-Based Prior for Generative Saliency

arxiv url: http://arxiv.org/abs/2204.08803v3
Date: Tue, 27 Jun 2023 06:51:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-28 18:16:42.454429
Title: An Energy-Based Prior for Generative Saliency
Title（参考訳）: ジェネレーティブ・サリエンシーのためのエネルギーベースの事前
Authors: Jing Zhang, Jianwen Xie, Nick Barnes, Ping Li
Abstract要約: 本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
参考スコア（独自算出の注目度）: 62.79775297611203
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a novel generative saliency prediction framework that adopts an informative energy-based model as a prior distribution. The energy-based prior model is defined on the latent space of a saliency generator network that generates the saliency map based on a continuous latent variables and an observed image. Both the parameters of saliency generator and the energy-based prior are jointly trained via Markov chain Monte Carlo-based maximum likelihood estimation, in which the sampling from the intractable posterior and prior distributions of the latent variables are performed by Langevin dynamics. With the generative saliency model, we can obtain a pixel-wise uncertainty map from an image, indicating model confidence in the saliency prediction. Different from existing generative models, which define the prior distribution of the latent variables as a simple isotropic Gaussian distribution, our model uses an energy-based informative prior which can be more expressive in capturing the latent space of the data. With the informative energy-based prior, we extend the Gaussian distribution assumption of generative models to achieve a more representative distribution of the latent space, leading to more reliable uncertainty estimation. We apply the proposed frameworks to both RGB and RGB-D salient object detection tasks with both transformer and convolutional neural network backbones. We further propose an adversarial learning algorithm and a variational inference algorithm as alternatives to train the proposed generative framework. Experimental results show that our generative saliency model with an energy-based prior can achieve not only accurate saliency predictions but also reliable uncertainty maps that are consistent with human perception. Results and code are available at \url{https://github.com/JingZhang617/EBMGSOD}.
Abstract（参考訳）: 本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成性予測フレームワークを提案する。エネルギーに基づく事前モデルは、連続潜在変数と観測画像に基づいて塩分マップを生成する塩分発生ネットワークの潜在空間上で定義される。塩分発生器のパラメータとエネルギーに基づくプリアのパラメータは、マルコフ連鎖モンテカルロに基づく最大確率推定によって共に訓練され、潜在変数の難解な後方分布と事前分布からのサンプリングはランジュバンダイナミクスによって行われる。生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。従属変数の先行分布を単純な等方的ガウス分布として定義する既存の生成モデルとは異なり、我々のモデルは、従属変数の潜在空間を捉える上でより表現力のあるエネルギーベースの情報伝達先を用いる。情報的エネルギーベースの先行して、生成モデルのガウス分布仮定を拡張して、潜在空間のより代表的な分布を達成することにより、より信頼性の高い不確実性推定を行う。提案するフレームワークは、トランスフォーマーと畳み込みニューラルネットワークのバックボーンを用いて、RGBとRGB-Dの両方に適応する。また,提案手法を学習するための代替として,逆学習アルゴリズムと変分推論アルゴリズムを提案する。実験の結果, エネルギーベースプリエントを持つ生成的サルマンシーモデルでは, 正確なサルマンシー予測だけでなく, 人間の知覚と一致する信頼性の高い不確実性マップを実現できることがわかった。結果とコードは \url{https://github.com/jingzhang617/ebmgsod} で入手できる。

関連論文リスト

Generative Modeling with Bayesian Sample Inference [50.07758840675341]
我々はガウス的後代推論の単純な作用から新しい生成モデルを導出する。生成したサンプルを未知変数として推論することで、ベイズ確率の言語でサンプリングプロセスを定式化する。我々のモデルは、未知のサンプルを広い初期信念から絞り込むために、一連の予測と後続の更新ステップを使用する。
論文参考訳（メタデータ） (2025-02-11T14:27:10Z)
Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間シーケンスデータを表現するために設計された深部力学モデルの新しいファミリを紹介する。マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。発振システム、ビデオ、実世界の状態シーケンス(MuJoCo)の実験は、学習可能なエネルギーベース以前のODEが既存のものより優れていることを示している。
論文参考訳（メタデータ） (2024-09-05T18:14:22Z)
Correntropy-Based Improper Likelihood Model for Robust Electrophysiological Source Imaging [18.298620404141047]
既存のソースイメージングアルゴリズムは、観測ノイズに対するガウスの仮定を利用して、ベイズ推定の確率関数を構築する。脳活動の電磁的測定は、通常、様々な人工物に影響され、観測ノイズの非ガウス分布につながる可能性がある。非ガウス雑音に対して頑健な新しい確率モデルを提案する。
論文参考訳（メタデータ） (2024-08-27T07:54:15Z)
A Non-negative VAE:the Generalized Gamma Belief Network [49.970917207211556]
ガンマ信念ネットワーク(GBN)は、テキストデータ中の多層解釈可能な潜在表現を明らかにする可能性を実証している。本稿では、一般化ガンマ信念ネットワーク(Generalized GBN)を導入し、元の線形生成モデルをより表現力のある非線形生成モデルに拡張する。また、潜伏変数の後方分布を近似する上向きのワイブル推論ネットワークを提案する。
論文参考訳（メタデータ） (2024-08-06T18:18:37Z)
Variational Potential Flow: A Novel Probabilistic Framework for Energy-Based Generative Modelling [10.926841288976684]
エネルギーをベースとした新しい生成フレームワークVAPOについて述べる。 VAPOは、勾配(流れ)が前のサンプルを導くポテンシャルエネルギー関数を学習することを目的としており、その密度の進化は近似的なデータ準同相性に従う。イメージはポテンシャルエネルギーをトレーニングした後、ガウスのサンプルを初期化し、固定時間間隔で電位フローを管理するODEを解くことで生成することができる。
論文参考訳（メタデータ） (2024-07-21T18:08:12Z)
Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文参考訳（メタデータ） (2023-11-30T18:59:44Z)
Accurate generation of stochastic dynamics based on multi-model Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文参考訳（メタデータ） (2023-05-25T10:41:02Z)
Learning Generative Vision Transformer with Energy-Based Latent Space for Saliency Prediction [51.80191416661064]
本稿では,有意な物体検出に先立って,潜伏変数を持つ新しい視覚変換器を提案する。ビジョントランスネットワークとエネルギーベース先行モデルの両方は、マルコフ連鎖モンテカルロによる最大推定を通じて共同で訓練される。生成型視覚変換器により、画像から容易に画素単位の不確実性マップを得ることができ、画像から唾液濃度を予測するためのモデル信頼度を示す。
論文参考訳（メタデータ） (2021-12-27T06:04:33Z)
Energy-Based Generative Cooperative Saliency Prediction [44.85865238229076]
生成モデルの観点から,サリエンシ予測問題について検討する。本稿では,生産協調ネットワークに基づく生産協調給付予測フレームワークを提案する。実験結果から,我々の生成モデルは最先端の性能を達成できることが示唆された。
論文参考訳（メタデータ） (2021-06-25T02:11:50Z)
Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。 6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文参考訳（メタデータ） (2020-09-07T13:01:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。