論文の概要: Energy-Based Generative Cooperative Saliency Prediction
- arxiv url: http://arxiv.org/abs/2106.13389v1
- Date: Fri, 25 Jun 2021 02:11:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 13:07:55.197530
- Title: Energy-Based Generative Cooperative Saliency Prediction
- Title(参考訳): エネルギーをベースとした協調型サリエンシ予測
- Authors: Jing Zhang and Jianwen Xie and Zilong Zheng and Nick Barnes
- Abstract要約: 生成モデルの観点から,サリエンシ予測問題について検討する。
本稿では,生産協調ネットワークに基づく生産協調給付予測フレームワークを提案する。
実験結果から,我々の生成モデルは最先端の性能を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 44.85865238229076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional saliency prediction models typically learn a deterministic
mapping from images to the corresponding ground truth saliency maps. In this
paper, we study the saliency prediction problem from the perspective of
generative models by learning a conditional probability distribution over
saliency maps given an image, and treating the prediction as a sampling
process. Specifically, we propose a generative cooperative saliency prediction
framework based on the generative cooperative networks, where a conditional
latent variable model and a conditional energy-based model are jointly trained
to predict saliency in a cooperative manner. We call our model the SalCoopNets.
The latent variable model serves as a fast but coarse predictor to efficiently
produce an initial prediction, which is then refined by the iterative Langevin
revision of the energy-based model that serves as a fine predictor. Such a
coarse-to-fine cooperative saliency prediction strategy offers the best of both
worlds. Moreover, we generalize our framework to the scenario of weakly
supervised saliency prediction, where saliency annotation of training images is
partially observed, by proposing a cooperative learning while recovering
strategy. Lastly, we show that the learned energy function can serve as a
refinement module that can refine the results of other pre-trained saliency
prediction models. Experimental results show that our generative model can
achieve state-of-the-art performance. Our code is publicly available at:
\url{https://github.com/JingZhang617/SalCoopNets}.
- Abstract(参考訳): 従来のサリエンシー予測モデルは、通常、画像から対応する基底真理サリエンシーマップへの決定論的マッピングを学習する。
本稿では,画像に与えられたサリエンシーマップ上の条件付き確率分布を学習し,その予測をサンプリングプロセスとして扱うことにより,生成モデルの観点からサリエンシー予測問題を検討する。
具体的には,条件付き潜伏変数モデルと条件付きエネルギーベースモデルとを協調的に学習し,協調的に相応の予測を行う,生成型協調ネットワークに基づく生産型相応予測フレームワークを提案する。
私たちはモデルをSalCoopNetsと呼んでいます。
潜在変数モデルは、高速だが粗い予測器として機能し、初期予測を効率的に生成し、その後、微細な予測器として機能するエネルギーベースモデルの反復的ランゲヴィン修正によって洗練される。
このような粗大な協力的サリエンシ予測戦略は、両方の世界の長所を提供する。
さらに,戦略を回復しながら協調学習を行うことによって,トレーニング画像の塩分アノテーションを部分的に観察する,弱教師付き塩分予測のシナリオを一般化する。
最後に,学習エネルギー関数を改良モジュールとして機能させることにより,事前学習した他の塩分濃度予測モデルの結果を洗練できることを示す。
実験の結果, 生成モデルが最先端の性能を達成できることが判明した。
我々のコードは以下で公開されている。 \url{https://github.com/JingZhang617/SalCoopNets}。
関連論文リスト
- Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Pyramidal Predictive Network: A Model for Visual-frame Prediction Based
on Predictive Coding Theory [1.4610038284393165]
本稿では,視覚的フレーム予測のためのニューラルネットワークモデルを提案する。
このモデルは、トップダウンストリームとボトムアップストリームを形成する一連の繰り返しおよび畳み込みユニットで構成されている。
ネットワークの各レイヤにConvLSTMを配置し、トップからダウンまでの局所的な予測を行う。
論文 参考訳(メタデータ) (2022-08-15T06:28:34Z) - An Energy-Based Prior for Generative Saliency [62.79775297611203]
本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
論文 参考訳(メタデータ) (2022-04-19T10:51:00Z) - Pathologies of Pre-trained Language Models in Few-shot Fine-tuning [50.3686606679048]
実例が少ない事前学習言語モデルはラベル間に強い予測バイアスを示すことを示す。
わずかな微調整で予測バイアスを軽減できるが,本分析では,非タスク関連の特徴を捉えることで,モデルの性能向上を図っている。
これらの観察は、より少ない例でモデルのパフォーマンスを追求することは、病理学的予測行動を引き起こす可能性があることを警告する。
論文 参考訳(メタデータ) (2022-04-17T15:55:18Z) - Distributional Gradient Boosting Machines [77.34726150561087]
私たちのフレームワークはXGBoostとLightGBMをベースにしています。
我々は,このフレームワークが最先端の予測精度を実現することを示す。
論文 参考訳(メタデータ) (2022-04-02T06:32:19Z) - A General Divergence Modeling Strategy for Salient Object Detection [32.53501439077824]
有能な物体検出は本質的に主観的であり、複数の推定値が同一の入力画像と関連していることが示唆される。
既存の有意なオブジェクト検出モデルは、点から点までの推定に従って決定論的であり、予測分布を推定できない。
潜在変数モデルに基づく予測ネットワークは予測変種をモデル化するために存在するが、単一の清浄度に基づく潜時空間は、主観的な唾液度の性質を探索する上では信頼性が低い。
論文 参考訳(メタデータ) (2021-11-23T12:47:51Z) - An Interpretable Probabilistic Model for Short-Term Solar Power
Forecasting Using Natural Gradient Boosting [0.0]
本稿では,高精度で信頼性が高く,鋭い予測を生成できる2段階確率予測フレームワークを提案する。
このフレームワークは、ポイント予測と予測間隔(PI)の両方について完全な透明性を提供する。
提案フレームワークの性能と適用性を強調するため,南ドイツにある2つのPV公園の実際のデータを用いている。
論文 参考訳(メタデータ) (2021-08-05T12:59:38Z) - Video Prediction via Example Guidance [156.08546987158616]
ビデオ予測タスクでは、将来のコンテンツとダイナミクスのマルチモーダルな性質を捉えることが大きな課題である。
本研究では,有効な将来状態の予測を効果的に行うための,シンプルで効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。