論文の概要: Constrained Structure Learning for Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2201.11697v1
- Date: Thu, 27 Jan 2022 17:47:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 13:33:37.822533
- Title: Constrained Structure Learning for Scene Graph Generation
- Title(参考訳): シーングラフ生成のための制約付き構造学習
- Authors: Daqi Liu, Miroslaw Bober, Josef Kittler
- Abstract要約: 本稿では,制約付き構造学習手法を提案する。
本稿では,様々なシーングラフ生成ベンチマークを用いて提案手法の有効性を検証し,最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 40.46394569128303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a structured prediction task, scene graph generation aims to build a
visually-grounded scene graph to explicitly model objects and their
relationships in an input image. Currently, the mean field variational Bayesian
framework is the de facto methodology used by the existing methods, in which
the unconstrained inference step is often implemented by a message passing
neural network. However, such formulation fails to explore other inference
strategies, and largely ignores the more general constrained optimization
models. In this paper, we present a constrained structure learning method, for
which an explicit constrained variational inference objective is proposed.
Instead of applying the ubiquitous message-passing strategy, a generic
constrained optimization method - entropic mirror descent - is utilized to
solve the constrained variational inference step. We validate the proposed
generic model on various popular scene graph generation benchmarks and show
that it outperforms the state-of-the-art methods.
- Abstract(参考訳): 構造化予測タスクとして、シーングラフ生成は、オブジェクトとその関係を入力画像で明示的にモデル化する視覚的なシーングラフを構築することを目的としている。
現在、平均場変分ベイズフレームワークは、既存の方法が使用する事実上の方法論であり、制約のない推論ステップは、メッセージパッシングニューラルネットワークによってしばしば実装される。
しかし、そのような定式化は他の推論戦略を探求できず、より一般的な制約付き最適化モデルを無視している。
本稿では,明示的な制約付き変分推論目標を提案する制約構造学習手法を提案する。
ユビキタスメッセージパス戦略を適用する代わりに、一般的な制約付き最適化手法であるエントロピックミラー降下を用いて、制約付き変動推論のステップを解決する。
提案手法を各種人気のあるシーングラフ生成ベンチマークで検証し,最先端手法よりも優れていることを示す。
関連論文リスト
- Generative Modelling of Structurally Constrained Graphs [44.28728853270471]
ConStructは,平面性や非巡回性といった特定の特性をハードコントラストグラフ拡散モデルに組み込むことのできる,新しいフレームワークである。
我々のアプローチは、サンプルグラフがグラフの領域内にあることを保証し、前と逆の両方の過程において、軌道全体を通して指定された性質を検証する。
論文 参考訳(メタデータ) (2024-06-25T07:54:32Z) - Robust Data-driven Prescriptiveness Optimization [4.792851066169871]
本稿では、古典的経験的リスク目標最小化に代えて、規範性の係数が代わる分布的ロバストな文脈最適化モデルを提案する。
サンプル外データセットが様々な分散シフトを受ける場合の代替手法に対する結果のロバスト性を評価する。
論文 参考訳(メタデータ) (2023-06-09T14:56:06Z) - Diffusion Action Segmentation [63.061058214427085]
本稿では,このような反復的洗練の本質的な精神を共用した拡散モデルによる新しい枠組みを提案する。
このフレームワークでは、入力された映像の特徴を条件としてランダムノイズから行動予測を反復的に生成する。
論文 参考訳(メタデータ) (2023-03-31T10:53:24Z) - Iterative Scene Graph Generation [55.893695946885174]
シーングラフ生成は、オブジェクトエンティティとその対応する相互作用述語を所定の画像(またはビデオ)で識別する。
シーングラフ生成への既存のアプローチは、推定イテレーションの実現を可能にするために、関節分布の特定の因子化を前提としている。
本稿では,この制限に対処する新しいフレームワークを提案するとともに,画像に動的条件付けを導入する。
論文 参考訳(メタデータ) (2022-07-27T10:37:29Z) - Object Representations as Fixed Points: Training Iterative Refinement
Algorithms with Implicit Differentiation [88.14365009076907]
反復的洗練は表現学習に有用なパラダイムである。
トレーニングの安定性とトラクタビリティを向上させる暗黙の差別化アプローチを開発する。
論文 参考訳(メタデータ) (2022-07-02T10:00:35Z) - Doubly Reparameterized Importance Weighted Structure Learning for Scene
Graph Generation [40.46394569128303]
入力画像が与えられたシーングラフ生成は、視覚的に接地されたシーングラフを構築することにより、オブジェクトとその関係を明示的にモデル化することを目的としている。
本稿では,より厳密な重み付き下界を変分推論対象として用いた2重み付き重み付き構造学習法を提案する。
提案手法は,様々な人気シーングラフ生成ベンチマークにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-06-22T20:00:25Z) - Importance Weighted Structure Learning for Scene Graph Generation [40.46394569128303]
本稿では,シーングラフ生成のための重み付き構造学習手法を提案する。
結果として生じる制約付き変動推論タスクを解決するために、一般的なエントロピーミラー降下アルゴリズムを適用した。
提案手法は,様々な人気シーングラフ生成ベンチマークにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-05-14T09:25:14Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。