論文の概要: Energy-Based Learning for Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2103.02221v1
- Date: Wed, 3 Mar 2021 07:11:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-06 12:44:54.874569
- Title: Energy-Based Learning for Scene Graph Generation
- Title(参考訳): エネルギーに基づくシーングラフ生成学習
- Authors: Mohammed Suhail, Abhay Mittal, Behjat Siddiquie, Chris Broaddus, Jayan
Eledath, Gerard Medioni, Leonid Sigal
- Abstract要約: シーングラフを生成するための新しいエネルギーベース学習フレームワークを提案する。
提案する定式化により,シーングラフの構造を出力空間に効率的に組み込むことができる。
提案するフレームワークを用いて,既存の最先端モデルをトレーニングし,大幅な性能向上を実現する。
- 参考スコア(独自算出の注目度): 26.500496033477127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional scene graph generation methods are trained using cross-entropy
losses that treat objects and relationships as independent entities. Such a
formulation, however, ignores the structure in the output space, in an
inherently structured prediction problem. In this work, we introduce a novel
energy-based learning framework for generating scene graphs. The proposed
formulation allows for efficiently incorporating the structure of scene graphs
in the output space. This additional constraint in the learning framework acts
as an inductive bias and allows models to learn efficiently from a small number
of labels. We use the proposed energy-based framework to train existing
state-of-the-art models and obtain a significant performance improvement, of up
to 21% and 27%, on the Visual Genome and GQA benchmark datasets, respectively.
Furthermore, we showcase the learning efficiency of the proposed framework by
demonstrating superior performance in the zero- and few-shot settings where
data is scarce.
- Abstract(参考訳): 伝統的なシーングラフ生成法は、オブジェクトと関係を独立したエンティティとして扱うクロスエントロピー損失を用いて訓練される。
しかし、そのような定式化は、本質的に構造化された予測問題において、出力空間の構造を無視する。
本研究では,シーングラフ生成のための新しいエネルギーベース学習フレームワークを提案する。
提案する定式化により,シーングラフの構造を出力空間に効率的に組み込むことができる。
学習フレームワークのこの追加制約は、誘導バイアスとして機能し、モデルが少数のラベルから効率的に学習できるようにします。
提案したエネルギーベースのフレームワークを使用して,既存の最先端モデルをトレーニングし,それぞれVisual GenomeとGQAベンチマークデータセット上で,最大21%,最大27%の大幅なパフォーマンス向上を実現している。
さらに,データ不足のゼロショットおよびマイショット設定において,優れた性能を示すことにより,提案フレームワークの学習効率を示す。
関連論文リスト
- Graph Structure Refinement with Energy-based Contrastive Learning [56.957793274727514]
グラフの構造と表現を学習するための生成訓練と識別訓練のジョイントに基づく教師なし手法を提案する。
本稿では,ECL-GSR(Energy-based Contrastive Learning)によるグラフ構造再構成(GSR)フレームワークを提案する。
ECL-GSRは、主要なベースラインに対するサンプルやメモリの少ない高速なトレーニングを実現し、下流タスクの単純さと効率性を強調している。
論文 参考訳(メタデータ) (2024-12-20T04:05:09Z) - Towards Unbiased and Robust Spatio-Temporal Scene Graph Generation and Anticipation [10.678727237318503]
Imparは、カリキュラム学習と損失マスキングを利用してバイアス発生と予測モデリングを緩和する新しいトレーニングフレームワークである。
本稿では,STSGモデルの分散シフトに対する堅牢性を評価するために,Robust Spatio-Temporal Scene Graph GenerationとRobust Scene Graph Precipationという2つの新しいタスクを導入する。
論文 参考訳(メタデータ) (2024-11-20T06:15:28Z) - Amplify Graph Learning for Recommendation via Sparsity Completion [16.32861024767423]
グラフ学習モデルは、協調フィルタリング(CF)ベースのレコメンデーションシステムに広くデプロイされている。
データ疎度の問題により、元の入力のグラフ構造は潜在的な肯定的な嗜好エッジを欠いている。
AGL-SC(Amplify Graph Learning framework)を提案する。
論文 参考訳(メタデータ) (2024-06-27T08:26:20Z) - Generative Modelling of Structurally Constrained Graphs [44.28728853270471]
ConStructは、グラフ拡散モデルが平面性や非巡回性といった特定の性質に厳しい制約を組み込むことを可能にする新しいフレームワークである。
我々のアプローチは、サンプルグラフが、前と逆の両方の過程において、軌跡全体を通して指定された性質を満たすグラフの領域内にあることを保証します。
論文 参考訳(メタデータ) (2024-06-25T07:54:32Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - Improving Knowledge Graph Entity Alignment with Graph Augmentation [11.1094009195297]
異なる知識グラフ(KG)をまたいだ等価エンティティをリンクするエンティティアライメント(EA)は、知識融合において重要な役割を果たす。
近年、グラフニューラルネットワーク(GNN)は、多くの埋め込みベースのEA手法でうまく適用されている。
グラフの強化により、マージンベースのアライメント学習とコントラッシブなエンティティ表現学習のための2つのグラフビューを作成する。
論文 参考訳(メタデータ) (2023-04-28T01:22:47Z) - Localized Contrastive Learning on Graphs [110.54606263711385]
局所グラフコントラスト学習(Local-GCL)という,シンプルだが効果的なコントラストモデルを導入する。
その単純さにもかかわらず、Local-GCLは、様々なスケールと特性を持つグラフ上の自己教師付きノード表現学習タスクにおいて、非常に競争力のある性能を達成する。
論文 参考訳(メタデータ) (2022-12-08T23:36:00Z) - GAP: A Graph-aware Language Model Framework for Knowledge Graph-to-Text
Generation [3.593955557310285]
KG-to-text生成の最近の改善は、微調整タスクの性能を高めるために設計された補助的な事前訓練タスクによるものである。
ここでは、既存の事前学習言語モデルにグラフ認識要素を融合させることで、最先端のモデルより優れ、追加の事前学習タスクによって課されるギャップを埋めることができることを示す。
論文 参考訳(メタデータ) (2022-04-13T23:53:37Z) - Towards Unsupervised Deep Graph Structure Learning [67.58720734177325]
本稿では,学習したグラフトポロジを外部ガイダンスなしでデータ自身で最適化する,教師なしグラフ構造学習パラダイムを提案する。
具体的には、元のデータから"アンカーグラフ"として学習目標を生成し、対照的な損失を用いてアンカーグラフと学習グラフとの一致を最大化する。
論文 参考訳(メタデータ) (2022-01-17T11:57:29Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。