論文の概要: Energy-Based Learning for Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2103.02221v1
- Date: Wed, 3 Mar 2021 07:11:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-06 12:44:54.874569
- Title: Energy-Based Learning for Scene Graph Generation
- Title(参考訳): エネルギーに基づくシーングラフ生成学習
- Authors: Mohammed Suhail, Abhay Mittal, Behjat Siddiquie, Chris Broaddus, Jayan
Eledath, Gerard Medioni, Leonid Sigal
- Abstract要約: シーングラフを生成するための新しいエネルギーベース学習フレームワークを提案する。
提案する定式化により,シーングラフの構造を出力空間に効率的に組み込むことができる。
提案するフレームワークを用いて,既存の最先端モデルをトレーニングし,大幅な性能向上を実現する。
- 参考スコア(独自算出の注目度): 26.500496033477127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional scene graph generation methods are trained using cross-entropy
losses that treat objects and relationships as independent entities. Such a
formulation, however, ignores the structure in the output space, in an
inherently structured prediction problem. In this work, we introduce a novel
energy-based learning framework for generating scene graphs. The proposed
formulation allows for efficiently incorporating the structure of scene graphs
in the output space. This additional constraint in the learning framework acts
as an inductive bias and allows models to learn efficiently from a small number
of labels. We use the proposed energy-based framework to train existing
state-of-the-art models and obtain a significant performance improvement, of up
to 21% and 27%, on the Visual Genome and GQA benchmark datasets, respectively.
Furthermore, we showcase the learning efficiency of the proposed framework by
demonstrating superior performance in the zero- and few-shot settings where
data is scarce.
- Abstract(参考訳): 伝統的なシーングラフ生成法は、オブジェクトと関係を独立したエンティティとして扱うクロスエントロピー損失を用いて訓練される。
しかし、そのような定式化は、本質的に構造化された予測問題において、出力空間の構造を無視する。
本研究では,シーングラフ生成のための新しいエネルギーベース学習フレームワークを提案する。
提案する定式化により,シーングラフの構造を出力空間に効率的に組み込むことができる。
学習フレームワークのこの追加制約は、誘導バイアスとして機能し、モデルが少数のラベルから効率的に学習できるようにします。
提案したエネルギーベースのフレームワークを使用して,既存の最先端モデルをトレーニングし,それぞれVisual GenomeとGQAベンチマークデータセット上で,最大21%,最大27%の大幅なパフォーマンス向上を実現している。
さらに,データ不足のゼロショットおよびマイショット設定において,優れた性能を示すことにより,提案フレームワークの学習効率を示す。
関連論文リスト
- Towards Unbiased and Robust Spatio-Temporal Scene Graph Generation and Anticipation [10.678727237318503]
Imparは、カリキュラム学習と損失マスキングを利用してバイアス発生と予測モデリングを緩和する新しいトレーニングフレームワークである。
本稿では,STSGモデルの分散シフトに対する堅牢性を評価するために,Robust Spatio-Temporal Scene Graph GenerationとRobust Scene Graph Precipationという2つの新しいタスクを導入する。
論文 参考訳(メタデータ) (2024-11-20T06:15:28Z) - Amplify Graph Learning for Recommendation via Sparsity Completion [16.32861024767423]
グラフ学習モデルは、協調フィルタリング(CF)ベースのレコメンデーションシステムに広くデプロイされている。
データ疎度の問題により、元の入力のグラフ構造は潜在的な肯定的な嗜好エッジを欠いている。
AGL-SC(Amplify Graph Learning framework)を提案する。
論文 参考訳(メタデータ) (2024-06-27T08:26:20Z) - Generative Modelling of Structurally Constrained Graphs [44.28728853270471]
ConStructは,平面性や非巡回性といった特定の特性をハードコントラストグラフ拡散モデルに組み込むことのできる,新しいフレームワークである。
我々のアプローチは、サンプルグラフがグラフの領域内にあることを保証し、前と逆の両方の過程において、軌道全体を通して指定された性質を検証する。
論文 参考訳(メタデータ) (2024-06-25T07:54:32Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - GraphGLOW: Universal and Generalizable Structure Learning for Graph
Neural Networks [72.01829954658889]
本稿では,この新たな問題設定の数学的定義を紹介する。
一つのグラフ共有構造学習者と複数のグラフ固有GNNを協調する一般的なフレームワークを考案する。
十分に訓練された構造学習者は、微調整なしで、目に見えない対象グラフの適応的な構造を直接生成することができる。
論文 参考訳(メタデータ) (2023-06-20T03:33:22Z) - Improving Knowledge Graph Entity Alignment with Graph Augmentation [11.1094009195297]
異なる知識グラフ(KG)をまたいだ等価エンティティをリンクするエンティティアライメント(EA)は、知識融合において重要な役割を果たす。
近年、グラフニューラルネットワーク(GNN)は、多くの埋め込みベースのEA手法でうまく適用されている。
グラフの強化により、マージンベースのアライメント学習とコントラッシブなエンティティ表現学習のための2つのグラフビューを作成する。
論文 参考訳(メタデータ) (2023-04-28T01:22:47Z) - Localized Contrastive Learning on Graphs [110.54606263711385]
局所グラフコントラスト学習(Local-GCL)という,シンプルだが効果的なコントラストモデルを導入する。
その単純さにもかかわらず、Local-GCLは、様々なスケールと特性を持つグラフ上の自己教師付きノード表現学習タスクにおいて、非常に競争力のある性能を達成する。
論文 参考訳(メタデータ) (2022-12-08T23:36:00Z) - GAP: A Graph-aware Language Model Framework for Knowledge Graph-to-Text
Generation [3.593955557310285]
KG-to-text生成の最近の改善は、微調整タスクの性能を高めるために設計された補助的な事前訓練タスクによるものである。
ここでは、既存の事前学習言語モデルにグラフ認識要素を融合させることで、最先端のモデルより優れ、追加の事前学習タスクによって課されるギャップを埋めることができることを示す。
論文 参考訳(メタデータ) (2022-04-13T23:53:37Z) - Towards Unsupervised Deep Graph Structure Learning [67.58720734177325]
本稿では,学習したグラフトポロジを外部ガイダンスなしでデータ自身で最適化する,教師なしグラフ構造学習パラダイムを提案する。
具体的には、元のデータから"アンカーグラフ"として学習目標を生成し、対照的な損失を用いてアンカーグラフと学習グラフとの一致を最大化する。
論文 参考訳(メタデータ) (2022-01-17T11:57:29Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。