論文の概要: Predicate correlation learning for scene graph generation
- arxiv url: http://arxiv.org/abs/2107.02713v1
- Date: Tue, 6 Jul 2021 16:24:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 13:44:43.193094
- Title: Predicate correlation learning for scene graph generation
- Title(参考訳): シーングラフ生成のための述語相関学習
- Authors: Leitian Tao, Li Mi, Nannan Li, Xianhang Cheng, Yaosi Hu, and Zhenzhong
Chen
- Abstract要約: 典型的なSGG(Scene Graph Generation)法では、述者のヘッドクラスとテールクラスのパフォーマンスに大きなギャップがあることが多い。
述語相関行列 (PCM) は述語対の関係を定量化するために定義される。
PCM は Predicate correlation Loss 関数 (L_PC$) に統合され、未注釈クラスの回避勾配を減少させる。
- 参考スコア(独自算出の注目度): 46.097869554455336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a typical Scene Graph Generation (SGG) method, there is often a large gap
in the performance of the predicates' head classes and tail classes. This
phenomenon is mainly caused by the semantic overlap between different
predicates as well as the long-tailed data distribution. In this paper, a
Predicate Correlation Learning (PCL) method for SGG is proposed to address the
above two problems by taking the correlation between predicates into
consideration. To describe the semantic overlap between strong-correlated
predicate classes, a Predicate Correlation Matrix (PCM) is defined to quantify
the relationship between predicate pairs, which is dynamically updated to
remove the matrix's long-tailed bias. In addition, PCM is integrated into a
Predicate Correlation Loss function ($L_{PC}$) to reduce discouraging gradients
of unannotated classes. The proposed method is evaluated on Visual Genome
benchmark, where the performance of the tail classes is significantly improved
when built on the existing methods.
- Abstract(参考訳): 典型的なシーングラフ生成(sgg)メソッドでは、述語のヘッドクラスとテールクラスのパフォーマンスに大きなギャップがあることが多い。
この現象は主に、異なる述語間の意味的重複と、ロングテールデータ分布によって引き起こされる。
本稿では,SGGの述語相関学習(PCL)手法を提案し,述語間の相関を考慮し,上記の2つの問題に対処する。
強相関述語クラス間の意味的重複を記述するために、述語相関行列(PCM)が定義され、述語ペア間の関係を定量化し、行列の長い尾バイアスを取り除くために動的に更新される。
さらに、PCM を述語相関損失関数 (L_{PC}$) に統合し、無注釈クラスの回避勾配を減少させる。
提案手法はVisual Genomeベンチマークで評価され,既存の手法を用いた場合,テールクラスの性能が大幅に向上する。
関連論文リスト
- Multi-Label Meta Weighting for Long-Tailed Dynamic Scene Graph
Generation [55.429541407920304]
対象と対象のペア間の述語認識は、本質的に不均衡であり、複数ラベルである。
最近の最先端の手法は、主に最も頻繁に発生する述語クラスに焦点を当てている。
偏りのある述語分布を扱うために,多言語メタラーニングフレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-16T18:14:23Z) - Contextual Dictionary Lookup for Knowledge Graph Completion [32.493168863565465]
知識グラフ補完(KGC)は、知識グラフの不完全性(KGs)を解決することを目的として、既知の三重項から欠落するリンクを予測する。
既存の埋め込みモデルは、それぞれの関係を一意なベクトルにマッピングし、異なる実体の下でそれらの特定の粒度のセマンティクスを見渡す。
本稿では,従来の埋め込みモデルを用いて,関係の微粒なセマンティクスをエンド・ツー・エンドで学習することのできる,文脈辞書検索を利用した新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-13T12:13:41Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Unbiased Scene Graph Generation using Predicate Similarities [7.9112365100345965]
シーングラフは、画像に示されるオブジェクト間の関係のグラフィカル表現としてコンピュータビジョンに広く応用されている。
これらの応用は、長い尾の述語分布に起因する偏りのある訓練のため、まだ開発段階に達していない。
同様の述語群に対して,プロセスをいくつかのきめ細かい分類器に分割する新しい分類法を提案する。
Visual Genomeデータセットの広範な実験結果から,提案手法と既存のデバイアス手法を組み合わせることで,SGCls/SGDetタスクに挑戦する尾述語の性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-10-03T13:28:01Z) - Hierarchical Memory Learning for Fine-Grained Scene Graph Generation [49.39355372599507]
本稿では,HML(Hierarchical Memory Learning)フレームワークを提案する。
粗い述語と細かな述語を自律的に分割した後、モデルはまず粗い述語で訓練され、次に細かな述語を学ぶ。
論文 参考訳(メタデータ) (2022-03-14T08:01:14Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。