論文の概要: Addressing Class Imbalance in Scene Graph Parsing by Learning to
Contrast and Score
- arxiv url: http://arxiv.org/abs/2009.13331v2
- Date: Mon, 5 Oct 2020 13:06:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:06:37.786857
- Title: Addressing Class Imbalance in Scene Graph Parsing by Learning to
Contrast and Score
- Title(参考訳): コントラストとスコアの学習によるシーングラフ解析におけるクラス不均衡の解消
- Authors: He Huang, Shunta Saito, Yuta Kikuchi, Eiichi Matsumoto, Wei Tang,
Philip S. Yu
- Abstract要約: シーングラフ解析は、画像シーン内のオブジェクトを検出し、それらの関係を認識することを目的としている。
最近の手法は、いくつかの人気のあるベンチマークで高い平均スコアを達成しているが、稀な関係を検出するには失敗している。
本稿では,クラス不均衡問題を解決するために,分類とランキングの新たな統合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 65.18522219013786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scene graph parsing aims to detect objects in an image scene and recognize
their relations. Recent approaches have achieved high average scores on some
popular benchmarks, but fail in detecting rare relations, as the highly
long-tailed distribution of data biases the learning towards frequent labels.
Motivated by the fact that detecting these rare relations can be critical in
real-world applications, this paper introduces a novel integrated framework of
classification and ranking to resolve the class imbalance problem in scene
graph parsing. Specifically, we design a new Contrasting Cross-Entropy loss,
which promotes the detection of rare relations by suppressing incorrect
frequent ones. Furthermore, we propose a novel scoring module, termed as
Scorer, which learns to rank the relations based on the image features and
relation features to improve the recall of predictions. Our framework is simple
and effective, and can be incorporated into current scene graph models.
Experimental results show that the proposed approach improves the current
state-of-the-art methods, with a clear advantage of detecting rare relations.
- Abstract(参考訳): シーングラフ解析は、画像シーン内のオブジェクトを検出し、それらの関係を認識することを目的としている。
最近の手法は、いくつかの人気のあるベンチマークで高い平均スコアを達成しているが、データ分布の長期分布が頻繁なラベルに対する学習に偏っているため、稀な関係の検出には失敗している。
本稿では,これらの稀な関係の検出が現実の応用において重要であるという事実から,シーングラフ解析におけるクラス不均衡問題を解決するために,分類とランキングの新たな統合フレームワークを提案する。
具体的には,不正確な頻繁な関係を抑圧することにより,希少な関係の検出を促進する新しい交叉エントロピー損失をデザインする。
さらに,画像特徴と関係特徴に基づいて関係をランク付けし,予測のリコールを改善する新しいスコアリングモジュールScorerを提案する。
私たちのフレームワークはシンプルで効果的で、現在のシーングラフモデルに組み込むことができます。
実験の結果, 提案手法が最先端の手法を改善し, 希少な関係を検出することの利点を明らかにした。
関連論文リスト
- Robust Contrastive Learning against Noisy Views [79.71880076439297]
ノイズの多い視点に対して頑健な新しいコントラスト損失関数を提案する。
提案手法は,最新の画像,ビデオ,グラフのコントラスト学習ベンチマークに対して一貫した改善を提供する。
論文 参考訳(メタデータ) (2022-01-12T05:24:29Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z) - One-shot Learning for Temporal Knowledge Graphs [49.41854171118697]
時間的知識グラフにおけるリンク予測のためのワンショット学習フレームワークを提案する。
提案手法は,実体間の時間的相互作用を効果的に符号化する自己認識機構を用いる。
実験の結果,提案アルゴリズムは2つのよく研究されたベンチマークにおいて,アートベースラインの状態よりも優れていた。
論文 参考訳(メタデータ) (2020-10-23T03:24:44Z) - Generative Compositional Augmentations for Scene Graph Prediction [27.535630110794855]
シーングラフの形で画像からオブジェクトとその関係を推定することは、視覚と言語を交わす多くのアプリケーションで有用である。
本稿では,この課題において,長い尾データ分布から生じる合成一般化の課題について考察する。
本研究では,条件付き生成逆数ネットワーク(GAN)に基づくモデルの提案と実証研究を行い,乱れたシーングラフの視覚的特徴を生成する。
論文 参考訳(メタデータ) (2020-07-11T12:11:53Z) - Explanation-based Weakly-supervised Learning of Visual Relations with
Graph Networks [7.199745314783952]
本稿では,最小画像レベルの述語ラベルに依存した視覚的関係検出手法を提案する。
グラフニューラルネットワークは、検出されたオブジェクトのグラフ表現から画像中の述語を分類するように訓練され、ペア関係の帰納バイアスを暗黙的に符号化する。
本稿では,3つの多種多様かつ難解なデータセットに対して,最新の完全および弱教師付き手法に匹敵する結果を提示する。
論文 参考訳(メタデータ) (2020-06-16T23:14:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。