論文の概要: RU-Net: Regularized Unrolling Network for Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2205.01297v1
- Date: Tue, 3 May 2022 04:21:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 22:42:59.896500
- Title: RU-Net: Regularized Unrolling Network for Scene Graph Generation
- Title(参考訳): RU-Net: シーングラフ生成のための正規化アンロールネットワーク
- Authors: Xin Lin, Changxing Ding, Jing Zhang, Yibing Zhan, Dacheng Tao
- Abstract要約: シーングラフ生成(SGG)は、オブジェクトを検出し、各オブジェクト間の関係を予測することを目的としている。
既存のSGG法は,(1)あいまいな対象表現,2)関係予測の多様性の低下など,いくつかの問題に悩まされることが多い。
両問題に対処する正規化アンローリングネットワーク(RU-Net)を提案する。
- 参考スコア(独自算出の注目度): 92.95032610978511
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Scene graph generation (SGG) aims to detect objects and predict the
relationships between each pair of objects. Existing SGG methods usually suffer
from several issues, including 1) ambiguous object representations, as graph
neural network-based message passing (GMP) modules are typically sensitive to
spurious inter-node correlations, and 2) low diversity in relationship
predictions due to severe class imbalance and a large number of missing
annotations. To address both problems, in this paper, we propose a regularized
unrolling network (RU-Net). We first study the relation between GMP and graph
Laplacian denoising (GLD) from the perspective of the unrolling technique,
determining that GMP can be formulated as a solver for GLD. Based on this
observation, we propose an unrolled message passing module and introduce an
$\ell_p$-based graph regularization to suppress spurious connections between
nodes. Second, we propose a group diversity enhancement module that promotes
the prediction diversity of relationships via rank maximization. Systematic
experiments demonstrate that RU-Net is effective under a variety of settings
and metrics. Furthermore, RU-Net achieves new state-of-the-arts on three
popular databases: VG, VRD, and OI. Code is available at
https://github.com/siml3/RU-Net.
- Abstract(参考訳): シーングラフ生成(SGG)は、オブジェクトを検出し、各オブジェクト間の関係を予測することを目的としている。
既存のSGGメソッドは通常、いくつかの問題に悩まされる。
1) グラフニューラルネットワークを用いたメッセージパッシング(GMP)モジュールは、通常、突発的なノード間相関に敏感であり、曖昧なオブジェクト表現
2) 厳密なクラス不均衡と多数の欠落アノテーションによる関係予測の多様性が低かった。
本稿では,両問題に対処するため,正規化アンローリングネットワーク(RU-Net)を提案する。
我々はまず,GMPとグラフラプラシアン復調法(GLD)の関係を解法の観点から検討し,GMPをGLDの解法として定式化できることを決定した。
この観察に基づいて、未ロールメッセージパッシングモジュールを提案し、ノード間のスプリアス接続を抑制するために$\ell_p$ベースのグラフ正規化を導入する。
第2に,ランク最大化による関係性の予測を促進するグループ多様性拡張モジュールを提案する。
システム実験では、RU-Netは様々な設定やメトリクスの下で有効であることを示した。
さらに、ru-netはvg、vrd、oiという3つの人気のあるデータベースで最新技術を実現している。
コードはhttps://github.com/siml3/ru-netで入手できる。
関連論文リスト
- RBA-GCN: Relational Bilevel Aggregation Graph Convolutional Network for
Emotion Recognition [38.87080348908327]
本稿ではリレーショナル・バイレベル・アグリゲーショングラフ畳み込みネットワーク(RBA-GCN)について述べる。
グラフ生成モジュール(GGM)、類似性に基づくクラスタ構築モジュール(SCBM)、バイレベルアグリゲーションモジュール(BiAM)の3つのモジュールで構成されている。
IEMOCAPとMELDの両方のデータセットでは、RAB-GCNの重み付き平均F1スコアは、最も高度な手法よりも2.17$sim$5.21%改善されている。
論文 参考訳(メタデータ) (2023-08-18T11:29:12Z) - HL-Net: Heterophily Learning Network for Scene Graph Generation [90.2766568914452]
本稿では,シーングラフにおけるオブジェクト/リレーショナル間のホモフィリとヘテロフィリを探索する,新しいヘテロフィリズ学習ネットワーク(HL-Net)を提案する。
HL-Netは、適応的な再重み付け変換モジュールで、異なる層からの情報を適応的に統合し、オブジェクトのヘテロフィリとホモフィリの両方を利用する。
我々は、ビジュアルゲノム(VG)とオープンイメージ(OI)の2つの公開データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-03T06:00:29Z) - Relation Regularized Scene Graph Generation [206.76762860019065]
SGG(Scene Graph Generation)は、検出されたオブジェクトの上に構築され、オブジェクトのペアの視覚的関係を予測する。
本稿では,2つのオブジェクト間の関係を予測できる関係正規化ネットワーク(R2-Net)を提案する。
我々のR2-Netはオブジェクトラベルを効果的に洗練し、シーングラフを生成する。
論文 参考訳(メタデータ) (2022-02-22T11:36:49Z) - VQ-GNN: A Universal Framework to Scale up Graph Neural Networks using
Vector Quantization [70.8567058758375]
VQ-GNNは、Vector Quantization(VQ)を使用して、パフォーマンスを損なうことなく、畳み込みベースのGNNをスケールアップするための普遍的なフレームワークである。
我々のフレームワークは,グラフ畳み込み行列の低ランク版と組み合わせた量子化表現を用いて,GNNの「隣の爆発」問題を回避する。
論文 参考訳(メタデータ) (2021-10-27T11:48:50Z) - Hierarchical graph neural nets can capture long-range interactions [8.067880298298185]
与えられたグラフの多重解像度表現を利用する階層的メッセージパッシングモデルについて検討する。
これにより、ローカル情報を失うことなく、大きな受容領域にまたがる特徴の学習が容易になる。
階層グラフネット(HGNet)を導入し、任意の2つの接続ノードに対して、最大対数長のメッセージパスパスが存在することを保証します。
論文 参考訳(メタデータ) (2021-07-15T16:24:22Z) - Policy-GNN: Aggregation Optimization for Graph Neural Networks [60.50932472042379]
グラフニューラルネットワーク(GNN)は、局所的なグラフ構造をモデル化し、隣人からの情報を集約することで階層的なパターンを捉えることを目的としている。
複雑なグラフとスパースな特徴を与えられた各ノードに対して効果的なアグリゲーション戦略を開発することは難しい課題である。
本稿では,GNNのサンプリング手順とメッセージパッシングを複合学習プロセスにモデル化するメタ政治フレームワークであるPolicy-GNNを提案する。
論文 参考訳(メタデータ) (2020-06-26T17:03:06Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。