論文の概要: GPS-Net: Graph Property Sensing Network for Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2003.12962v1
- Date: Sun, 29 Mar 2020 07:22:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:39:52.199403
- Title: GPS-Net: Graph Property Sensing Network for Scene Graph Generation
- Title(参考訳): GPS-Net:シーングラフ生成のためのグラフ特性センシングネットワーク
- Authors: Xin Lin, Changxing Ding, Jinquan Zeng, Dacheng Tao
- Abstract要約: シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
- 参考スコア(独自算出の注目度): 91.60326359082408
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Scene graph generation (SGG) aims to detect objects in an image along with
their pairwise relationships. There are three key properties of scene graph
that have been underexplored in recent works: namely, the edge direction
information, the difference in priority between nodes, and the long-tailed
distribution of relationships. Accordingly, in this paper, we propose a Graph
Property Sensing Network (GPS-Net) that fully explores these three properties
for SGG. First, we propose a novel message passing module that augments the
node feature with node-specific contextual information and encodes the edge
direction information via a tri-linear model. Second, we introduce a node
priority sensitive loss to reflect the difference in priority between nodes
during training. This is achieved by designing a mapping function that adjusts
the focusing parameter in the focal loss. Third, since the frequency of
relationships is affected by the long-tailed distribution problem, we mitigate
this issue by first softening the distribution and then enabling it to be
adjusted for each subject-object pair according to their visual appearance.
Systematic experiments demonstrate the effectiveness of the proposed
techniques. Moreover, GPS-Net achieves state-of-the-art performance on three
popular databases: VG, OI, and VRD by significant gains under various settings
and metrics. The code and models are available at
\url{https://github.com/taksau/GPS-Net}.
- Abstract(参考訳): scene graph generation(sgg)は、画像内のオブジェクトとその対関係を検出することを目的としている。
近年の研究で過小評価されているシーングラフには,エッジ方向情報,ノード間の優先度差,長期にわたる関係分布という3つの重要な特性がある。
そこで本稿では,SGG の3つの特性を網羅する Graph Property Sensing Network (GPS-Net) を提案する。
まず,ノードの特徴をノード固有のコンテキスト情報で拡張し,三線形モデルを用いてエッジ方向情報を符号化する新しいメッセージパッシングモジュールを提案する。
第2に、トレーニング中のノード間の優先度の差を反映するノード優先性損失を導入する。
これは焦点損失の焦点パラメータを調整するマッピング関数を設計することによって達成される。
第3に、長い尾の分布問題によって関係の周波数が影響を受けるため、まず分布を軟化して、その視覚的外観に応じて各対象物対に適応させることにより、この問題を軽減する。
システム実験は,提案手法の有効性を実証する。
さらに、GPS-NetはVG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定やメトリクスの下で大幅に向上させる。
コードとモデルは \url{https://github.com/taksau/GPS-Net} で公開されている。
関連論文リスト
- SpaGBOL: Spatial-Graph-Based Orientated Localisation [15.324623975476348]
都市域内のクロスビューなジオローカライゼーションは、現在のデータセットや技術に空間的構造が欠如していることから、部分的には困難である。
本稿では,局所的な観測のシーケンスをモデル化するためのグラフ表現の利用と,対象位置の接続性を提案する。
論文 参考訳(メタデータ) (2024-09-23T20:04:29Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Network Intrusion Detection with Edge-Directed Graph Multi-Head Attention Networks [13.446986347747325]
本稿では,ネットワーク侵入検出のためのエッジ指向グラフマルチヘッドアテンションネットワーク(EDGMAT)を提案する。
EDGMATモデルでは,侵入検知モデルにマルチヘッドアテンション機構を導入し,マルチヘッドアテンション機構とエッジ特徴を組み合わせた付加的な重み学習を実現する。
論文 参考訳(メタデータ) (2023-10-26T12:30:11Z) - RU-Net: Regularized Unrolling Network for Scene Graph Generation [92.95032610978511]
シーングラフ生成(SGG)は、オブジェクトを検出し、各オブジェクト間の関係を予測することを目的としている。
既存のSGG法は,(1)あいまいな対象表現,2)関係予測の多様性の低下など,いくつかの問題に悩まされることが多い。
両問題に対処する正規化アンローリングネットワーク(RU-Net)を提案する。
論文 参考訳(メタデータ) (2022-05-03T04:21:15Z) - Relation Regularized Scene Graph Generation [206.76762860019065]
SGG(Scene Graph Generation)は、検出されたオブジェクトの上に構築され、オブジェクトのペアの視覚的関係を予測する。
本稿では,2つのオブジェクト間の関係を予測できる関係正規化ネットワーク(R2-Net)を提案する。
我々のR2-Netはオブジェクトラベルを効果的に洗練し、シーングラフを生成する。
論文 参考訳(メタデータ) (2022-02-22T11:36:49Z) - Graph Neural Networks with Feature and Structure Aware Random Walk [7.143879014059894]
典型的な好適なグラフでは、エッジを指向する可能性があり、エッジをそのまま扱うか、あるいは単純に非指向にするかは、GNNモデルの性能に大きな影響を与える。
そこで我々は,グラフの方向性を適応的に学習するモデルを開発し,ノード間の長距離相関を生かした。
論文 参考訳(メタデータ) (2021-11-19T08:54:21Z) - GraphMI: Extracting Private Graph Data from Graph Neural Networks [59.05178231559796]
GNNを反転させてトレーニンググラフのプライベートグラフデータを抽出することを目的とした textbfGraph textbfModel textbfInversion attack (GraphMI) を提案する。
具体的には,グラフ特徴の空間性と滑らかさを保ちながら,グラフエッジの離散性に対処する勾配モジュールを提案する。
エッジ推論のためのグラフトポロジ、ノード属性、ターゲットモデルパラメータを効率的に活用するグラフ自動エンコーダモジュールを設計する。
論文 参考訳(メタデータ) (2021-06-05T07:07:52Z) - Graph Feature Gating Networks [31.20878472589719]
本稿では,グラフ信号の雑音化問題に基づく一般グラフ特徴ゲーティングネットワーク(gfgn)を提案する。
また、GFGNの下で3つのグラフフィルターを導入し、機能寸法から異なるレベルのコントリビューションを可能にします。
論文 参考訳(メタデータ) (2021-05-10T16:33:58Z) - Structural Temporal Graph Neural Networks for Anomaly Detection in
Dynamic Graphs [54.13919050090926]
本稿では,動的グラフの異常エッジを検出するために,エンドツーエンドの時間構造グラフニューラルネットワークモデルを提案する。
特に,まずターゲットエッジを中心にした$h$ホップ囲むサブグラフを抽出し,各ノードの役割を識別するノードラベル機能を提案する。
抽出した特徴に基づき,GRU(Gated Recurrent Unit)を用いて,異常検出のための時間的情報を取得する。
論文 参考訳(メタデータ) (2020-05-15T09:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。