論文の概要: CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2009.07526v2
- Date: Tue, 8 Jun 2021 06:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 23:18:29.579263
- Title: CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation
- Title(参考訳): CogTree: 曖昧なシーングラフ生成のための認知木損失
- Authors: Jing Yu, Yuan Chai, Yujing Wang, Yue Hu, Qi Wu
- Abstract要約: SGG(Scene Graph Generation)は、現実のシナリオでバイアスデータに直面すると満足できない。
本研究では,非バイアスSGGに対する新規なデバイアス認知木(CogTree)の損失を提案する。
この損失はモデルに依存しず、いくつかの最先端モデルの性能を一貫して向上させる。
- 参考スコア(独自算出の注目度): 23.55530043171931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene graphs are semantic abstraction of images that encourage visual
understanding and reasoning. However, the performance of Scene Graph Generation
(SGG) is unsatisfactory when faced with biased data in real-world scenarios.
Conventional debiasing research mainly studies from the view of balancing data
distribution or learning unbiased models and representations, ignoring the
correlations among the biased classes. In this work, we analyze this problem
from a novel cognition perspective: automatically building a hierarchical
cognitive structure from the biased predictions and navigating that hierarchy
to locate the relationships, making the tail relationships receive more
attention in a coarse-to-fine mode. To this end, we propose a novel debiasing
Cognition Tree (CogTree) loss for unbiased SGG. We first build a cognitive
structure CogTree to organize the relationships based on the prediction of a
biased SGG model. The CogTree distinguishes remarkably different relationships
at first and then focuses on a small portion of easily confused ones. Then, we
propose a debiasing loss specially for this cognitive structure, which supports
coarse-to-fine distinction for the correct relationships. The loss is
model-agnostic and consistently boosting the performance of several
state-of-the-art models. The code is available at:
https://github.com/CYVincent/Scene-Graph-Transformer-CogTree.
- Abstract(参考訳): シーングラフは、視覚的理解と推論を促進するイメージのセマンティック抽象化である。
しかし、実世界のシナリオでバイアスデータに直面すると、SGG(Scene Graph Generation)のパフォーマンスは満足できない。
従来のデバイアス研究は主にデータ分布のバランスや偏りのないモデルや表現の学習の観点から研究を行い、偏りのあるクラス間の相関を無視している。
本研究では、偏りのある予測から階層的な認知構造を自動的に構築し、その階層をナビゲートして関係を見極めることによって、尾関係が粗いモードでより注目されるようにする。
そこで本研究では,未偏りsggに対する新しいdebiasing cognition tree (cogtree) 損失を提案する。
まず、偏りのあるSGGモデルの予測に基づいて関係を整理する認知構造CagTreeを構築する。
CogTreeは、最初は著しく異なる関係を区別し、混乱しやすい関係に焦点を合わせている。
そして,この認知構造に特化して認知障害を生じさせ,適切な関係の粗大な識別を支援する。
損失はモデルに依存しず、最先端モデルのパフォーマンスを一貫して向上させる。
コードは、https://github.com/CYVincent/Scene-Graph-Transformer-CogTreeで入手できる。
関連論文リスト
- Tensor-based Graph Learning with Consistency and Specificity for Multi-view Clustering [20.925436328405574]
一貫性と特異性を同時に検討する新しい多視点グラフ学習フレームワークを提案する。
我々は、ノイズフリーグラフ融合のための新しいテンソルベースのターゲットグラフ学習パラダイムを定式化する。
6つのデータセットの実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2024-03-27T09:30:50Z) - Graph Out-of-Distribution Generalization via Causal Intervention [69.70137479660113]
本稿では,ノードレベルの分散シフトの下で頑健なグラフニューラルネットワーク(GNN)をトレーニングするための,概念的に単純だが原則化されたアプローチを提案する。
本手法は,環境推定器と熟練GNN予測器を協調する因果推論に基づく新たな学習目標を提案する。
本モデルでは,様々な分散シフトによる一般化を効果的に向上し,グラフOOD一般化ベンチマーク上での最先端の精度を最大27.4%向上させることができる。
論文 参考訳(メタデータ) (2024-02-18T07:49:22Z) - Vision Relation Transformer for Unbiased Scene Graph Generation [31.29954125135073]
現在のシーングラフ生成 (SGG) 法は, 関連符号化プロセスにおいて, 実体の局所レベルに関する情報損失に悩まされる。
本稿では,新しい局所レベルの実体関係エンコーダであるビジョンrElation TransfOrmer(VETO)を紹介する。
VETO+MEETは10倍の精度で予測性能を最大47パーセント向上させることを示した。
論文 参考訳(メタデータ) (2023-08-18T11:15:31Z) - Rethinking Explaining Graph Neural Networks via Non-parametric Subgraph
Matching [68.35685422301613]
そこで我々はMatchExplainerと呼ばれる新しい非パラメトリックな部分グラフマッチングフレームワークを提案し、説明的部分グラフを探索する。
ターゲットグラフと他のインスタンスを結合し、ノードに対応する距離を最小化することで最も重要な結合部分構造を識別する。
合成および実世界のデータセットの実験は、最先端のパラメトリックベースラインをかなりのマージンで上回り、MatchExplainerの有効性を示す。
論文 参考訳(メタデータ) (2023-01-07T05:14:45Z) - Debiasing Graph Neural Networks via Learning Disentangled Causal
Substructure [46.86463923605841]
本稿では、重度バイアスのあるトレーニンググラフについて、グラフ分類調査を行う。
我々は、GNNが常に決定を下すために急激な相関関係を探索する傾向があることに気付きました。
本稿では、因果部分構造とバイアス部分構造を学習するための一般的な非絡み合いGNNフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T13:55:52Z) - TREE-G: Decision Trees Contesting Graph Neural Networks [33.364191419692105]
TREE-Gは、グラフデータに特化した新しい分割関数を導入することで、標準的な決定木を変更する。
グラフニューラルネットワーク(GNN)やグラフカーネル(Graph Kernels)などのグラフ学習アルゴリズムでは,TREE-Gが他のツリーベースモデルより一貫して優れていることが示されています。
論文 参考訳(メタデータ) (2022-07-06T15:53:17Z) - Biasing Like Human: A Cognitive Bias Framework for Scene Graph
Generation [20.435023745201878]
本稿では,視覚に基づく表現のガイダンスとして,人間がラベル言語の特徴をどのように取り入れるかをシミュレートする,新しい3パラダイムフレームワークを提案する。
私たちのフレームワークはどんなシーングラフモデルにも依存しません。
論文 参考訳(メタデータ) (2022-03-17T08:29:52Z) - Deconfounded Training for Graph Neural Networks [98.06386851685645]
本稿では, コンバウンディング効果を緩和し, 臨界情報に対するラッチを緩和する新しいDecon Training(DTP)のパラダイムを提案する。
具体的には、注意モジュールを用いて臨界部分グラフと自明部分グラフをアンタングル化する。
これにより、GNNは、ラベルとの関係が複数のディストリビューションで堅牢である、より信頼性の高いサブグラフをキャプチャできる。
論文 参考訳(メタデータ) (2021-12-30T15:22:35Z) - ExplaGraphs: An Explanation Graph Generation Task for Structured
Commonsense Reasoning [65.15423587105472]
スタンス予測のための説明グラフ生成の新しい生成および構造化コモンセンスリゾニングタスク(および関連するデータセット)を紹介します。
具体的には、信念と議論が与えられた場合、モデルは、議論が信念を支持しているかどうかを予測し、予測されたスタンスに対する非自明で完全で曖昧な説明として機能する常識強化グラフを生成する必要がある。
グラフの83%は、様々な構造と推論深度を持つ外部のコモンセンスノードを含んでいる。
論文 参考訳(メタデータ) (2021-04-15T17:51:36Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。