論文の概要: Unbiased Scene Graph Generation via Two-stage Causal Modeling
- arxiv url: http://arxiv.org/abs/2307.05276v1
- Date: Tue, 11 Jul 2023 14:11:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 14:45:03.644932
- Title: Unbiased Scene Graph Generation via Two-stage Causal Modeling
- Title(参考訳): 2段階因果モデルによる未バイアスシーングラフ生成
- Authors: Shuzhou Sun, Shuaifeng Zhi, Qing Liao, Janne Heikkil\"a, Li Liu
- Abstract要約: シーングラフ生成(SGG)タスクのための2段階因果モデリング(TsCM)を提案する。
TsCMは、長期にわたる分布と意味的混乱を共同創設者として、構造因果モデル(Structure Causal Model, SCM)に取り込み、因果的介入を2段階に分離する。
提案手法は, 平均リコール率の観点から, 最先端の性能を実現することができる。
- 参考スコア(独自算出の注目度): 11.390135312161044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the impressive performance of recent unbiased Scene Graph Generation
(SGG) methods, the current debiasing literature mainly focuses on the
long-tailed distribution problem, whereas it overlooks another source of bias,
i.e., semantic confusion, which makes the SGG model prone to yield false
predictions for similar relationships. In this paper, we explore a debiasing
procedure for the SGG task leveraging causal inference. Our central insight is
that the Sparse Mechanism Shift (SMS) in causality allows independent
intervention on multiple biases, thereby potentially preserving head category
performance while pursuing the prediction of high-informative tail
relationships. However, the noisy datasets lead to unobserved confounders for
the SGG task, and thus the constructed causal models are always
causal-insufficient to benefit from SMS. To remedy this, we propose Two-stage
Causal Modeling (TsCM) for the SGG task, which takes the long-tailed
distribution and semantic confusion as confounders to the Structural Causal
Model (SCM) and then decouples the causal intervention into two stages. The
first stage is causal representation learning, where we use a novel Population
Loss (P-Loss) to intervene in the semantic confusion confounder. The second
stage introduces the Adaptive Logit Adjustment (AL-Adjustment) to eliminate the
long-tailed distribution confounder to complete causal calibration learning.
These two stages are model agnostic and thus can be used in any SGG model that
seeks unbiased predictions. Comprehensive experiments conducted on the popular
SGG backbones and benchmarks show that our TsCM can achieve state-of-the-art
performance in terms of mean recall rate. Furthermore, TsCM can maintain a
higher recall rate than other debiasing methods, which indicates that our
method can achieve a better tradeoff between head and tail relationships.
- Abstract(参考訳): 最近の非バイアス付きシーングラフ生成(SGG)手法の顕著な性能にもかかわらず、現在のデバイアスング文献は主に長い尾の分布問題に焦点をあてているが、一方で別のバイアス源、すなわち意味的混乱を見落としており、SGGモデルは類似の関係について誤った予測をしがちである。
本稿では,因果推論を利用したSGGタスクのデバイアス処理について検討する。
我々の中心的な洞察は、因果関係におけるスパースメカニズムシフト(SMS)は、複数のバイアスに独立して介入することが可能であり、高いインフォーマルな尾関係の予測を追求しながら、ヘッドカテゴリのパフォーマンスを維持できるということである。
しかし、ノイズの多いデータセットは、SGGタスクの保存されていない共同創設者につながるため、構築された因果モデルは常にSMSの恩恵を受けるのに十分な因果関係である。
そこで本稿では,SGGタスクの2段階因果モデリング(TsCM)を提案する。これは,SCM(Structure Causal Model)の創設者としての長期分布と意味的混乱を,因果的介入を2段階に分解するものである。
最初の段階は因果表現学習(causal representation learning)で、新しい集団損失(p-loss)を使用して意味的混乱に介入する。
第2段階は適応ロジット調整(アダプティブロジット調整)を導入し、ロングテールの分散共同設立者が因果的校正学習を完了するのをなくす。
これら2つのステージはモデル非依存であり、偏りのない予測を求める任意のsggモデルで使用できる。
一般的なSGGバックボーンとベンチマークで実施した総合的な実験は、我々のTsCMが平均リコール率で最先端のパフォーマンスを達成できることを示している。
さらに,tscmは,他のデバイアス法よりも高いリコール率を維持することができ,本手法が頭と尾の関係をよりよくトレードオフできることを示す。
関連論文リスト
- Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Dual-branch Hybrid Learning Network for Unbiased Scene Graph Generation [87.13847750383778]
シーングラフ生成のための頭部述語と尾部述語の両方を扱うDual-branch Hybrid Learning Network (DHL)を提案する。
提案手法は,VGおよびGQAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-16T11:53:50Z) - Adaptive Fine-Grained Predicates Learning for Scene Graph Generation [122.4588401267544]
一般的なシーングラフ生成(SGG)モデルは、頭部の述語を予測する傾向があり、再バランス戦略は尾のカテゴリを好む。
本稿では,SGGの難解な述語を識別することを目的とした適応的微粒述語学習(FGPL-A)を提案する。
提案したモデル非依存戦略は,VG-SGGおよびGQA-SGGデータセットのベンチマークモデルの性能を最大175%,Mean Recall@100では76%向上させ,新たな最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-11T03:37:57Z) - Diffusion Causal Models for Counterfactual Estimation [18.438307666925425]
本稿では,観測画像データから因果構造を推定する作業について考察する。
Diff-SCMは,近年の発電エネルギーモデルの発展を基盤とした構造因果モデルである。
Diff-SCMはMNISTデータに基づくベースラインよりも現実的で最小限のデファクトアルを生成しており、ImageNetデータにも適用可能である。
論文 参考訳(メタデータ) (2022-02-21T12:23:01Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - Identification of Latent Variables From Graphical Model Residuals [0.0]
本稿では,推定モデルの残差から遅延空間のプロキシを反復的に導出することにより,DAGを推定する際に潜伏空間を制御する新しい手法を提案する。
結果の予測の改善は本質的にカプセル化されており,既成モデルと比較して一定の限界を超えないことを示す。
論文 参考訳(メタデータ) (2021-01-07T02:28:49Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。