論文の概要: ReLIC-SGG: Relation Lattice Completion for Open-Vocabulary Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2604.22546v3
- Date: Tue, 28 Apr 2026 02:01:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 14:06:43.817663
- Title: ReLIC-SGG: Relation Lattice Completion for Open-Vocabulary Scene Graph Generation
- Title(参考訳): Relic-SGG:Open-Vocabulary Scene Graph 生成のための関係格子補完
- Authors: Amir Hosseini, Sara Farahani, Xinyi Li, Suiyang Guang,
- Abstract要約: オープン語彙シーングラフ生成のための関係不完全性認識フレームワークである textbfRelic-SGG を提案する。
Relic-SGGは、開語彙述語間の類似性、包含、矛盾をモデル化するための意味的関係格子を構築する。
実験により、Relic-SGGは稀で目に見えない述語認識を改善し、行方不明な関係を回復することが示された。
- 参考スコア(独自算出の注目度): 5.184088650563149
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-vocabulary scene graph generation (SGG) aims to describe visual scenes with flexible relation phrases beyond a fixed predicate set. Existing methods usually treat annotated triplets as positives and all unannotated object-pair relations as negatives. However, scene graph annotations are inherently incomplete: many valid relations are missing, and the same interaction can be described at different granularities, e.g., \textit{on}, \textit{standing on}, \textit{resting on}, and \textit{supported by}. This issue becomes more severe in open-vocabulary SGG due to the much larger relation space. We propose \textbf{ReLIC-SGG}, a relation-incompleteness-aware framework that treats unannotated relations as latent variables rather than definite negatives. ReLIC-SGG builds a semantic relation lattice to model similarity, entailment, and contradiction among open-vocabulary predicates, and uses it to infer missing positive relations from visual-language compatibility, graph context, and semantic consistency. A positive-unlabeled graph learning objective further reduces false-negative supervision, while lattice-guided decoding produces compact and semantically consistent scene graphs. Experiments on conventional, open-vocabulary, and panoptic SGG benchmarks show that ReLIC-SGG improves rare and unseen predicate recognition and better recovers missing relations.
- Abstract(参考訳): Open-vocabulary scene graph generation (SGG) は、一定の述語集合を超えてフレキシブルな関係句を持つ視覚的なシーンを記述することを目的としている。
既存の方法は、アノテートされた三重項を正として扱い、すべてのアノテートされていないオブジェクトペア関係を負として扱う。
しかし、シーングラフのアノテーションは本質的に不完全であり、多くの有効な関係が欠落しており、同じ相互作用は、eg 、 \textit{on}、 \textit{standing on}、 \textit{resting on}、 \textit{ supporteded by}といった粒度で記述することができる。
この問題は、より大きい関係空間のため、開語彙SGGではより深刻になる。
本稿では,不完全性を考慮した関係不完全性認識フレームワークであるtextbf{Relic-SGG} を提案する。
Relic-SGGは、オープン語彙述語間の類似性、包含、矛盾をモデル化するための意味的関係格子を構築し、視覚言語との互換性、グラフコンテキスト、意味的整合性から欠落した肯定的関係を推測する。
肯定的未ラベルグラフ学習の目的は、さらに偽否定的な監督を減らし、格子誘導復号法はコンパクトで意味論的に一貫したシーングラフを生成する。
従来のオープンボキャブラリおよびパン光学SGGベンチマークの実験では、Relic-SGGは稀で目に見えない述語認識を改善し、欠落した関係を回復する。
関連論文リスト
- CAGE-SGG: Counterfactual Active Graph Evidence for Open-Vocabulary Scene Graph Generation [16.971992237358638]
Open-vocabulary scene graph generation (SGG) は、フレキシブルできめ細かな関係句で視覚的なシーンを記述することを目的としている。
本稿では,反実的関係検証に基づくエビデンスを包含したオープン語彙SGGフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-24T06:34:45Z) - Leveraging Predicate and Triplet Learning for Scene Graph Generation [31.09787444957997]
SGG(Scene Graph Generation)は、エンティティを特定し、関係トリプルを予測することを目的としている。
本稿では,大きめの述語に加えて細粒度三重項キューを利用するためのDRMネットワークを提案する。
提案手法は,Visual Genome, Open Image, GQAデータセット上での最先端性能を確立する。
論文 参考訳(メタデータ) (2024-06-04T07:23:41Z) - Relation Rectification in Diffusion Model [64.84686527988809]
本稿では,最初に生成できない関係を正確に表現するためにモデルを洗練することを目的とした,リレーション・リクティフィケーション(Relation Rectification)と呼ばれる新しいタスクを紹介する。
異種グラフ畳み込みネットワーク(HGCN)を利用した革新的な解を提案する。
軽量HGCNは、テキストエンコーダによって生成されたテキスト埋め込みを調整し、埋め込み空間におけるテキスト関係の正確な反映を保証する。
論文 参考訳(メタデータ) (2024-03-29T15:54:36Z) - Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention [69.36723767339001]
SGG(Scene Graph Generation)は、多くのコンピュータビジョンアプリケーションにおいて重要な構造化された表現を提供する。
我々はOvSGTRという名前の統一フレームワークを全体的視点から完全にオープンな語彙SGGに向けて提案する。
関係付きオープン語彙SGGのより困難な設定のために、提案手法は関係対応型事前学習を統合する。
論文 参考訳(メタデータ) (2023-11-18T06:49:17Z) - FloCoDe: Unbiased Dynamic Scene Graph Generation with Temporal Consistency and Correlation Debiasing [14.50214193838818]
FloCoDe: 動的シーングラフに対する不確実性減衰を伴うフロー認識時間と相関バイアス
本稿では,長い尾を持つクラスに対する非バイアス付き関係表現を学習するために,相関バイアスと相関に基づく損失を提案する。
論文 参考訳(メタデータ) (2023-10-24T14:59:51Z) - Hyper-relationship Learning Network for Scene Graph Generation [95.6796681398668]
本稿では,シーングラフ生成のためのハイパーリレーショナル学習ネットワークHLNを提案する。
我々は最も人気のあるSGGデータセット、すなわちVisual Genomeデータセット上でHLNを評価する。
例えば、提案されたHLNは、関係ごとのリコールを11.3%から13.1%に改善し、画像毎のリコールを19.8%から34.9%に維持する。
論文 参考訳(メタデータ) (2022-02-15T09:26:16Z) - Not All Relations are Equal: Mining Informative Labels for Scene Graph
Generation [48.21846438269506]
シーングラフ生成(SGG)は、オブジェクトのペア間の多様な相互作用をキャプチャすることを目的としている。
既存のSGG法では、トレーニングデータに様々なバイアスがあるため、視覚的およびテキスト的相関に関する複雑な推論が得られない。
本稿では,その情報性に基づいて関係ラベルを利用するSGGトレーニングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-26T14:34:12Z) - Dual ResGCN for Balanced Scene GraphGeneration [106.7828712878278]
本稿では,オブジェクト残差グラフ畳み込みネットワークと関係残差グラフ畳み込みネットワークからなる新しいモデルであるtextitdual ResGCNを提案する。
2つのネットワークは相互に補完的であり、前者はオブジェクトレベルのコンテキスト情報、すなわちオブジェクト間の接続をキャプチャする。
後者は、関係レベルのコンテキスト情報、すなわち関係間の関係を明示的にキャプチャするように設計されている。
論文 参考訳(メタデータ) (2020-11-09T07:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。