論文の概要: Make Graph-based Referring Expression Comprehension Great Again through Expression-guided Dynamic Gating and Regression
- arxiv url: http://arxiv.org/abs/2409.03385v1
- Date: Thu, 5 Sep 2024 09:44:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 21:00:20.803729
- Title: Make Graph-based Referring Expression Comprehension Great Again through Expression-guided Dynamic Gating and Regression
- Title(参考訳): 表現誘導動的ゲーティングと回帰によるグラフに基づく参照表現の理解
- Authors: Jingcheng Ke, Dele Wang, Jun-Cheng Chen, I-Hong Jhuo, Chia-Wen Lin, Yen-Yu Lin,
- Abstract要約: そこで我々は,動的ゲート制約 (DGC) と呼ばれる部分表現で導かれるプラグ・アンド・アダプティブ・モジュールを導入し,推論中に無関係な提案を適応的に無効にすることができる。
また、位置予測を洗練させるために、式誘導回帰戦略(EGR)を導入する。
提案したグラフベースの手法は,保持を伴わずに,最新技術(SOTA)変換方式よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 44.36417883611282
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: One common belief is that with complex models and pre-training on large-scale datasets, transformer-based methods for referring expression comprehension (REC) perform much better than existing graph-based methods. We observe that since most graph-based methods adopt an off-the-shelf detector to locate candidate objects (i.e., regions detected by the object detector), they face two challenges that result in subpar performance: (1) the presence of significant noise caused by numerous irrelevant objects during reasoning, and (2) inaccurate localization outcomes attributed to the provided detector. To address these issues, we introduce a plug-and-adapt module guided by sub-expressions, called dynamic gate constraint (DGC), which can adaptively disable irrelevant proposals and their connections in graphs during reasoning. We further introduce an expression-guided regression strategy (EGR) to refine location prediction. Extensive experimental results on the RefCOCO, RefCOCO+, RefCOCOg, Flickr30K, RefClef, and Ref-reasoning datasets demonstrate the effectiveness of the DGC module and the EGR strategy in consistently boosting the performances of various graph-based REC methods. Without any pretaining, the proposed graph-based method achieves better performance than the state-of-the-art (SOTA) transformer-based methods.
- Abstract(参考訳): 1つの一般的な信念は、複雑なモデルと大規模なデータセットで事前学習を行うことで、表現理解(REC)を参照するトランスフォーマーベースの手法は、既存のグラフベースの手法よりもはるかに優れた性能を発揮するということである。
グラフベースのほとんどの手法では、対象物(すなわち、対象物検知器によって検出された領域)を見つけるためにオフ・ザ・シェルフ検出器を採用するため、(1)推論中に多数の無関係物によって生じる有意なノイズの存在、(2)提供された検出器に起因する不正確な局所化結果の2つの課題に直面している。
これらの問題に対処するために,動的ゲート制約 (DGC) と呼ばれる部分表現で導かれるプラグイン・アンド・アダプティブ・モジュールを導入する。
さらに、位置予測を洗練させるために、式誘導回帰戦略(EGR)を導入する。
RefCOCO、RefCOCO+、RefCOCOg、Flickr30K、RefClef、Ref-reasoningデータセットの大規模な実験結果は、さまざまなグラフベースのRECメソッドのパフォーマンスを一貫して向上させるDGCモジュールとEGR戦略の有効性を示している。
提案したグラフベースの手法は,保持を伴わずに,最新技術(SOTA)変換方式よりも優れた性能を実現する。
関連論文リスト
- Explanation-Preserving Augmentation for Semi-Supervised Graph Representation Learning [13.494832603509897]
グラフ表現学習(GRL)は,ノード分類やグラフ分類といった幅広いタスクのパフォーマンス向上を実現するための有効な手法として登場した。
本稿では,拡張グラフの生成にグラフ説明手法を活用する新しい手法である Explanation-Preserving Augmentation (EPA) を提案する。
EPAはまず、グラフのセマンティクスに最も関係のある部分構造(説明)を推測するために、グラフ説明器を訓練するために少数のラベルを使用する。
論文 参考訳(メタデータ) (2024-10-16T15:18:03Z) - Disentangled Generative Graph Representation Learning [51.59824683232925]
本稿では,自己教師型学習フレームワークであるDiGGR(Disentangled Generative Graph Representation Learning)を紹介する。
潜伏要因を学習し、それをグラフマスクモデリングのガイドとして活用することを目的としている。
2つの異なるグラフ学習タスクのための11の公開データセットの実験は、DiGGRが従来よりも一貫して多くの自己教師付きメソッドを上回っていることを示している。
論文 参考訳(メタデータ) (2024-08-24T05:13:02Z) - Amplify Graph Learning for Recommendation via Sparsity Completion [16.32861024767423]
グラフ学習モデルは、協調フィルタリング(CF)ベースのレコメンデーションシステムに広くデプロイされている。
データ疎度の問題により、元の入力のグラフ構造は潜在的な肯定的な嗜好エッジを欠いている。
AGL-SC(Amplify Graph Learning framework)を提案する。
論文 参考訳(メタデータ) (2024-06-27T08:26:20Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Whether you can locate or not? Interactive Referring Expression
Generation [12.148963878497243]
本稿では,実際のRECモデルと対話可能な対話型REG(IREG)モデルを提案する。
IREGは、一般的な評価指標において、過去の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2023-08-19T10:53:32Z) - Localized Contrastive Learning on Graphs [110.54606263711385]
局所グラフコントラスト学習(Local-GCL)という,シンプルだが効果的なコントラストモデルを導入する。
その単純さにもかかわらず、Local-GCLは、様々なスケールと特性を持つグラフ上の自己教師付きノード表現学習タスクにおいて、非常に競争力のある性能を達成する。
論文 参考訳(メタデータ) (2022-12-08T23:36:00Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z) - Adaptive Fine-Grained Predicates Learning for Scene Graph Generation [122.4588401267544]
一般的なシーングラフ生成(SGG)モデルは、頭部の述語を予測する傾向があり、再バランス戦略は尾のカテゴリを好む。
本稿では,SGGの難解な述語を識別することを目的とした適応的微粒述語学習(FGPL-A)を提案する。
提案したモデル非依存戦略は,VG-SGGおよびGQA-SGGデータセットのベンチマークモデルの性能を最大175%,Mean Recall@100では76%向上させ,新たな最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-11T03:37:57Z) - Dynamic Graph Representation Learning via Graph Transformer Networks [41.570839291138114]
動的グラフ変換器 (DGT) を用いた動的グラフ学習手法を提案する。
DGTは、グラフトポロジを効果的に学習し、暗黙のリンクをキャプチャするための時空間符号化を持つ。
DGTはいくつかの最先端のベースラインと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2021-11-19T21:44:23Z) - Lightweight, Dynamic Graph Convolutional Networks for AMR-to-Text
Generation [56.73834525802723]
軽量な動的グラフ畳み込みネットワーク (LDGCN) を提案する。
LDGCNは入力グラフから高次情報を合成することにより、よりリッチな非局所的な相互作用をキャプチャする。
我々は,グループグラフの畳み込みと重み付き畳み込みに基づく2つの新しいパラメータ保存戦略を開発し,メモリ使用量とモデル複雑性を低減する。
論文 参考訳(メタデータ) (2020-10-09T06:03:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。