論文の概要: PPGN: Phrase-Guided Proposal Generation Network For Referring Expression
Comprehension
- arxiv url: http://arxiv.org/abs/2012.10890v1
- Date: Sun, 20 Dec 2020 11:21:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 08:23:03.520422
- Title: PPGN: Phrase-Guided Proposal Generation Network For Referring Expression
Comprehension
- Title(参考訳): ppgn: 表現理解のための句案内提案生成ネットワーク
- Authors: Chao Yang, Guoqing Wang, Dongsheng Li, Huawei Shen, Su Feng, Bin Jiang
- Abstract要約: 新規な句誘導提案生成ネットワーク(PPGN)を提案する。
PPGNの主な実装原理は、テキストで視覚的特徴を洗練し、回帰を通じて提案を生成することである。
ベンチマークデータセットにおいて,本手法が有効であることを示す実験を行った。
- 参考スコア(独自算出の注目度): 31.39505099600821
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reference expression comprehension (REC) aims to find the location that the
phrase refer to in a given image. Proposal generation and proposal
representation are two effective techniques in many two-stage REC methods.
However, most of the existing works only focus on proposal representation and
neglect the importance of proposal generation. As a result, the low-quality
proposals generated by these methods become the performance bottleneck in REC
tasks. In this paper, we reconsider the problem of proposal generation, and
propose a novel phrase-guided proposal generation network (PPGN). The main
implementation principle of PPGN is refining visual features with text and
generate proposals through regression. Experiments show that our method is
effective and achieve SOTA performance in benchmark datasets.
- Abstract(参考訳): 参照表現理解(reference expression comprehension, REC)は、ある画像中のフレーズが参照する位置を見つけることを目的とする。
提案生成と提案表現は多くの2段階のREC手法において2つの有効な手法である。
しかし、既存の作業の多くは提案表現のみに焦点を当て、提案生成の重要性を無視している。
その結果、これらの手法によって生成される低品質な提案は、RECタスクのパフォーマンスボトルネックとなる。
本稿では,提案生成の問題を再考し,新しいフレーズ誘導提案生成ネットワーク(PPGN)を提案する。
PPGNの主な実装原理は、テキストで視覚的特徴を洗練し、回帰を通じて提案を生成することである。
ベンチマークデータセットにおいて,本手法が有効であることを示す実験を行った。
関連論文リスト
- Towards Universal Sequence Representation Learning for Recommender
Systems [98.02154164251846]
我々はUniSRecという新しいユニバーサルシーケンス表現学習手法を提案する。
提案手法は、項目の関連記述テキストを用いて、異なる推薦シナリオ間で転送可能な表現を学習する。
我々のアプローチは、パラメータ効率のよい方法で、新しいレコメンデーションドメインやプラットフォームに効果的に移行できます。
論文 参考訳(メタデータ) (2022-06-13T07:21:56Z) - ProposalCLIP: Unsupervised Open-Category Object Proposal Generation via
Exploiting CLIP Cues [49.88590455664064]
ProposalCLIPはアノテーションなしでさまざまなオブジェクトカテゴリの提案を予測できる。
提案CLIPはまた、教師なしオブジェクト検出のような下流タスクの利点を示す。
論文 参考訳(メタデータ) (2022-01-18T01:51:35Z) - Temporal Action Proposal Generation with Background Constraint [25.783837570359267]
時間的アクションプロポーザル生成(TAPG)は、時間的境界のある未トリミングビデオ中のアクションインスタンスを見つけることを目的とした課題である。
提案の信頼性を評価するため、既存の研究は、提案と根本真実の間の時間的相互統合(tIoU)によって監督される提案の行動スコアを予測するのが一般的である。
本稿では,低品質な提案をさらに抑制するための一般的な背景制約概念を革新的に提案する。
論文 参考訳(メタデータ) (2021-12-15T09:20:49Z) - Contrastive Proposal Extension with LSTM Network for Weakly Supervised
Object Detection [52.86681130880647]
画像レベルのラベルしか使用せず、膨大なアノテーションコストを節約できるため、WSOD (Weakly supervised Object Detection) が注目されている。
本稿では,初期提案と拡張提案を比較して,初期提案を最適化する手法を提案する。
PASCAL VOC 2007 と VOC 2012 と MS-COCO のデータセットを用いた実験により,本手法は最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-14T16:31:57Z) - Natural Language Video Localization with Learnable Moment Proposals [40.91060659795612]
学習可能なモーメントの提案を固定したLPNet(Learnable Proposal Network for NLVL)と呼ばれる新しいモデルを提案する。
本稿では,既存の最先端手法に対するLPNetの有効性を示す。
論文 参考訳(メタデータ) (2021-09-22T12:18:58Z) - Adaptive Proposal Generation Network for Temporal Sentence Localization
in Videos [58.83440885457272]
ビデオ(TSLV)における時間文ローカライゼーションの問題に対処する。
従来のメソッドは、事前に定義されたセグメントの提案でターゲットセグメントをローカライズするトップダウンフレームワークに従っている。
本稿では,効率を向上しつつセグメントレベルの相互作用を維持するための適応提案生成ネットワーク(APGN)を提案する。
論文 参考訳(メタデータ) (2021-09-14T02:02:36Z) - Reparameterized Sampling for Generative Adversarial Networks [71.30132908130581]
本稿では,マルコフ連鎖をジェネレータの潜在空間に再配置することで,一般依存型提案を可能にする新しいサンプリング手法REP-GANを提案する。
実験的な実験により、我々のREP-GANはサンプル効率を大幅に改善し、同時により良いサンプル品質を得ることを示した。
論文 参考訳(メタデータ) (2021-07-01T10:34:55Z) - Learning a Proposal Classifier for Multiple Object Tracking [36.67900094433032]
提案生成,提案スコア,軌道推論のパラダイムをアフィニティグラフ上でモデル化する,新しい提案ベースの学習可能なフレームワークを提案する。
提案手法は,従来の2つの公開ベンチマークにおいて,MOTAとIDF1の両性能改善を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-14T10:46:54Z) - Online Active Proposal Set Generation for Weakly Supervised Object
Detection [41.385545249520696]
弱い教師付きオブジェクト検出メソッドはイメージレベルのアノテーションのみを必要とする。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
提案アルゴリズムは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
論文 参考訳(メタデータ) (2021-01-20T02:20:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。