論文の概要: PPGN: Phrase-Guided Proposal Generation Network For Referring Expression
Comprehension
- arxiv url: http://arxiv.org/abs/2012.10890v1
- Date: Sun, 20 Dec 2020 11:21:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 08:23:03.520422
- Title: PPGN: Phrase-Guided Proposal Generation Network For Referring Expression
Comprehension
- Title(参考訳): ppgn: 表現理解のための句案内提案生成ネットワーク
- Authors: Chao Yang, Guoqing Wang, Dongsheng Li, Huawei Shen, Su Feng, Bin Jiang
- Abstract要約: 新規な句誘導提案生成ネットワーク(PPGN)を提案する。
PPGNの主な実装原理は、テキストで視覚的特徴を洗練し、回帰を通じて提案を生成することである。
ベンチマークデータセットにおいて,本手法が有効であることを示す実験を行った。
- 参考スコア(独自算出の注目度): 31.39505099600821
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reference expression comprehension (REC) aims to find the location that the
phrase refer to in a given image. Proposal generation and proposal
representation are two effective techniques in many two-stage REC methods.
However, most of the existing works only focus on proposal representation and
neglect the importance of proposal generation. As a result, the low-quality
proposals generated by these methods become the performance bottleneck in REC
tasks. In this paper, we reconsider the problem of proposal generation, and
propose a novel phrase-guided proposal generation network (PPGN). The main
implementation principle of PPGN is refining visual features with text and
generate proposals through regression. Experiments show that our method is
effective and achieve SOTA performance in benchmark datasets.
- Abstract(参考訳): 参照表現理解(reference expression comprehension, REC)は、ある画像中のフレーズが参照する位置を見つけることを目的とする。
提案生成と提案表現は多くの2段階のREC手法において2つの有効な手法である。
しかし、既存の作業の多くは提案表現のみに焦点を当て、提案生成の重要性を無視している。
その結果、これらの手法によって生成される低品質な提案は、RECタスクのパフォーマンスボトルネックとなる。
本稿では,提案生成の問題を再考し,新しいフレーズ誘導提案生成ネットワーク(PPGN)を提案する。
PPGNの主な実装原理は、テキストで視覚的特徴を洗練し、回帰を通じて提案を生成することである。
ベンチマークデータセットにおいて,本手法が有効であることを示す実験を行った。
関連論文リスト
- Referring Expression Generation in Visually Grounded Dialogue with Discourse-aware Comprehension Guiding [3.8673630752805446]
本稿では,差別的かつ言論に適さない参照表現(REs)を生成するための参照表現生成(REG)手法を提案する。
人体評価の結果,提案する2段階のアプローチが差別的REの創出に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-09-09T15:33:07Z) - Entity-enhanced Adaptive Reconstruction Network for Weakly Supervised
Referring Expression Grounding [214.8003571700285]
Referring Expression Grounding (REG) は、言語表現によって記述されたイメージにおいて特定のターゲットをグラウンドすることを目的としている。
我々は、エンティティ強化適応再構築ネットワーク(EARN)を設計する。
EARNには、エンティティの強化、適応的な接地、協調的な再構築の3つのモジュールが含まれている。
論文 参考訳(メタデータ) (2022-07-18T05:30:45Z) - ProposalCLIP: Unsupervised Open-Category Object Proposal Generation via
Exploiting CLIP Cues [49.88590455664064]
ProposalCLIPはアノテーションなしでさまざまなオブジェクトカテゴリの提案を予測できる。
提案CLIPはまた、教師なしオブジェクト検出のような下流タスクの利点を示す。
論文 参考訳(メタデータ) (2022-01-18T01:51:35Z) - Contrastive Proposal Extension with LSTM Network for Weakly Supervised
Object Detection [52.86681130880647]
画像レベルのラベルしか使用せず、膨大なアノテーションコストを節約できるため、WSOD (Weakly supervised Object Detection) が注目されている。
本稿では,初期提案と拡張提案を比較して,初期提案を最適化する手法を提案する。
PASCAL VOC 2007 と VOC 2012 と MS-COCO のデータセットを用いた実験により,本手法は最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-14T16:31:57Z) - Natural Language Video Localization with Learnable Moment Proposals [40.91060659795612]
学習可能なモーメントの提案を固定したLPNet(Learnable Proposal Network for NLVL)と呼ばれる新しいモデルを提案する。
本稿では,既存の最先端手法に対するLPNetの有効性を示す。
論文 参考訳(メタデータ) (2021-09-22T12:18:58Z) - Adaptive Proposal Generation Network for Temporal Sentence Localization
in Videos [58.83440885457272]
ビデオ(TSLV)における時間文ローカライゼーションの問題に対処する。
従来のメソッドは、事前に定義されたセグメントの提案でターゲットセグメントをローカライズするトップダウンフレームワークに従っている。
本稿では,効率を向上しつつセグメントレベルの相互作用を維持するための適応提案生成ネットワーク(APGN)を提案する。
論文 参考訳(メタデータ) (2021-09-14T02:02:36Z) - Online Active Proposal Set Generation for Weakly Supervised Object
Detection [41.385545249520696]
弱い教師付きオブジェクト検出メソッドはイメージレベルのアノテーションのみを必要とする。
オンライン提案サンプリングはこれらの問題に対する直感的な解決策である。
提案アルゴリズムは, PASCAL VOC 2007 と 2012 の両データセットに対して一貫した, 有意な改善を示した。
論文 参考訳(メタデータ) (2021-01-20T02:20:48Z) - RRPN++: Guidance Towards More Accurate Scene Text Detection [0.30458514384586394]
本稿では, RRPN ベースのモデルの可能性を活用するために RRPN++ を提案する。
RRPNに基づいて、第1段階の提案を生成するために、アンカーフリーピラミッド提案ネットワーク(APPN)を提案する。
第2段階では、検出部と認識部の両方を組み込んでマルチタスク学習を行う。
論文 参考訳(メタデータ) (2020-09-28T08:00:35Z) - BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation [85.13713217986738]
我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2020-09-15T07:08:59Z) - Ref-NMS: Breaking Proposal Bottlenecks in Two-Stage Referring Expression
Grounding [80.46288064284084]
Ref-NMSは、最初の段階で式対応の提案を出力する最初の方法である。
Ref-NMSは、式中のすべての名詞をクリティカルオブジェクトとみなし、各ボックスをクリティカルオブジェクトと整合させるスコアを予測する軽量モジュールを導入している。
Ref-NMSは接地ステップに依存しないため、最先端の2段階法に容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-09-03T05:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。