論文の概要: CPARR: Category-based Proposal Analysis for Referring Relationships
- arxiv url: http://arxiv.org/abs/2004.08028v1
- Date: Fri, 17 Apr 2020 01:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:14:44.086132
- Title: CPARR: Category-based Proposal Analysis for Referring Relationships
- Title(参考訳): CPARR:関係参照のためのカテゴリーベース提案分析
- Authors: Chuanzi He, Haidong Zhu, Jiyang Gao, Kan Chen, Ram Nevatia
- Abstract要約: 本稿では,関係性を参照するためのシンプルで効果的な提案手法を提案する。
本手法は,その複雑さとあいまいさを低減しつつ,高分解能な結果が得られる。
2つの公開データセット上で、参照関係タスクに最先端のパフォーマンスを示す。
- 参考スコア(独自算出の注目度): 35.98714576886489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of referring relationships is to localize subject and object
entities in an image satisfying a relationship query, which is given in the
form of \texttt{<subject, predicate, object>}. This requires simultaneous
localization of the subject and object entities in a specified relationship. We
introduce a simple yet effective proposal-based method for referring
relationships. Different from the existing methods such as SSAS, our method can
generate a high-resolution result while reducing its complexity and ambiguity.
Our method is composed of two modules: a category-based proposal generation
module to select the proposals related to the entities and a predicate analysis
module to score the compatibility of pairs of selected proposals. We show
state-of-the-art performance on the referring relationship task on two public
datasets: Visual Relationship Detection and Visual Genome.
- Abstract(参考訳): 関係性を参照するタスクは、関係性クエリを満たすイメージ内の主題とオブジェクトエンティティをローカライズすることであり、それは \texttt{<subject, predicate, object>} の形式で与えられる。
これは、特定の関係における対象と対象のエンティティの同時ローカライズを必要とする。
本稿では,関係性を参照するための提案手法を提案する。
SSASのような既存の手法とは異なり,本手法は複雑性とあいまいさを低減しつつ高分解能な結果が得られる。
本手法は,エンティティに関連する提案を選択するカテゴリベース提案生成モジュールと,選択した提案のペア間の互換性を評価する述語分析モジュールの2つのモジュールから構成される。
視覚関連検出と視覚ゲノムの2つの公開データセットにおける参照関係タスクにおける最先端のパフォーマンスを示す。
関連論文リスト
- Multimodal Relational Triple Extraction with Query-based Entity Object Transformer [20.97497765985682]
マルチモーダル関係抽出は、柔軟で現実的な知識の構築に不可欠である。
画像・テキスト・ペアから全三重項(エンタリティ,関係,オブジェクト領域)を抽出することを目的としたマルチモーダル・エンティティ・オブジェクト・トリプル抽出を提案する。
また,テキスト情報と視覚情報の相互作用と融合を動的に探索するクエリベースモデルQEOTを提案する。
論文 参考訳(メタデータ) (2024-08-16T12:43:38Z) - Anaphor Assisted Document-Level Relation Extraction [42.57958231709678]
文書レベルの関係抽出(DocRE)は、文書内の複数の文に分散されたエンティティ間の関係を識別する。
既存の方法は、エンティティの内部構造とエンティティ間の外部相互作用をモデル化する異種文書グラフの構築に焦点を当てている。
DocREタスクのためのAnaphor-Assisted (AA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-28T06:11:18Z) - Multimodal Relation Extraction with Cross-Modal Retrieval and Synthesis [89.04041100520881]
本研究は,対象物,文,画像全体に基づいて,テキストおよび視覚的証拠を検索することを提案する。
我々は,オブジェクトレベル,画像レベル,文レベル情報を合成し,同一性と異なるモダリティ間の推論を改善する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-05-25T15:26:13Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - Visual Composite Set Detection Using Part-and-Sum Transformers [74.26037922682355]
本稿では,エンドツーエンドのコンポジットセット検出を行うために,PST(Part-and-Sum Detection Transformer)という新しい手法を提案する。
PSTは、カスタムデザインの2段階モデルの結果とほぼ一致しながら、シングルステージモデル間で最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-05-05T16:31:32Z) - Relation Extraction with Contextualized Relation Embedding (CRE) [6.030060645424665]
本稿では,意味情報と知識ベースモデリングを統合した関係抽出タスクのアーキテクチャを提案する。
本稿では、関係抽出においてKBモデリングを内部化するモデルアーキテクチャを提案する。
提案したCREモデルは、The New York Times Annotated CorpusとFreeBaseから派生したデータセット上でのアートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2020-11-19T05:19:46Z) - Named Entity Recognition and Relation Extraction using Enhanced Table
Filling by Contextualized Representations [14.614028420899409]
提案手法は,複雑な手作り特徴やニューラルネットワークアーキテクチャを伴わずに,エンティティ参照と長距離依存関係の表現を計算する。
我々はまた、歴史に基づく予測や検索戦略に頼ることなく、関係ラベルを一度に予測するためにテンソルドット積を適用する。
その単純さにもかかわらず、実験の結果、提案手法はCoNLL04とACE05の英語データセット上で最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-15T04:58:23Z) - Intrinsic Relationship Reasoning for Small Object Detection [44.68289739449486]
画像やビデオの小さなオブジェクトは通常、独立した個人ではない。その代わりに、意味的および空間的レイアウトの関係を多かれ少なかれ提示する。
本稿では,オブジェクト間の固有意味と空間的レイアウトの関係をモデル化し,推論する,小さなオブジェクト検出のための新しいコンテキスト推論手法を提案する。
論文 参考訳(メタデータ) (2020-09-02T06:03:05Z) - BriNet: Towards Bridging the Intra-class and Inter-class Gaps in
One-Shot Segmentation [84.2925550033094]
ほとんどショットのセグメンテーションは、限られたトレーニングサンプルで見えないオブジェクトインスタンスをセグメンテーションするためのモデルの一般化に焦点を当てている。
本稿では,クエリの抽出した特徴とサポートイメージのギャップを埋めるフレームワーク BriNet を提案する。
本フレームワークの有効性は,他の競合手法よりも優れる実験結果によって実証された。
論文 参考訳(メタデータ) (2020-08-14T07:45:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。