論文の概要: Improving Human-Object Interaction Detection via Phrase Learning and
Label Composition
- arxiv url: http://arxiv.org/abs/2112.07383v1
- Date: Tue, 14 Dec 2021 13:22:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:00:58.891511
- Title: Improving Human-Object Interaction Detection via Phrase Learning and
Label Composition
- Title(参考訳): 句学習とラベル合成によるヒューマン・オブジェクト間インタラクション検出の改善
- Authors: Zhimin Li, Cheng Zou, Yu Zhao, Boxun Li, Sheng Zhong
- Abstract要約: ヒューマン・オブジェクト・インタラクション(HOI)検出は、高レベルな人間中心のシーン理解における基本的な課題である。
本稿では,HOI 分岐と新しい句分岐を含む PhraseHOI を提案する。
- 参考スコア(独自算出の注目度): 14.483347746239055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-Object Interaction (HOI) detection is a fundamental task in high-level
human-centric scene understanding. We propose PhraseHOI, containing a HOI
branch and a novel phrase branch, to leverage language prior and improve
relation expression. Specifically, the phrase branch is supervised by semantic
embeddings, whose ground truths are automatically converted from the original
HOI annotations without extra human efforts. Meanwhile, a novel label
composition method is proposed to deal with the long-tailed problem in HOI,
which composites novel phrase labels by semantic neighbors. Further, to
optimize the phrase branch, a loss composed of a distilling loss and a balanced
triplet loss is proposed. Extensive experiments are conducted to prove the
effectiveness of the proposed PhraseHOI, which achieves significant improvement
over the baseline and surpasses previous state-of-the-art methods on Full and
NonRare on the challenging HICO-DET benchmark.
- Abstract(参考訳): ヒューマン・オブジェクト・インタラクション(HOI)検出は、高レベルな人間中心のシーン理解における基本的な課題である。
本稿では,hoi 分岐と新規句分岐を含む phrasehoi を提案し,言語を前もって活用し,関係表現を改善する。
具体的には、フレーズブランチはセマンティック埋め込みによって管理され、その基礎的真理は人間の余分な努力なしにオリジナルのHOIアノテーションから自動的に変換される。
一方,セマンティックな隣人による新しいフレーズラベルを合成するHOIでは,長い尾の問題に対処する新しいラベル合成法が提案されている。
さらに,このフレーズ分岐を最適化するために,蒸留損失と平衡三重項損失からなる損失を提案する。
提案したPhraseHOIの有効性を実証するため,提案手法はベースラインよりも大幅に改善され,HICO-DETベンチマーク上でのFullおよびNonRareの最先端手法を克服する。
関連論文リスト
- Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts [17.477542644785483]
言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
近隣の3重マッチング戦略により、エンティティレベルとリレーレベルアライメントを共同で実行するEAパイプライン。
論文 参考訳(メタデータ) (2024-07-22T12:25:48Z) - Negation Triplet Extraction with Syntactic Dependency and Semantic Consistency [37.99421732397288]
SSENEはマルチタスク学習フレームワークを備えたデコーダアーキテクチャのPLM(Generative Pretrained Language Model)に基づいて構築されている。
我々は,Meituanの現実世界プラットフォームからのユーザレビューに基づいて,高品質な中国語データセットNegCommentを構築した。
論文 参考訳(メタデータ) (2024-04-15T14:28:33Z) - A semantically enhanced dual encoder for aspect sentiment triplet
extraction [0.7291396653006809]
アスペクト・センチメント・トリプルト抽出(ASTE)はアスペクト・ベースの感情分析(ABSA)の重要なサブタスクである
従来の研究は、革新的なテーブル充填戦略によるASTEの強化に重点を置いてきた。
本稿では,BERTをベースとした基本エンコーダと,Bi-LSTMネットワークとGCN(Graph Convolutional Network)で構成される特定のエンコーダの両方を利用するフレームワークを提案する。
ベンチマークデータセットを用いた実験により,提案フレームワークの最先端性能を実証した。
論文 参考訳(メタデータ) (2023-06-14T09:04:14Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations [59.10748929158525]
抽象表現(AMR)は、教師なし構文制御されたパラフレーズ生成の性能を大幅に向上させることができる。
提案モデルであるAMRPGは,AMRグラフを符号化し,入力文を2つの非絡み合った意味的および構文的埋め込みに解析する。
実験により、AMRPGは既存の教師なしアプローチと比較して、定量的かつ質的に、より正確な構文制御されたパラフレーズを生成することが示された。
論文 参考訳(メタデータ) (2022-11-02T04:58:38Z) - Sentence Representation Learning with Generative Objective rather than
Contrastive Objective [86.01683892956144]
句再構成に基づく新たな自己教師型学習目標を提案する。
我々の生成学習は、十分な性能向上を達成し、現在の最先端のコントラスト法よりも優れています。
論文 参考訳(メタデータ) (2022-10-16T07:47:46Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Entailment Relation Aware Paraphrase Generation [17.6146622291895]
本稿では、既存のパラフレーズと自然言語推論コーパスを用いて学習できる強化学習に基づく弱教師付きパラフレーズシステムERAPを提案する。
自動評価と人的評価の組み合わせは、ERAPが特定の包含関係に従ってパラフレーズを生成することを示している。
論文 参考訳(メタデータ) (2022-03-20T08:02:09Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Training Bi-Encoders for Word Sense Disambiguation [4.149972584899897]
Word Sense Disambiguationの最先端のアプローチは、これらのモデルからの事前訓練された埋め込みとともに語彙情報を活用し、標準評価ベンチマークにおける人間間のアノテータ合意に匹敵する結果を得る。
我々はさらに,多段階事前学習および微調整パイプラインを通じて,Word Sense Disambiguationにおける技術の現状について述べる。
論文 参考訳(メタデータ) (2021-05-21T06:06:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。