論文の概要: MRSN: Multi-Relation Support Network for Video Action Detection
- arxiv url: http://arxiv.org/abs/2304.11975v1
- Date: Mon, 24 Apr 2023 10:15:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 15:21:51.436319
- Title: MRSN: Multi-Relation Support Network for Video Action Detection
- Title(参考訳): MRSN:ビデオ行動検出のためのマルチリレーション支援ネットワーク
- Authors: Yin-Dong Zheng, Guo Chen, Minglei Yuan, Tong Lu
- Abstract要約: アクション検出は、モデリング関係を必要とするビデオ理解の課題である。
本稿では,多時化支援ネットワークという新しいネットワークを提案する。
本実験は,関係を個別にモデル化し,関係レベルの相互作用を実行することによって,最先端の結果が得られることを示す。
- 参考スコア(独自算出の注目度): 15.82531313330869
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Action detection is a challenging video understanding task, requiring
modeling spatio-temporal and interaction relations. Current methods usually
model actor-actor and actor-context relations separately, ignoring their
complementarity and mutual support. To solve this problem, we propose a novel
network called Multi-Relation Support Network (MRSN). In MRSN, Actor-Context
Relation Encoder (ACRE) and Actor-Actor Relation Encoder (AARE) model the
actor-context and actor-actor relation separately. Then Relation Support
Encoder (RSE) computes the supports between the two relations and performs
relation-level interactions. Finally, Relation Consensus Module (RCM) enhances
two relations with the long-term relations from the Long-term Relation Bank
(LRB) and yields a consensus. Our experiments demonstrate that modeling
relations separately and performing relation-level interactions can achieve and
outperformer state-of-the-art results on two challenging video datasets: AVA
and UCF101-24.
- Abstract(参考訳): アクション検出は、時空間と相互作用の関係のモデリングを必要とするビデオ理解タスクである。
現在の手法は通常、アクタ-アクタとアクタ-コンテキストの関係を別々にモデル化し、それらの相補性と相互サポートを無視している。
そこで我々はMRSN(Multi-Relation Support Network)と呼ばれる新しいネットワークを提案する。
MRSNでは、アクター-コンテキスト関係エンコーダ(ACRE)とアクター-アクター関係エンコーダ(AARE)は、アクター-コンテキストとアクター-アクター関係を別々にモデル化する。
次に、RSE(Relation Support Encoder)は、2つの関係の間のサポートを計算し、関係レベル相互作用を実行する。
最後に、リレーショナル・コンセンサス・モジュール(RCM)は、長期関係銀行(LRB)の長期関係と2つの関係を強化し、合意を得る。
実験により,AVA と UCF101-24 の2つの挑戦的ビデオデータセットにおいて,関係関係を個別にモデル化し,関係レベルの相互作用を実行することにより,最先端の成果が得られることを示した。
関連論文リスト
- CycleACR: Cycle Modeling of Actor-Context Relations for Video Action
Detection [67.90338302559672]
生のビデオシナリオを直接活用するのではなく,アクター関連シーンコンテキストを選択して関係モデリングを改善することを提案する。
我々は、アクターとコンテキストの関係を双方向形式でモデル化する対称グラフを持つCycleACR(CycleACR)を開発した。
C2A-Eに焦点を当てた既存の設計と比較して、CycleACRはより効果的な関係モデリングのためのA2C-Rを導入しています。
論文 参考訳(メタデータ) (2023-03-28T16:40:47Z) - Modelling Multi-relations for Convolutional-based Knowledge Graph
Embedding [0.2752817022620644]
このようなアプローチは、エンティティペア間のマルチリレーションのセマンティック接続を切断すると考えられる。
本稿では,畳み込み型マルチリレーショナル学習モデルであるConvMRを提案する。
ConvMRは、少ない頻度のエンティティを扱うのに効率的であることを示す。
論文 参考訳(メタデータ) (2022-10-21T03:43:06Z) - Modeling Multi-Label Action Dependencies for Temporal Action
Localization [53.53490517832068]
実世界のビデオには、アクションクラス間の固有の関係を持つ多くの複雑なアクションが含まれている。
非発生ビデオにおける時間的行動の局在化のタスクのためのこれらの行動関係をモデル化する注意に基づくアーキテクチャを提案する。
マルチラベルアクションローカリゼーションベンチマークの最先端の方法よりもパフォーマンスが向上しました。
論文 参考訳(メタデータ) (2021-03-04T13:37:28Z) - DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act
Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。
既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。
本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文 参考訳(メタデータ) (2020-08-16T14:13:32Z) - Actor-Context-Actor Relation Network for Spatio-Temporal Action
Localization [47.61419011906561]
ACAR-Netは、時間的行動ローカライゼーションのための間接推論を可能にする、新しい高階関係推論演算子を基盤としている。
本手法は,ActivityNet Challenge 2020のAVA-Kineticsactionローカライゼーションタスクで第1位である。
論文 参考訳(メタデータ) (2020-06-14T18:51:49Z) - Relation of the Relations: A New Paradigm of the Relation Extraction
Problem [52.21210549224131]
我々は,関係抽出(RE)の新たなパラダイムを提案し,同じ文脈におけるすべての関係の予測を総合的に検討する。
我々は、手作りのルールを必要としないデータ駆動型アプローチを開発し、グラフニューラルネットワークと関係行列変換器を用いた関係関係(RoR)をそれ自体で学習する。
実験の結果、私たちのモデルはACE05データセットでは+1.12%、SemEval 2018 Task 7.2では2.55%で最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-06-05T22:25:27Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。