論文の概要: iqiyi Submission to ActivityNet Challenge 2019 Kinetics-700 challenge:
Hierarchical Group-wise Attention
- arxiv url: http://arxiv.org/abs/2002.02918v1
- Date: Fri, 7 Feb 2020 17:46:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 04:52:47.871930
- Title: iqiyi Submission to ActivityNet Challenge 2019 Kinetics-700 challenge:
Hierarchical Group-wise Attention
- Title(参考訳): iqiyi Submission to ActivityNet Challenge 2019 Kinetics-700 Challenge: Hierarchical Group-wise Attention
- Authors: Qian Liu, Dongyang Cai, Jie Liu, Nan Ding, Tao Wang
- Abstract要約: TSN、HG-NL、StNetの3つのモデルがモデルアンサンブルステージに関与している。
本稿では,階層型グループワイド非局所(HG-NL)モジュールをビデオ分類のためのフレームレベルの特徴アグリゲーションとして提案する。
ActivityNet 2019 Kinetics-700チャレンジのタスクでは、モデルアンサンブルの後、平均トップ1とトップ5エラーパーセンテージ28.444%を得る。
- 参考スコア(独自算出の注目度): 13.262667742653633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this report, the method for the iqiyi submission to the task of
ActivityNet 2019 Kinetics-700 challenge is described. Three models are involved
in the model ensemble stage: TSN, HG-NL and StNet. We propose the hierarchical
group-wise non-local (HG-NL) module for frame-level features aggregation for
video classification. The standard non-local (NL) module is effective in
aggregating frame-level features on the task of video classification but
presents low parameters efficiency and high computational cost. The HG-NL
method involves a hierarchical group-wise structure and generates multiple
attention maps to enhance performance. Basing on this hierarchical group-wise
structure, the proposed method has competitive accuracy, fewer parameters and
smaller computational cost than the standard NL. For the task of ActivityNet
2019 Kinetics-700 challenge, after model ensemble, we finally obtain an
averaged top-1 and top-5 error percentage 28.444% on the test set.
- Abstract(参考訳): 本報告では,ActivityNet 2019 Kinetics-700の課題に対するiqiyiの提出方法について述べる。
TSN、HG-NL、StNetの3つのモデルがモデルアンサンブルステージに関与している。
本稿では,階層型グループワイド非局所(HG-NL)モジュールを提案する。
標準非局所(NL)モジュールは、ビデオ分類タスクにおいてフレームレベルの特徴を集約するのに有効であるが、パラメータの低い効率と計算コストが高い。
HG-NL法は階層的なグループ単位の構造を持ち、性能を高めるために複数の注意マップを生成する。
提案手法は, この階層的グループ分割構造に基づき, 競合精度, パラメータ低減, 計算コストが標準nlよりも小さい。
activitynet 2019 kinetics-700チャレンジでは、モデルアンサンブルの後、テストセットで平均top-1とtop-5エラー率28.444%を得た。
関連論文リスト
- GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model [66.35608254724566]
状態空間モデル(SSM)は、二次的複雑性を伴う長距離依存のモデリングにおいて効果的な性能を示した。
しかし、純粋なSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最適性能の達成に関連する課題に直面している。
本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文 参考訳(メタデータ) (2024-07-18T17:59:58Z) - Weighted Grouped Query Attention in Transformers [0.0]
Weighted Grouped-Query Attention (WGQA) と呼ばれるグループクエリ注意のバリエーションを提案する。
我々は,T5デコーダのアテンションブロックにおいて,各キーと値のヘッダに対して新たな学習可能なパラメータを導入し,微調整中に重み付き平均値を取ることを可能にする。
本モデルでは,GQAよりも平均0.53%改善し,推定時のオーバーヘッドを伴わず,従来のマルチヘッドアテンション(MHA)に収束する。
論文 参考訳(メタデータ) (2024-07-15T16:07:13Z) - GCoNet+: A Stronger Group Collaborative Co-Salient Object Detector [156.43671738038657]
本稿では,GCoNet+と呼ばれる新しいグループ協調学習ネットワークを提案する。
GCoNet+は自然界における共存対象を効果的かつ効率的に識別することができる。
論文 参考訳(メタデータ) (2022-05-30T23:49:19Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Learning Hierarchical Graph Neural Networks for Image Clustering [81.5841862489509]
本稿では,画像の集合を未知の個数にクラスタリングする方法を学ぶ階層型グラフニューラルネットワーク(GNN)モデルを提案する。
我々の階層的なGNNは、階層の各レベルで予測される連結コンポーネントをマージして、次のレベルで新しいグラフを形成するために、新しいアプローチを用いています。
論文 参考訳(メタデータ) (2021-07-03T01:28:42Z) - News Headline Grouping as a Challenging NLU Task [21.07243197246345]
ヘッドライングループ(HLG)と20,056組のニュース見出しからなる対応するデータセット(HLGD)のタスクを紹介します。
HLGDでは、人間のアノテーションーはおよそ0.9 F-1の高性能を達成し、現在の最先端のトランスフォーマーモデルは0.75 F-1にしか達しません。
最良監督モデルの3F-1内で実現するヘッドライングルーピングのタスクのための新しい非監視ヘッドラインジェネレータスワップモデルを提案します。
論文 参考訳(メタデータ) (2021-05-12T01:40:49Z) - Complementary Boundary Generator with Scale-Invariant Relation Modeling
for Temporal Action Localization: Submission to ActivityNet Challenge 2020 [66.4527310659592]
本報告では,ActivityNet Challenge 2020 Task 1への提出時に使用したソリューションの概要を紹介する。
時間的行動ローカライゼーションタスクを2段階(すなわち提案生成と分類)に分離し,提案の多様性を高める。
提案手法は,課題テストセット上での平均mAPを用いて,時間的動作の局所化タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-20T04:35:40Z) - Policy-GNN: Aggregation Optimization for Graph Neural Networks [60.50932472042379]
グラフニューラルネットワーク(GNN)は、局所的なグラフ構造をモデル化し、隣人からの情報を集約することで階層的なパターンを捉えることを目的としている。
複雑なグラフとスパースな特徴を与えられた各ノードに対して効果的なアグリゲーション戦略を開発することは難しい課題である。
本稿では,GNNのサンプリング手順とメッセージパッシングを複合学習プロセスにモデル化するメタ政治フレームワークであるPolicy-GNNを提案する。
論文 参考訳(メタデータ) (2020-06-26T17:03:06Z) - CBR-Net: Cascade Boundary Refinement Network for Action Detection:
Submission to ActivityNet Challenge 2020 (Task 1) [42.77192990307131]
我々は,ActivityNet Challenge 2020において,時間的行動ローカライゼーション(検出)(タスク1)の課題に対する解決策を提示する。
本研究の目的は、興味あるアクションが発生する間隔を時間的に局所化し、長い未編集ビデオにおけるアクションカテゴリを予測することである。
この段階では、微調整ネットワークによって得られたビデオレベルの分類結果を組み合わせて、各提案のカテゴリを予測する。
論文 参考訳(メタデータ) (2020-06-13T01:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。