論文の概要: DDG-Net: Discriminability-Driven Graph Network for Weakly-supervised
Temporal Action Localization
- arxiv url: http://arxiv.org/abs/2307.16415v1
- Date: Mon, 31 Jul 2023 05:48:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 15:51:07.550712
- Title: DDG-Net: Discriminability-Driven Graph Network for Weakly-supervised
Temporal Action Localization
- Title(参考訳): DDG-Net: 弱教師付き時間行動定位のための識別可能性駆動型グラフネットワーク
- Authors: Xiaojun Tang, Junsong Fan, Chuanchen Luo, Zhaoxiang Zhang, Man Zhang,
and Zongyuan Yang
- Abstract要約: 本稿では、曖昧なスニペットとよく設計された接続を持つ識別的スニペットを明示的にモデル化した識別可能性駆動グラフネットワーク(DDG-Net)を提案する。
THUMOS14とActivityNet1.2ベンチマークの実験では、DDG-Netの有効性が示されている。
- 参考スコア(独自算出の注目度): 40.521076622370806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised temporal action localization (WTAL) is a practical yet
challenging task. Due to large-scale datasets, most existing methods use a
network pretrained in other datasets to extract features, which are not
suitable enough for WTAL. To address this problem, researchers design several
modules for feature enhancement, which improve the performance of the
localization module, especially modeling the temporal relationship between
snippets. However, all of them neglect the adverse effects of ambiguous
information, which would reduce the discriminability of others. Considering
this phenomenon, we propose Discriminability-Driven Graph Network (DDG-Net),
which explicitly models ambiguous snippets and discriminative snippets with
well-designed connections, preventing the transmission of ambiguous information
and enhancing the discriminability of snippet-level representations.
Additionally, we propose feature consistency loss to prevent the assimilation
of features and drive the graph convolution network to generate more
discriminative representations. Extensive experiments on THUMOS14 and
ActivityNet1.2 benchmarks demonstrate the effectiveness of DDG-Net,
establishing new state-of-the-art results on both datasets. Source code is
available at \url{https://github.com/XiaojunTang22/ICCV2023-DDGNet}.
- Abstract(参考訳): WTAL(Wakly-supervised temporal action Localization)は、実用的ながら困難な課題である。
大規模なデータセットのため、既存のほとんどのメソッドは他のデータセットで事前訓練されたネットワークを使用して特徴を抽出する。
この問題に対処するため、研究者はいくつかの機能拡張モジュールを設計し、特にスニペット間の時間的関係をモデル化して、ローカライズモジュールの性能を向上させる。
しかし、それら全ては曖昧な情報の悪影響を無視し、他人の差別性を低下させる。
この現象を考慮し,不明瞭なスニペットや識別スニペットを明示的にモデル化し,不明瞭な情報の伝達を防止し,スニペットレベルの表現の識別性を高める識別性駆動型グラフネットワーク(ddg-net)を提案する。
さらに,特徴の同化を防止し,グラフ畳み込みネットワークを駆動し,より差別的な表現を生成する特徴一貫性損失を提案する。
THUMOS14とActivityNet1.2ベンチマークに関する大規模な実験は、DDG-Netの有効性を示し、両方のデータセットに新たな最先端結果を確立する。
ソースコードは \url{https://github.com/xiaojuntang22/iccv2023-ddgnet} で入手できる。
関連論文リスト
- A Model-Agnostic Graph Neural Network for Integrating Local and Global Information [2.6164652182042505]
グラフニューラルネットワーク(GNN)は、さまざまなグラフにフォーカスしたタスクにおいて、有望なパフォーマンスを実現している。
既存のGNNには、ブラックボックスの性質による結果の解釈可能性の欠如と、さまざまな順序の表現を学べないという2つの大きな制限がある。
本稿では,様々な順序の情報を効果的に統合し,高次隣人から知識を抽出し,影響力のあるコンパクトグラフ構造を同定して有意義かつ解釈可能な結果を提供する,モデル非依存型グラフニューラルネットワーク(MaGNet)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-23T19:07:03Z) - Learning Strong Graph Neural Networks with Weak Information [64.64996100343602]
我々は、弱い情報(GLWI)を用いたグラフ学習問題に対する原則的アプローチを開発する。
非完全構造を持つ入力グラフ上で長距離情報伝搬を行うデュアルチャネルGNNフレームワークであるD$2$PTを提案するが、グローバルな意味的類似性を符号化するグローバルグラフも提案する。
論文 参考訳(メタデータ) (2023-05-29T04:51:09Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - R2-Trans:Fine-Grained Visual Categorization with Redundancy Reduction [21.11038841356125]
細粒度視覚分類(FGVC)は、クラス内の大きな多様性と微妙なクラス間差が主な課題である類似のサブカテゴリを識別することを目的としている。
本稿では,FGVCに対する新たなアプローチを提案する。FGVCは,環境条件における部分的かつ十分な識別情報を同時に利用でき,また,対象物に対するクラストークンにおける冗長情報を圧縮することができる。
論文 参考訳(メタデータ) (2022-04-21T13:35:38Z) - ACGNet: Action Complement Graph Network for Weakly-supervised Temporal
Action Localization [39.377289930528555]
教師なしビデオにおける弱いトリミング時間的行動ローカライゼーション(WTAL)は,ビデオレベルラベルのみが利用可能であるため,実用的ではあるが困難な課題となっている。
既存のアプローチは、通常、空間的不完全性と時間的不整合に苦しむ、既成のセグメントレベルの特徴を利用する。
本稿では,単純なグラフ畳み込みネットワークを用いてセグメントレベルの表現を強化することで,この問題に対処する。
論文 参考訳(メタデータ) (2021-12-21T04:18:44Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - Style Normalization and Restitution for DomainGeneralization and
Adaptation [88.86865069583149]
効果的なドメイン一般化モデルは、一般化および判別可能な特徴表現を学習することが期待される。
本稿では,ネットワークの高一般化と識別能力を確保するために,新しいスタイル正規化・再構成モジュール(SNR)を設計する。
論文 参考訳(メタデータ) (2021-01-03T09:01:39Z) - Adversarial Training for EM Classification Networks [0.0]
本稿では,ドメイン・アドバイザリ・ネットワークの新たな変種について述べる。
DANNネットワークの両方のフォークに対して、新しい損失関数が定義される。
ドメイン」の概念を拡張して、任意のユーザ定義ラベルを含めることができる。
論文 参考訳(メタデータ) (2020-11-20T20:11:58Z) - Contrastive and Generative Graph Convolutional Networks for Graph-based
Semi-Supervised Learning [64.98816284854067]
グラフベースのSemi-Supervised Learning (SSL)は、少数のラベル付きデータのラベルをグラフ経由で残りの巨大なラベル付きデータに転送することを目的としている。
本稿では,データ類似性とグラフ構造を両立させ,監視信号の強化を図るため,新しいGCNベースのSSLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-15T13:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。