論文の概要: Learning Representational Invariances for Data-Efficient Action
Recognition
- arxiv url: http://arxiv.org/abs/2103.16565v1
- Date: Tue, 30 Mar 2021 17:59:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 14:47:24.446587
- Title: Learning Representational Invariances for Data-Efficient Action
Recognition
- Title(参考訳): データ効率な行動認識のための表現不変性の学習
- Authors: Yuliang Zou, Jinwoo Choi, Qitong Wang, Jia-Bin Huang
- Abstract要約: 我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
- 参考スコア(独自算出の注目度): 52.23716087656834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is a ubiquitous technique for improving image
classification when labeled data is scarce. Constraining the model predictions
to be invariant to diverse data augmentations effectively injects the desired
representational invariances to the model (e.g., invariance to photometric
variations), leading to improved accuracy. Compared to image data, the
appearance variations in videos are far more complex due to the additional
temporal dimension. Yet, data augmentation methods for videos remain
under-explored. In this paper, we investigate various data augmentation
strategies that capture different video invariances, including photometric,
geometric, temporal, and actor/scene augmentations. When integrated with
existing consistency-based semi-supervised learning frameworks, we show that
our data augmentation strategy leads to promising performance on the
Kinetics-100, UCF-101, and HMDB-51 datasets in the low-label regime. We also
validate our data augmentation strategy in the fully supervised setting and
demonstrate improved performance.
- Abstract(参考訳): データ拡張は、ラベル付きデータの不足時に画像分類を改善するユビキタスな技術である。
モデル予測を多様なデータ拡張に不変に制限することは、望まれる表現的不変性をモデルに効果的に注入する(例えば、光度変化への不変性)。
画像データと比較すると、ビデオの外観のバリエーションは時間次元の追加によりはるかに複雑である。
しかし、ビデオのデータ拡張方法はまだ未調査のままだ。
本稿では,光度,幾何学的,時間的,アクター/シーンなど,さまざまなビデオの不変性を捉える様々なデータ拡張戦略について検討する。
既存の一貫性に基づく半教師付き学習フレームワークと統合すると、我々のデータ拡張戦略が低ラベル方式でKinetics-100, UCF-101, HMDB-51データセット上で有望なパフォーマンスをもたらすことを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
関連論文リスト
- Image compositing is all you need for data augmentation [6.647179199462945]
本稿では,オブジェクト検出モデルの性能に及ぼす各種データ拡張手法の影響について検討する。
商用機と軍用機からなるカスタムデータセット上でモデルを微調整し、異なる拡張戦略を適用します。
論文 参考訳(メタデータ) (2025-02-19T18:24:02Z) - Adversarial Semantic Augmentation for Training Generative Adversarial Networks under Limited Data [27.27230943686822]
本稿では,画像レベルではなくセマンティックレベルでトレーニングデータを拡大するために,敵対的セマンティック拡張(ASA)手法を提案する。
本手法は, 各種データ構造下での合成品質を継続的に改善する。
論文 参考訳(メタデータ) (2025-02-02T13:50:38Z) - Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.37146712877794]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。
事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。
ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文 参考訳(メタデータ) (2024-12-12T20:01:24Z) - Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。
本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-09-11T14:36:24Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - TeachAugment: Data Augmentation Optimization Using Teacher Knowledge [11.696069523681178]
本稿では,TeachAugment と呼ばれる逆戦略に基づくデータ拡張最適化手法を提案する。
画像分類,セマンティックセグメンテーション,教師なし表現学習において,TeachAugmentは既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-25T06:22:51Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - On the Generalization Effects of Linear Transformations in Data
Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。
我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。
本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文 参考訳(メタデータ) (2020-05-02T04:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。