Fugu-MT 論文翻訳(概要): Learning Representational Invariances for Data-Efficient Action Recognition

論文の概要: Learning Representational Invariances for Data-Efficient Action Recognition

arxiv url: http://arxiv.org/abs/2103.16565v1
Date: Tue, 30 Mar 2021 17:59:49 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-31 14:47:24.446587
Title: Learning Representational Invariances for Data-Efficient Action Recognition
Title（参考訳）: データ効率な行動認識のための表現不変性の学習
Authors: Yuliang Zou, Jinwoo Choi, Qitong Wang, Jia-Bin Huang
Abstract要約: 我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
参考スコア（独自算出の注目度）: 52.23716087656834
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Data augmentation is a ubiquitous technique for improving image classification when labeled data is scarce. Constraining the model predictions to be invariant to diverse data augmentations effectively injects the desired representational invariances to the model (e.g., invariance to photometric variations), leading to improved accuracy. Compared to image data, the appearance variations in videos are far more complex due to the additional temporal dimension. Yet, data augmentation methods for videos remain under-explored. In this paper, we investigate various data augmentation strategies that capture different video invariances, including photometric, geometric, temporal, and actor/scene augmentations. When integrated with existing consistency-based semi-supervised learning frameworks, we show that our data augmentation strategy leads to promising performance on the Kinetics-100, UCF-101, and HMDB-51 datasets in the low-label regime. We also validate our data augmentation strategy in the fully supervised setting and demonstrate improved performance.
Abstract（参考訳）: データ拡張は、ラベル付きデータの不足時に画像分類を改善するユビキタスな技術である。モデル予測を多様なデータ拡張に不変に制限することは、望まれる表現的不変性をモデルに効果的に注入する(例えば、光度変化への不変性)。画像データと比較すると、ビデオの外観のバリエーションは時間次元の追加によりはるかに複雑である。しかし、ビデオのデータ拡張方法はまだ未調査のままだ。本稿では,光度,幾何学的,時間的,アクター/シーンなど,さまざまなビデオの不変性を捉える様々なデータ拡張戦略について検討する。既存の一貫性に基づく半教師付き学習フレームワークと統合すると、我々のデータ拡張戦略が低ラベル方式でKinetics-100, UCF-101, HMDB-51データセット上で有望なパフォーマンスをもたらすことを示す。また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。

関連論文リスト

Do We Need All the Synthetic Data? Targeted Synthetic Image Augmentation via Diffusion Models [25.238823603331525]
忠実な画像を含む同じ特徴を持つ訓練の初期に学習されていないデータの一部を合成的に増強するが、データセット全体を増強する異なるノイズ・アウトパフォーマンスを示す。実験の結果,データの30%～40%の増量により,様々なシナリオで最大2.8%の一般化が達成された。
論文参考訳（メタデータ） (2025-05-27T07:27:03Z)
Image compositing is all you need for data augmentation [6.647179199462945]
本稿では,オブジェクト検出モデルの性能に及ぼす各種データ拡張手法の影響について検討する。商用機と軍用機からなるカスタムデータセット上でモデルを微調整し、異なる拡張戦略を適用します。
論文参考訳（メタデータ） (2025-02-19T18:24:02Z)
Adversarial Semantic Augmentation for Training Generative Adversarial Networks under Limited Data [27.27230943686822]
本稿では,画像レベルではなくセマンティックレベルでトレーニングデータを拡大するために,敵対的セマンティック拡張(ASA)手法を提案する。本手法は, 各種データ構造下での合成品質を継続的に改善する。
論文参考訳（メタデータ） (2025-02-02T13:50:38Z)
Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.37146712877794]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳（メタデータ） (2024-12-12T20:01:24Z)
Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文参考訳（メタデータ） (2024-09-11T14:36:24Z)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳（メタデータ） (2024-08-01T07:40:00Z)
Generalization Gap in Data Augmentation: Insights from Illumination [3.470401787749558]
実世界の照明条件下で訓練されたモデルと、拡張現実で訓練されたモデルとの一般化の相違について検討する。その結果,様々なデータ拡張手法を適用した結果,モデルの性能は大幅に向上した。しかし、様々なデータ拡張手法を利用した後も、顕著な一般化のギャップが残っている。
論文参考訳（メタデータ） (2024-04-11T07:11:43Z)
Do Generated Data Always Help Contrastive Learning? [32.58214897368031]
コントラスト学習(CL)は、教師なし視覚表現学習において最も成功したパラダイムの1つである。生成モデル、特に拡散モデルの増加に伴い、実際のデータ分布に近い現実的な画像を生成する能力はよく認識されている。しかし、生成したデータ(DDPMのような優れた拡散モデルからでも)は、コントラスト学習に害を与えることもある。
論文参考訳（メタデータ） (2024-03-19T05:17:47Z)
Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文参考訳（メタデータ） (2023-02-07T20:42:28Z)
TeachAugment: Data Augmentation Optimization Using Teacher Knowledge [11.696069523681178]
本稿では,TeachAugment と呼ばれる逆戦略に基づくデータ拡張最適化手法を提案する。画像分類,セマンティックセグメンテーション,教師なし表現学習において,TeachAugmentは既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2022-02-25T06:22:51Z)
Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文参考訳（メタデータ） (2021-02-09T20:28:35Z)
Data Augmentation for Meta-Learning [58.47185740820304]
メタ学習アルゴリズムは、各トレーニングステップでデータ、クエリデータ、タスクをサンプリングする。データ拡張は、クラス毎に利用可能な画像の数を増やすだけでなく、全く新しいクラス/タスクを生成するためにも使用できる。提案したメタ固有データ拡張は,数ショットの分類ベンチマークにおいて,メタラーナーの性能を著しく向上させる。
論文参考訳（メタデータ） (2020-10-14T13:48:22Z)
On the Generalization Effects of Linear Transformations in Data Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文参考訳（メタデータ） (2020-05-02T04:10:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。