論文の概要: A Technical Report for VIPriors Image Classification Challenge
- arxiv url: http://arxiv.org/abs/2007.08722v1
- Date: Fri, 17 Jul 2020 02:30:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 13:46:52.400554
- Title: A Technical Report for VIPriors Image Classification Challenge
- Title(参考訳): VIPriors Image Classification Challenge の報告
- Authors: Zhipeng Luo, Ge Li, Zhiguang Zhang
- Abstract要約: 本稿では,VIPriors Image Classification Challengeへの提出について報告する。
この課題では、事前訓練された重量なしでモデルをスクラッチからトレーニングする方法が難しい。
DeepBlueAIの最終的なトップ1の精度は0.7015で、リーダーボードで2位です。
- 参考スコア(独自算出の注目度): 25.421167550087205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image classification has always been a hot and challenging task. This paper
is a brief report to our submission to the VIPriors Image Classification
Challenge. In this challenge, the difficulty is how to train the model from
scratch without any pretrained weight. In our method, several strong backbones
and multiple loss functions are used to learn more representative features. To
improve the models' generalization and robustness, efficient image augmentation
strategies are utilized, like autoaugment and cutmix. Finally, ensemble
learning is used to increase the performance of the models. The final Top-1
accuracy of our team DeepBlueAI is 0.7015, ranking second in the leaderboard.
- Abstract(参考訳): 画像の分類は常にホットで難しい作業だった。
本稿は,vipriors image classification challengeへの提案に対する簡単な報告である。
この課題では、事前訓練された重量なしでモデルをスクラッチからトレーニングする方法が難しい。
提案手法では,複数の強いバックボーンと多重損失関数を用いて,より代表的な特徴を学習する。
モデルの一般化とロバスト性を改善するために、autoaugmentやcutmixのような効率的な画像拡張戦略が利用される。
最後に、アンサンブル学習を用いてモデルの性能を向上させる。
DeepBlueAIの最終的なトップ1の精度は0.7015で、リーダーボードで2位です。
関連論文リスト
- EfficientTrain++: Generalized Curriculum Learning for Efficient Visual Backbone Training [79.96741042766524]
訓練カリキュラムをソフトセレクション機能として再構築する。
自然画像の内容の露光は,データ拡張の強度によって容易に達成できることを示す。
結果のメソッドであるEfficientTrain++は単純で汎用的だが驚くほど効果的である。
論文 参考訳(メタデータ) (2024-05-14T17:00:43Z) - HiCD: Change Detection in Quality-Varied Images via Hierarchical
Correlation Distillation [40.03785896317387]
知識蒸留を基礎とした革新的な教育戦略を導入する。
中心となるアイデアは、高品質なイメージペアから取得したタスク知識を活用して、モデルの学習をガイドすることにある。
我々は階層的相関蒸留法(自己相関、相互相関、大域相関を含む)を開発する。
論文 参考訳(メタデータ) (2024-01-19T15:21:51Z) - Understanding Zero-Shot Adversarial Robustness for Large-Scale Models [31.295249927085475]
ゼロショット対角ロバスト性に対する大規模モデルの強調問題を特定し,検討する。
本研究では,テキスト埋め込みと対向的視覚特徴を対照学習と整合させるテキスト誘導型対向的学習損失を提案する。
当社のアプローチは,ImageNetと15のゼロショットデータセットに対して,平均31ポイント以上の改善を達成し,CLIPに対するゼロショット対逆ロバスト性を大幅に向上させる。
論文 参考訳(メタデータ) (2022-12-14T04:08:56Z) - EfficientTrain: Exploring Generalized Curriculum Learning for Training
Visual Backbones [80.662250618795]
本稿では視覚バックボーン(例えば視覚変換器)の効率的なトレーニングのための新しいカリキュラム学習手法を提案する。
オフザシェルフ方式として、様々な人気モデルのウォールタイムトレーニングコストを、精度を犠牲にすることなく、ImageNet-1K/22Kで1.5倍に削減する。
論文 参考訳(メタデータ) (2022-11-17T17:38:55Z) - Get Fooled for the Right Reason: Improving Adversarial Robustness
through a Teacher-guided Curriculum Learning Approach [17.654350836042813]
現在のSOTAの頑健なモデルは、主に敵の訓練(AT)に基づいており、内部または外部の最小化ステップにおいてのみ、一部の正規化器によって異なる。
学習中に次のような考え方を強制する非定性的手法を提案する。
提案手法は,既存のATモデルに対して若干の余分な労力(10~20%)を要し,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2021-10-30T17:47:14Z) - A Technical Report for ICCV 2021 VIPriors Re-identification Challenge [5.940699390639281]
本稿では,VIPriors Challenge 2021における再同定トラックの解について紹介する。
それは、最先端のデータ処理戦略、モデル設計、および後処理アンサンブルメソッドの使用を示しています。
チームの最終スコア(ALONG)は96.5154% mAPで、トップボードで1位となった。
論文 参考訳(メタデータ) (2021-09-30T14:29:31Z) - A Strong Baseline for the VIPriors Data-Efficient Image Classification
Challenge [9.017660524497389]
本稿では,VIPriorsチャレンジデータセットに基づく,データ効率の高い画像分類のための強力なベースラインを提案する。
我々のベースラインは精度69.7%に達し、VIPriors 2021チャレンジへの応募の50%を上回っている。
論文 参考訳(メタデータ) (2021-09-28T08:45:15Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - Deepfake Forensics via An Adversarial Game [99.84099103679816]
顔偽造と画像・映像品質の両面での一般化能力向上のための対人訓練を提唱する。
AIベースの顔操作は、しばしば、一般化が困難であるモデルによって容易に発見できる高周波アーティファクトにつながることを考慮し、これらの特定のアーティファクトを曖昧にしようとする新しい逆トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-03-25T02:20:08Z) - Ultra-Data-Efficient GAN Training: Drawing A Lottery Ticket First, Then
Training It Toughly [114.81028176850404]
限られたデータでGAN(generative adversarial network)を訓練すると、一般的に性能が低下し、モデルが崩壊する。
データハングリーGANトレーニングを2つのシーケンシャルサブプロブレムに分解する。
このような協調フレームワークにより、より低い複雑さとよりデータ効率のよいサブ問題に集中することができます。
論文 参考訳(メタデータ) (2021-02-28T05:20:29Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。