Fugu-MT 論文翻訳(概要): CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion

論文の概要: CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion

arxiv url: http://arxiv.org/abs/2402.14551v2
Date: Fri, 15 Nov 2024 15:16:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.953727
Title: CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion
Title（参考訳）: CLCE:最適化学習融合のためのクロスエントロピーとコントラスト学習の精製手法
Authors: Zijun Long, George Killick, Lipeng Zhuang, Gerardo Aragon-Camarasa, Zaiqiao Meng, Richard Mccreadie,
Abstract要約: クロスエントロピー損失(CE)はモデルの一般化と安定性を損なう可能性がある。本稿では,Contrastive Learning と CE を統合した CLCE という新しいアプローチを提案する。 CLCEは12ベンチマークでCEのTop-1精度を大きく上回っている。
参考スコア（独自算出の注目度）: 15.106479030601378
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: State-of-the-art pre-trained image models predominantly adopt a two-stage approach: initial unsupervised pre-training on large-scale datasets followed by task-specific fine-tuning using Cross-Entropy loss~(CE). However, it has been demonstrated that CE can compromise model generalization and stability. While recent works employing contrastive learning address some of these limitations by enhancing the quality of embeddings and producing better decision boundaries, they often overlook the importance of hard negative mining and rely on resource intensive and slow training using large sample batches. To counter these issues, we introduce a novel approach named CLCE, which integrates Label-Aware Contrastive Learning with CE. Our approach not only maintains the strengths of both loss functions but also leverages hard negative mining in a synergistic way to enhance performance. Experimental results demonstrate that CLCE significantly outperforms CE in Top-1 accuracy across twelve benchmarks, achieving gains of up to 3.52% in few-shot learning scenarios and 3.41% in transfer learning settings with the BEiT-3 model. Importantly, our proposed CLCE approach effectively mitigates the dependency of contrastive learning on large batch sizes such as 4096 samples per batch, a limitation that has previously constrained the application of contrastive learning in budget-limited hardware environments.
Abstract（参考訳）: State-of-the-the-art pre-trained image modelは、主に2段階のアプローチを採用する。しかし、CEがモデル一般化と安定性を妥協できることが示されている。対照的な学習を取り入れた最近の研究は、埋め込みの品質を高め、より良い意思決定境界を生み出すことによって、これらの制限に対処する一方で、ハードネガティブなマイニングの重要性を見落とし、大規模なサンプルバッチを使用したリソース集約的かつ遅いトレーニングに依存していることが多い。これらの問題に対処するために,ラベル認識コントラスト学習をCEと統合したCLCEという新しいアプローチを導入する。提案手法は両損失関数の強度を維持するだけでなく, シナジスティックな方法で強負のマイニングを利用して性能を向上させる。実験の結果、CLCEは12のベンチマークでトップ1の精度でCEを大きく上回り、数ショットの学習シナリオでは3.52%、BEiT-3モデルでは3.41%のゲインを得た。重要なこととして,提案したCLCEアプローチは,予算限定のハードウェア環境におけるコントラスト学習の適用をこれまで制限していた4096サンプル/バッチなど,大規模なバッチサイズに対するコントラスト学習の依存性を効果的に緩和する。

関連論文リスト

CE-U: Cross Entropy Unlearning [4.12935843184402]
本研究では, CE-U (Cross Entropy Unlearning) を提案する。標準的なクロスエントロピー学習とアンラーニングをひとつのフレームワークに統合します。
論文参考訳（メタデータ） (2025-03-03T06:43:45Z)
ICL-TSVD: Bridging Theory and Practice in Continual Learning with Pre-trained Models [103.45785408116146]
連続学習(CL)は、連続的に提示される複数のタスクを解決できるモデルを訓練することを目的としている。最近のCLアプローチは、ダウンストリームタスクをうまく一般化する大規模な事前学習モデルを活用することで、強力なパフォーマンスを実現している。しかし、これらの手法には理論的保証がなく、予期せぬ失敗をしがちである。私たちは、経験的に強いアプローチを原則化されたフレームワークに統合することで、このギャップを埋めます。
論文参考訳（メタデータ） (2024-10-01T12:58:37Z)
When hard negative sampling meets supervised contrastive learning [17.173114048398947]
我々は、微調整フェーズ中にハードネガティブサンプリングを組み込んだ新しい教師付きコントラスト学習目標であるSCHaNeを導入する。 SchaNeは、様々なベンチマークで、トップ1の精度で強いベースラインBEiT-3を上回っている。提案手法は,ImageNet-1kのベースモデルに対して,86.14%の精度で新たな最先端技術を実現する。
論文参考訳（メタデータ） (2023-08-28T20:30:10Z)
Pre-training Language Model as a Multi-perspective Course Learner [103.17674402415582]
本研究では,サンプル効率のよい事前学習のためのマルチパースペクティブ・コース・ラーニング(MCL)手法を提案する。本研究では,3つの自己超越コースが,「綱引き」力学の固有の欠陥を軽減するように設計されている。本手法は,GLUEおよびSQuAD 2.0ベンチマークにおいて,ELECTRAの平均性能をそれぞれ2.8%,絶対点を3.2%向上させる。
論文参考訳（メタデータ） (2023-05-06T09:02:10Z)
FakeCLR: Exploring Contrastive Learning for Solving Latent Discontinuity in Data-Efficient GANs [24.18718734850797]
Data-Efficient GAN(DE-GAN)は、限られたトレーニングデータで生成モデルを学習することを目的としている。対照的な学習は、DE-GANの合成品質を高める大きな可能性を示している。偽のサンプルに対してのみ対照的な学習を行うFakeCLRを提案する。
論文参考訳（メタデータ） (2022-07-18T14:23:38Z)
Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文参考訳（メタデータ） (2021-07-28T05:18:10Z)
Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。 ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。 SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文参考訳（メタデータ） (2021-05-16T09:13:56Z)
Solving Inefficiency of Self-supervised Representation Learning [87.30876679780532]
既存のコントラスト学習法は、非常に低い学習効率に苦しむ。アンダークラスタリングとオーバークラスタリングの問題は、学習効率の大きな障害である。中央三重項損失を用いた新しい自己監督学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-04-18T07:47:10Z)
Highly Efficient Knowledge Graph Embedding Learning with Orthogonal Procrustes Analysis [10.154836127889487]
知識グラフ埋め込み(KGE)は、幅広いアプリケーションへの約束のために、近年集中的に研究されています。本稿では, トレーニング時間と炭素フットプリントを桁違いに削減できる簡易かつ効果的なKGEフレームワークを提案する。
論文参考訳（メタデータ） (2021-04-10T03:55:45Z)
Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文参考訳（メタデータ） (2021-01-20T11:48:12Z)
Robust Pre-Training by Adversarial Contrastive Learning [120.33706897927391]
近年の研究では、敵の訓練と統合されると、自己監督型事前訓練が最先端の堅牢性につながることが示されている。我々は,データ強化と対向的摂動の両面に整合した学習表現により,ロバストネスを意識した自己指導型事前学習を改善する。
論文参考訳（メタデータ） (2020-10-26T04:44:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。