論文の概要: JEPAMatch: Geometric Representation Shaping for Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2604.21046v1
- Date: Wed, 22 Apr 2026 19:44:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.158936
- Title: JEPAMatch: Geometric Representation Shaping for Semi-Supervised Learning
- Title(参考訳): JEPAMatch: 半教師付き学習のための幾何学的表現整形
- Authors: Ali Aghababaei-Harandi, Aude Sportisse, Massih-Reza Amini,
- Abstract要約: 本稿では、FlexMatchで使用される古典的半教師付き損失と、LeJEPAから派生した潜在空間正規化項を組み合わせた新たなトレーニング目標を提案する。
提案手法は、擬似ラベル戦略の利点を保ちながら、よく構造化された表現を奨励する。
- 参考スコア(独自算出の注目度): 3.7931928645127986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised learning has emerged as a powerful paradigm for leveraging large amounts of unlabeled data to improve the performance of machine learning models when labeled data are scarce. Among existing approaches, methods derived from FixMatch have achieved state-of-the-art results in image classification by combining weak and strong data augmentations with confidence-based pseudo-labeling. Despite their strong empirical performance, these methods typically struggle with two critical bottlenecks: majority classes tend to dominate the learning process, which is amplified by incorrect pseudo-labels, leading to biased models. Furthermore, noisy early pseudo-labels prevent the model from forming clear decision boundaries, requiring prolonged training to learn informative representation. In this paper, we introduce a paradigm shift from conventional logical output threshold base, toward an explicit shaping of geometric representations. Our approach is inspired by the recently proposed Latent-Euclidean Joint-Embedding Predictive Architectures (LeJEPA), a theoretically grounded framework asserting that meaningful representations should exhibit an isotropic Gaussian structure in latent space. Building on this principle, we propose a new training objective that combines the classical semi-supervised loss used in FlexMatch, an adaptive extension of FixMatch, with a latent-space regularization term derived from LeJEPA. Our proposed approach, encourages well-structured representations while preserving the advantages of pseudo-labeling strategies. Through extensive experiments on CIFAR-100, STL-10 and Tiny-ImageNet, we demonstrate that the proposed method consistently outperforms existing baselines. In addition, our method significantly accelerates the convergence, drastically reducing the overall computational cost compared to standard FixMatch-based pipelines.
- Abstract(参考訳): ラベル付きデータが不足している場合に、大量のラベル付きデータを活用して機械学習モデルの性能を向上させるための強力なパラダイムとして、半教師付き学習が登場した。
既存のアプローチの中で、FixMatchから派生した手法は、弱いデータと強いデータ拡張と信頼に基づく擬似ラベルを組み合わせることで、画像分類の最先端化を実現している。
多数派クラスは学習プロセスを支配する傾向にあり、これは誤った擬似ラベルによって増幅され、バイアスのあるモデルに繋がる。
さらに、ノイズの多い初期の擬似ラベルは、モデルが明確な決定境界を形成するのを防ぎ、情報表現を学ぶために長い訓練を必要とする。
本稿では,従来の論理出力しきい値ベースから幾何学的表現の明示的な形状へのパラダイムシフトを紹介する。
我々のアプローチは、最近提案されたLatent-Euclidean Joint-Embedding Predictive Architectures (LeJEPA) に触発された。
この原理に基づいて、FixMatchの適応拡張であるFlexMatchで使用される古典的な半教師付き損失と、LeJEPAから派生した潜在空間正規化項を組み合わせた、新たなトレーニング目標を提案する。
提案手法は、擬似ラベル戦略の利点を保ちながら、よく構造化された表現を奨励する。
CIFAR-100、STL-10、Tiny-ImageNetの広範な実験を通して、提案手法が既存のベースラインを一貫して上回ることを示す。
さらに,本手法はコンバージェンスを大幅に加速し,FixMatchベースのパイプラインに比べて計算コストを大幅に削減する。
関連論文リスト
- Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - Discrete Markov Bridge [93.64996843697278]
離散マルコフブリッジと呼ばれる離散表現学習に特化して設計された新しいフレームワークを提案する。
私たちのアプローチは、Matrix LearningとScore Learningの2つの重要なコンポーネントの上に構築されています。
論文 参考訳(メタデータ) (2025-05-26T09:32:12Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Unifying Self-Supervised Clustering and Energy-Based Models [9.3176264568834]
自己教師付き学習と生成モデルとの間には,原則的な関連性を確立する。
シンボル接地問題の単純かつ非自明なインスタンス化に対処するために,我々の解法をニューロシンボリックな枠組みに統合できることが示される。
論文 参考訳(メタデータ) (2023-12-30T04:46:16Z) - Training-based Model Refinement and Representation Disagreement for
Semi-Supervised Object Detection [8.096382537967637]
半教師付き物体検出(SSOD)は、既存の物体検出器の性能と一般化を改善することを目的としている。
近年のSSOD法は, 古典的指数移動平均 (EMA) 戦略を用いて, モデル改良の不十分さが問題となっている。
本稿では,新しいトレーニングベースモデル改良段階と,シンプルで効果的な表現不一致(RD)戦略を提案する。
論文 参考訳(メタデータ) (2023-07-25T18:26:22Z) - Making Linear MDPs Practical via Contrastive Representation Learning [101.75885788118131]
マルコフ決定過程(MDP)における次元性の呪いに、低ランク表現を利用することで対処することが一般的である。
本稿では,効率的な表現学習を可能にしつつ,正規化を自動的に保証する線形MDPの代替的定義について考察する。
いくつかのベンチマークにおいて、既存の最先端モデルベースおよびモデルフリーアルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-14T18:18:02Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。