論文の概要: MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data
- arxiv url: http://arxiv.org/abs/2603.08202v1
- Date: Mon, 09 Mar 2026 10:29:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.794891
- Title: MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data
- Title(参考訳): MM-TS:長距離データを用いたコントラスト学習のためのマルチモーダル温度とマージンスケジューリング
- Authors: Siarhei Sheludzko, Dhimitrios Duka, Bernt Schiele, Hilde Kuehne, Anna Kukleva,
- Abstract要約: マルチモーダル温度とマージンスケジューリング(MM-TS)を提案し、一様温度スケジューリングの概念をマルチモーダルコントラスト学習に拡張する。
本手法はトレーニング中のコントラスト損失の温度を動的に調整し,マルチモーダル環境でのアトラクションと反発力を調節する。
- 参考スコア(独自算出の注目度): 64.78447637450937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contrastive learning has become a fundamental approach in both uni-modal and multi-modal frameworks. This learning paradigm pulls positive pairs of samples closer while pushing negatives apart. In the uni-modal setting (e.g., image-based learning), previous research has shown that the strength of these forces can be controlled through the temperature parameter. In this work, we propose Multi-Modal Temperature and Margin Schedules (MM-TS), extending the concept of uni-modal temperature scheduling to multi-modal contrastive learning. Our method dynamically adjusts the temperature in the contrastive loss during training, modulating the attraction and repulsion forces in the multi-modal setting. Additionally, recognizing that standard multi-modal datasets often follow imbalanced, long-tail distributions, we adapt the temperature based on the local distribution of each training sample. Specifically, samples from dense clusters are assigned a higher temperature to better preserve their semantic structure. Furthermore, we demonstrate that temperature scheduling can be effectively integrated within a max-margin framework, thereby unifying the two predominant approaches in multi-modal contrastive learning: InfoNCE loss and max-margin objective. We evaluate our approach on four widely used image- and video-language datasets, Flickr30K, MSCOCO, EPIC-KITCHENS-100, and YouCook2, and show that our dynamic temperature and margin schedules improve performance and lead to new state-of-the-art results in the field.
- Abstract(参考訳): コントラスト学習は、ユニモーダルフレームワークとマルチモーダルフレームワークの両方において、基本的なアプローチとなっている。
この学習パラダイムは、正のペアのサンプルを近づき、負を分解する。
一様条件(例えば画像に基づく学習)において、過去の研究では、これらの力の強さは温度パラメータによって制御できることが示されている。
本研究では,一様温度スケジューリングの概念をマルチモーダルコントラスト学習に拡張したマルチモーダル温度とマージンスケジューリング(MM-TS)を提案する。
本手法はトレーニング中のコントラスト損失の温度を動的に調整し,マルチモーダル環境でのアトラクションと反発力を調節する。
さらに、標準マルチモーダルデータセットは、しばしば不均衡で長い尾の分布に従うことを認識し、各トレーニングサンプルの局所分布に基づいて温度を適応する。
具体的には、密度の高いクラスターからのサンプルは、その意味構造をよりよく保存するために高温に割り当てられる。
さらに,マルチモーダルコントラスト学習における2つの主要なアプローチ – InfoNCE損失とmax-margin目標 – を統合することにより,温度スケジューリングを最大マージンフレームワークに効果的に統合できることを実証した。
我々は,Flickr30K,MSCOCO,EPIC-KITCHENS-100,YouCook2の4つの画像およびビデオ言語データセットに対するアプローチを評価し,我々の動的温度とマージンスケジュールが性能を改善し,この分野における新たな最先端結果をもたらすことを示す。
関連論文リスト
- Look Inward to Explore Outward: Learning Temperature Policy from LLM Internal States via Hierarchical RL [30.357975264905978]
生成時のサンプリング温度の制御を学習する階層的強化学習フレームワークを提案する。
各復号ステップでは、モデルがその隠れた状態に基づいて温度を選択し、その結果の分布から次のトークンをサンプリングする。
温度とトークンのポリシーは、座標上昇スキームを用いて下流の報酬から共同で最適化される。
論文 参考訳(メタデータ) (2026-02-13T15:42:59Z) - Dynamic Temperature Scheduler for Knowledge Distillation [8.855130508913513]
知識蒸留(KD)は、大規模で訓練済みの教師モデルを用いて、より小さな学生モデルを訓練する。
伝統的な方法は訓練を通して一定の温度を使い、それは準最適である。
本研究では,教師と学生のクロスエントロピー損失ギャップに基づいて動的に温度を調整する動的温度スケジューリングシステム(DTS)を導入する。
論文 参考訳(メタデータ) (2025-11-14T16:03:22Z) - Continual Multimodal Contrastive Learning [99.53621521696051]
MCL(Multimodal Contrastive Learning)は、異なるモダリティを整列し、関節空間におけるマルチモーダル表現を生成する。
マルチモーダルデータは単一のプロセスで収集されることはめったになく、スクラッチからのトレーニングは計算コストがかかる。
本稿では, 安定性と塑性の2つの原理によりCMCLを定式化する。
理論的には、二辺から部分空間への勾配の更新を計画する、新しい最適化に基づく手法を導出する。
論文 参考訳(メタデータ) (2025-03-19T07:57:08Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Temperature Balancing, Layer-wise Weight Analysis, and Neural Network
Training [58.20089993899729]
本稿では,直感的で効果的な階層学習手法であるTempBalanceを提案する。
我々は、TempBalanceが通常のSGDと注意深く調整されたスペクトルノルム正規化より著しく優れていることを示す。
また、TempBalanceは最先端のメトリクスやスケジューラよりも優れています。
論文 参考訳(メタデータ) (2023-12-01T05:38:17Z) - Dynamically Scaled Temperature in Self-Supervised Contrastive Learning [11.133502139934437]
本稿では,コサインの類似性に依存した温度スケーリング機能を提案することで,自己教師型学習におけるInfoNCE損失の性能向上に着目する。
実験的な証拠は、提案フレームワークが損失ベースのSSLアルゴリズムよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-08-02T13:31:41Z) - Tensor Network for Supervised Learning at Finite Temperature [1.4717465036484292]
有限温度テンソルネットワーク(fttn)は熱摂動を行列積状態フレームワークにインポートする。
FTTNは環境との絡み合いから計算した熱損失とみなしている。
温度のようなパラメータは自動的に最適化され、各データベースに個々の温度を与える。
論文 参考訳(メタデータ) (2021-04-09T05:02:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。