論文の概要: Aligning by Misaligning: Boundary-aware Curriculum Learning for Multimodal Alignment
- arxiv url: http://arxiv.org/abs/2511.08399v1
- Date: Wed, 12 Nov 2025 01:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.796806
- Title: Aligning by Misaligning: Boundary-aware Curriculum Learning for Multimodal Alignment
- Title(参考訳): 誤認識によるアライニング:マルチモーダルアライメントのための境界認識型カリキュラム学習
- Authors: Hua Ye, Hang Ding, Siyuan Chen, Yiyang Jiang, Changyuan Zhang, Xuan Zhang,
- Abstract要約: 本稿では,境界事例をカリキュラム信号に変換する軽量アドオンであるBACL(Bundary-Aware Curriculum with Local Attention)を提案する。
境界を意識した負のサンプリングは次第に困難を増し、対照的な局所的注意喪失はミスマッチの発生箇所をハイライトする。
- 参考スコア(独自算出の注目度): 10.050759500947356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most multimodal models treat every negative pair alike, ignoring the ambiguous negatives that differ from the positive by only a small detail. We propose Boundary-Aware Curriculum with Local Attention (BACL), a lightweight add-on that turns these borderline cases into a curriculum signal. A Boundary-aware Negative Sampler gradually raises difficulty, while a Contrastive Local Attention loss highlights where the mismatch occurs. The two modules are fully differentiable and work with any off-the-shelf dual encoder. Theory predicts a fast O(1/n) error rate; practice shows up to +32% R@1 over CLIP and new SOTA on four large-scale benchmarks, all without extra labels.
- Abstract(参考訳): ほとんどのマルチモーダルモデルは全ての負の対を同じように扱い、小さな詳細だけで正と異なるあいまいな負を無視する。
本稿では,これらの境界ケースをカリキュラム信号に変換する軽量アドオンであるBACL(Bundary-Aware Curriculum with Local Attention)を提案する。
境界を意識した負のサンプリングは次第に困難を増し、対照的な局所的注意喪失はミスマッチの発生箇所をハイライトする。
2つのモジュールは完全に微分可能で、市販のデュアルエンコーダで動作する。
理論は高速なO(1/n)エラー率を予測し、CLIPでは+32%のR@1、大規模ベンチマークでは新しいSOTAが4つのベンチマークでそれぞれ追加ラベルなしで表示される。
関連論文リスト
- Rethinking Consistent Multi-Label Classification under Inexact Supervision [60.79309683889278]
部分的マルチラベル学習では、各インスタンスには候補ラベルセットがアノテートされ、そのうちいくつかのラベルのみが関連付けられている。
補完的なマルチラベル学習では、各インスタンスは、インスタンスが属さないクラスを示す補完ラベルで注釈付けされる。
論文 参考訳(メタデータ) (2025-10-05T08:30:32Z) - Probably Approximately Precision and Recall Learning [60.00180898830079]
機械学習における重要な課題は、一方的なフィードバックの頻度である。
本稿では,確率的近似(PAC)フレームワークを導入し,各入力をラベルの集合にマッピングする仮説を定めている。
我々は、正のデータのみから学習する新しいアルゴリズムを開発し、実現可能な場合において最適なサンプル複雑性を実現する。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - UniDEC : Unified Dual Encoder and Classifier Training for Extreme Multi-Label Classification [42.59511319244973]
Extreme Multi-label Classification (XMC) は非常に大きなラベル空間から関連するラベルのサブセットを予測する。
損失に依存しないエンドツーエンドのトレーニング可能なフレームワークであるUniDECを開発した。
UniDECは、数百万のラベルを持つデータセットで最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-05-04T17:27:51Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - DualMatch: Robust Semi-Supervised Learning with Dual-Level Interaction [10.775623936099173]
従来の半教師付き学習手法は、通常、異なるデータ拡張ビューのモデル予測を単一レベルのインタラクション方法で一致させる。
本稿では,DualMatchと呼ばれる新しいSSL方式を提案する。
標準SSL設定では、SOTA法と比較して9%のエラー削減が達成されるが、より困難なクラス不均衡設定でも6%のエラー削減が達成できる。
論文 参考訳(メタデータ) (2023-10-25T08:34:05Z) - Towards Unbiased Multi-label Zero-Shot Learning with Pyramid and
Semantic Attention [14.855116554722489]
マルチラベルゼロショット学習は、各入力サンプルに対して、複数の未確認クラスのラベルを認識することを目的としている。
本稿では,多様なクラス固有の領域を考慮し,非バイアス付きマルチラベルゼロショット学習の枠組みを提案する。
論文 参考訳(メタデータ) (2022-03-07T15:52:46Z) - Gaussian Mixture Variational Autoencoder with Contrastive Learning for
Multi-Label Classification [27.043136219527767]
本稿では,新しいコントラスト学習促進型マルチラベル予測モデルを提案する。
教師付き環境でのコントラスト学習を用いることで,ラベル情報を効果的に活用することができる。
学習した埋め込みがラベルとラベルの相互作用の解釈に洞察を与えることを示す。
論文 参考訳(メタデータ) (2021-12-02T04:23:34Z) - Generalized Negative Correlation Learning for Deep Ensembling [7.569288952340753]
Ensembleアルゴリズムは、多くの機械学習アプリケーションにおいて、最先端のアートパフォーマンスを提供する。
任意の2つの微分可能な損失関数に対する一般化バイアス分散分解を定式化する。
我々は,アンサンブルの多様性を明示的に制御する一般化負相関学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-11-05T16:29:22Z) - Delving into Inter-Image Invariance for Unsupervised Visual
Representations [108.33534231219464]
画像間不変学習の役割をよりよく理解するための研究を提案する。
オンラインラベルはオフラインラベルよりも早く収束する。
半硬な負のサンプルは、硬い負のサンプルよりも信頼性が高く、偏りがない。
論文 参考訳(メタデータ) (2020-08-26T17:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。