論文の概要: Self-Supervised Representation Learning with Meta Comprehensive
Regularization
- arxiv url: http://arxiv.org/abs/2403.01549v1
- Date: Sun, 3 Mar 2024 15:53:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 20:58:49.994963
- Title: Self-Supervised Representation Learning with Meta Comprehensive
Regularization
- Title(参考訳): メタ包括正規化による自己教師付き表現学習
- Authors: Huijie Guo, Ying Ba, Jie Hu, Lingyu Si, Wenwen Qiang, Lei Shi
- Abstract要約: 既存の自己管理フレームワークに組み込まれたCompMod with Meta Comprehensive Regularization (MCR)というモジュールを導入する。
提案したモデルを双方向最適化機構により更新し,包括的特徴を捉える。
本稿では,情報理論と因果対実的視点から提案手法の理論的支援を行う。
- 参考スコア(独自算出の注目度): 11.387994024747842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-Supervised Learning (SSL) methods harness the concept of semantic
invariance by utilizing data augmentation strategies to produce similar
representations for different deformations of the same input. Essentially, the
model captures the shared information among multiple augmented views of
samples, while disregarding the non-shared information that may be beneficial
for downstream tasks. To address this issue, we introduce a module called
CompMod with Meta Comprehensive Regularization (MCR), embedded into existing
self-supervised frameworks, to make the learned representations more
comprehensive. Specifically, we update our proposed model through a bi-level
optimization mechanism, enabling it to capture comprehensive features.
Additionally, guided by the constrained extraction of features using maximum
entropy coding, the self-supervised learning model learns more comprehensive
features on top of learning consistent features. In addition, we provide
theoretical support for our proposed method from information theory and causal
counterfactual perspective. Experimental results show that our method achieves
significant improvement in classification, object detection and instance
segmentation tasks on multiple benchmark datasets.
- Abstract(参考訳): 自己監督学習(SSL)手法は、データ拡張戦略を利用して意味不変性の概念を利用して、同じ入力の異なる変形に対して同様の表現を生成する。
基本的に、モデルはサンプルの複数の拡張ビュー間で共有情報をキャプチャし、下流タスクに有益な非共有情報を無視する。
この問題に対処するため,既存の自己組織化フレームワークに組み込まれたCompMod with Meta Comprehensive Regularization (MCR)というモジュールを導入し,学習した表現をより包括的にする。
具体的には,2段階最適化機構を用いて提案モデルを更新し,包括的特徴を捉える。
さらに、最大エントロピー符号化を用いた機能の制約抽出により、自己教師付き学習モデルは、一貫した特徴を学習する上でより包括的な機能を学ぶ。
さらに,情報理論と因果対実的視点から提案手法の理論的支援を行う。
実験の結果,複数のベンチマークデータセットにおける分類,オブジェクト検出,インスタンスセグメンテーションタスクにおいて有意な改善が得られた。
関連論文リスト
- A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。
自己教師型学習のための生成潜在変数モデルを提案する。
対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文 参考訳(メタデータ) (2024-02-02T13:31:17Z) - R-Cut: Enhancing Explainability in Vision Transformers with Relationship
Weighted Out and Cut [14.382326829600283]
リレーションウェイトアウト」と「カット」の2つのモジュールを紹介します。
Cut"モジュールは、位置、テクスチャ、色などの要素を考慮して、きめ細かい特徴分解を行う。
我々は,ImageNetデータセット上で定性的かつ定量的な実験を行い,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-07-18T08:03:51Z) - RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文 参考訳(メタデータ) (2023-07-03T13:21:58Z) - Multi-View Class Incremental Learning [57.14644913531313]
マルチビュー学習(MVL)は、下流タスクのパフォーマンスを改善するためにデータセットの複数の視点から情報を統合することで大きな成功を収めている。
本稿では,複数視点クラスインクリメンタルラーニング(MVCIL)と呼ばれる新しいパラダイムについて考察する。
論文 参考訳(メタデータ) (2023-06-16T08:13:41Z) - Mutual Information Regularization for Weakly-supervised RGB-D Salient
Object Detection [33.210575826086654]
弱教師付きRGB-Dサルエント物体検出モデルを提案する。
モーダル相互情報正規化による効果的なマルチモーダル表現学習に着目した。
論文 参考訳(メタデータ) (2023-06-06T12:36:57Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Multi-view Information Bottleneck Without Variational Approximation [34.877573432746246]
情報ボトルネックの原理を教師付き多視点学習シナリオに拡張する。
我々は、最近提案された行列ベースのR'enyiの$alpha$-order entropy関数を用いて、結果の目的を最適化する。
合成と実世界の両方のデータセットにおける実験結果から,各ビューにおけるノイズや冗長な情報に対するロバスト性の向上が期待できる。
論文 参考訳(メタデータ) (2022-04-22T06:48:04Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。