論文の概要: Deep Semi-supervised Learning with Double-Contrast of Features and
Semantics
- arxiv url: http://arxiv.org/abs/2211.15671v1
- Date: Mon, 28 Nov 2022 09:08:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:59:39.312352
- Title: Deep Semi-supervised Learning with Double-Contrast of Features and
Semantics
- Title(参考訳): 特徴とセマンティクスの二重一致による深い半教師付き学習
- Authors: Quan Feng, Jiayu Yao, Zhison Pan, Guojun Zhou
- Abstract要約: 本稿では,エンド・ツー・エンドの半教師あり学習における意味と特徴の二重コントラストを提案する。
我々は情報理論を活用し、意味論と特徴の二重コントラストの合理性を説明する。
- 参考スコア(独自算出の注目度): 2.2230089845369094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the field of intelligent transportation systems (ITS) has
achieved remarkable success, which is mainly due to the large amount of
available annotation data. However, obtaining these annotated data has to
afford expensive costs in reality. Therefore, a more realistic strategy is to
leverage semi-supervised learning (SSL) with a small amount of labeled data and
a large amount of unlabeled data. Typically, semantic consistency
regularization and the two-stage learning methods of decoupling feature
extraction and classification have been proven effective. Nevertheless,
representation learning only limited to semantic consistency regularization may
not guarantee the separation or discriminability of representations of samples
with different semantics; due to the inherent limitations of the two-stage
learning methods, the extracted features may not match the specific downstream
tasks. In order to deal with the above drawbacks, this paper proposes an
end-to-end deep semi-supervised learning double contrast of semantic and
feature, which extracts effective tasks specific discriminative features by
contrasting the semantics/features of positive and negative augmented samples
pairs. Moreover, we leverage information theory to explain the rationality of
double contrast of semantics and features and slack mutual information to
contrastive loss in a simpler way. Finally, the effectiveness of our method is
verified in benchmark datasets.
- Abstract(参考訳): 近年、インテリジェントトランスポートシステム(ITS)の分野は、大量のアノテーションデータによって大きな成功を収めている。
しかし、これらの注釈付きデータを取得するには、実際のコストがかかる必要がある。
したがって、より現実的な戦略は、少量のラベル付きデータと大量のラベルなしデータで半教師付き学習(SSL)を活用することである。
典型的には、意味整合性規則化と特徴抽出と分類を分離する2段階学習法が有効であることが証明されている。
それにもかかわらず、意味的一貫性の正規化のみに限定された表現学習は、異なる意味論を持つサンプルの表現の分離や判別性を保証するものではない。
以上の欠点に対処するため,本論文では,正と負の強化サンプルペアのセマンティクス/特徴を対比することにより,効果的なタスク固有の識別特徴を抽出する,意味と特徴の両立を両立する深層半教師付き学習手法を提案する。
さらに,情報理論を用いて意味論と特徴の二重コントラストの合理性を説明し,slack相互情報をより単純な方法でコントラスト損失を説明する。
最後に,本手法の有効性をベンチマークデータセットで検証した。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - ItTakesTwo: Leveraging Peer Representations for Semi-supervised LiDAR Semantic Segmentation [24.743048965822297]
本稿では,ItTakesTwo (IT2) と呼ばれる半教師付きLiDARセマンティックセマンティックセマンティクスフレームワークを提案する。
IT2は、ピアLiDAR表現からの一貫性のある予測を保証するために設計されており、一貫性学習における摂動効率を改善する。
その結果,本手法は従来のSOTA法よりも顕著に改善されていることがわかった。
論文 参考訳(メタデータ) (2024-07-09T18:26:53Z) - Learning Discriminative Spatio-temporal Representations for Semi-supervised Action Recognition [23.44320273156057]
本稿では,適応コントラスト学習(ACL)戦略とマルチスケールテンポラル学習(MTL)戦略を提案する。
ACL戦略は、ラベル付きデータのクラスプロトタイプにより、全ての未ラベルサンプルの信頼性を評価し、擬ラベル付きサンプルバンクから正負のサンプルを適応的に選択し、コントラスト学習を構築する。
MTL戦略は、長期クリップからの情報的意味を強調し、ノイズ情報を抑制しながら、それらを短期クリップに統合する。
論文 参考訳(メタデータ) (2024-04-25T08:49:08Z) - Scribble-supervised Cell Segmentation Using Multiscale Contrastive
Regularization [9.849498498869258]
Scribble2Label (S2L) は、一握りのスクリブルと自己教師付き学習を使用することで、完全なアノテーションなしで正確なセグメンテーション結果を生成することを示した。
本研究では,S2Lに対して,新しいマルチスケールコントラスト正規化項を用いる。
主なアイデアは、ニューラルネットワークの中間層から特徴を抽出して、さまざまなスケールの構造を効果的に分離できるようにすることである。
論文 参考訳(メタデータ) (2023-06-25T06:00:33Z) - Semantic-aware Contrastive Learning for More Accurate Semantic Parsing [32.74456368167872]
そこで本研究では,意味表現の微粒化を学習できる意味認識型コントラスト学習アルゴリズムを提案する。
2つの標準データセットの実験により、我々の手法はMLEベースラインよりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2023-01-19T07:04:32Z) - Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。
厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文 参考訳(メタデータ) (2022-06-20T03:09:46Z) - Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z) - Uncertainty-Guided Mutual Consistency Learning for Semi-Supervised
Medical Image Segmentation [9.745971699005857]
医用画像セグメンテーションのための新しい不確実性誘導相互整合学習フレームワークを提案する。
タスクレベルの正規化によるタスク内一貫性学習と、タスク間の整合性学習を統合して、幾何学的な形状情報を活用する。
本手法は,ラベルのないデータを活用し,既存の半教師付きセグメンテーション法より優れた性能を実現する。
論文 参考訳(メタデータ) (2021-12-05T08:19:41Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Information Symmetry Matters: A Modal-Alternating Propagation Network
for Few-Shot Learning [118.45388912229494]
未ラベルサンプルの欠落した意味情報を補うために,モーダル代替伝搬ネットワーク (MAP-Net) を提案する。
我々は,情報伝達がより有益になるように,セマンティクスを介して視覚的関係ベクトルを誘導するリレーガイダンス(RG)戦略を設計する。
提案手法は有望な性能を達成し,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2021-09-03T03:43:53Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。