論文の概要: Progressive Feature Upgrade in Semi-supervised Learning on Tabular
Domain
- arxiv url: http://arxiv.org/abs/2212.00892v1
- Date: Thu, 1 Dec 2022 22:18:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 17:17:13.447525
- Title: Progressive Feature Upgrade in Semi-supervised Learning on Tabular
Domain
- Title(参考訳): 表領域における半教師付き学習におけるプログレッシブ・フィーチャー・アップグレード
- Authors: Morteza Mohammady Gharasuie, Fenjiao Wang
- Abstract要約: 最近の半監督的・自己監督的手法は画像領域とテキスト領域において大きな成功を収めている。
異なるデータ型が混在しているため、画像や言語から表データへのドメイン固有の変換を適応するのは容易ではない。
条件付き確率表現と,効率的な機能アップグレードフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent semi-supervised and self-supervised methods have shown great success
in the image and text domain by utilizing augmentation techniques. Despite such
success, it is not easy to transfer this success to tabular domains. It is not
easy to adapt domain-specific transformations from image and language to
tabular data due to mixing of different data types (continuous data and
categorical data) in the tabular domain. There are a few semi-supervised works
on the tabular domain that have focused on proposing new augmentation
techniques for tabular data. These approaches may have shown some improvement
on datasets with low-cardinality in categorical data. However, the fundamental
challenges have not been tackled. The proposed methods either do not apply to
datasets with high-cardinality or do not use an efficient encoding of
categorical data. We propose using conditional probability representation and
an efficient progressively feature upgrading framework to effectively learn
representations for tabular data in semi-supervised applications. The extensive
experiments show superior performance of the proposed framework and the
potential application in semi-supervised settings.
- Abstract(参考訳): 近年の半教師あり・自己教師あり方式は強調技術を利用して画像・テキスト領域において大きな成功を収めている。
このような成功にもかかわらず、この成功を表ドメインに転送するのは容易ではない。
表領域に異なるデータ型(連続データと分類データ)が混在しているため、画像や言語から表データへのドメイン固有の変換は容易ではない。
表データの新たな拡張技術の提案に焦点をあてた、表領域に関する半教師付き研究がいくつかある。
これらのアプローチは、カテゴリデータにおける低心拍数データセットにいくつかの改善をもたらした可能性がある。
しかし、基本的な課題は解決されていない。
提案手法は,高心性データセットには適用されないか,分類データの効率的な符号化を用いない。
半教師付きアプリケーションにおける表データの表現を効果的に学習するために,条件付き確率表現と効率的な機能アップグレードフレームワークを提案する。
広範な実験により,提案手法の優れた性能と,半教師あり設定における潜在的応用が示された。
関連論文リスト
- Training-Free Generalization on Heterogeneous Tabular Data via
Meta-Representation [67.30538142519067]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。
深層ニューラルネットワークは、これらのメタ表現とデータセット固有の分類信頼度を関連付けるように訓練される。
実験により、TabPTMは、数ショットのシナリオであっても、新しいデータセットで有望なパフォーマンスを達成することを確認した。
論文 参考訳(メタデータ) (2023-10-31T18:03:54Z) - Revisiting Self-Training with Regularized Pseudo-Labeling for Tabular
Data [0.0]
我々は、勾配向上決定木を含むあらゆる種類のアルゴリズムに適用可能な自己学習を再考する。
疑似ラベルの可能性に基づいて信頼度を正則化する新しい擬似ラベル手法を提案する。
論文 参考訳(メタデータ) (2023-02-27T18:12:56Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Dominant Set-based Active Learning for Text Classification and its
Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。
提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。
本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2022-01-28T19:19:03Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Contrastive Mixup: Self- and Semi-Supervised learning for Tabular Domain [8.25619425813267]
グラフデータのための半教師付き学習フレームワークであるContrastive Mixupを紹介する。
提案手法は,多様体仮定下でのミックスアップに基づく拡張を利用する。
提案手法が公開データセットと実世界の臨床データセットに与える影響を実証する。
論文 参考訳(メタデータ) (2021-08-27T14:09:13Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - Semi-supervised Meta-learning with Disentanglement for
Domain-generalised Medical Image Segmentation [15.351113774542839]
新たなセンター(ここではドメイン)からの新しいデータにモデルを一般化することは、依然として課題である。
本稿では,絡み合いを伴う半教師付きメタラーニングフレームワークを提案する。
提案手法は,異なるセグメンテーションタスクに対して頑健であり,2つの公開ベンチマーク上での最先端の一般化性能を実現する。
論文 参考訳(メタデータ) (2021-06-24T19:50:07Z) - i-Mix: A Domain-Agnostic Strategy for Contrastive Representation
Learning [117.63815437385321]
対照的な表現学習を改善するために, 単純で効果的なドメインに依存しない正規化戦略i-Mixを提案する。
実験では、i-Mixはドメイン間の学習表現の質を一貫して改善することを示した。
論文 参考訳(メタデータ) (2020-10-17T23:32:26Z) - $n$-Reference Transfer Learning for Saliency Prediction [73.17061116358036]
本稿では,サリエンシ予測のための数発のトランスファー学習パラダイムを提案する。
提案するフレームワークは勾配ベースでモデルに依存しない。
その結果,提案フレームワークは大幅な性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2020-07-09T23:20:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。