論文の概要: A Topological Approach for Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2205.09617v1
- Date: Thu, 19 May 2022 15:23:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 11:57:35.560229
- Title: A Topological Approach for Semi-Supervised Learning
- Title(参考訳): 半教師付き学習のためのトポロジ的アプローチ
- Authors: Adri\'an In\'es, C\'esar Dom\'inguez, J\'onathan Heras, Gadea Mata and
Julio Rubio
- Abstract要約: トポロジカルデータ分析(TDA)に基づく半教師付き学習手法を提案する。
特に,2つの異なるトポロジ的アプローチに従って,2つの半教師付き学習手法を開発した。
本研究で開発された手法は,手作業でラベル付けしたデータのみを学習したモデルと,従来の半教師付き学習手法を用いて学習したモデルとを比較検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, Machine Learning and Deep Learning methods have become the
state-of-the-art approach to solve data classification tasks. In order to use
those methods, it is necessary to acquire and label a considerable amount of
data; however, this is not straightforward in some fields, since data
annotation is time consuming and might require expert knowledge. This challenge
can be tackled by means of semi-supervised learning methods that take advantage
of both labelled and unlabelled data. In this work, we present new
semi-supervised learning methods based on techniques from Topological Data
Analysis (TDA), a field that is gaining importance for analysing large amounts
of data with high variety and dimensionality. In particular, we have created
two semi-supervised learning methods following two different topological
approaches. In the former, we have used a homological approach that consists in
studying the persistence diagrams associated with the data using the Bottleneck
and Wasserstein distances. In the latter, we have taken into account the
connectivity of the data. In addition, we have carried out a thorough analysis
of the developed methods using 3 synthetic datasets, 5 structured datasets, and
2 datasets of images. The results show that the semi-supervised methods
developed in this work outperform both the results obtained with models trained
with only manually labelled data, and those obtained with classical
semi-supervised learning methods, reaching improvements of up to a 16%.
- Abstract(参考訳): 現在、機械学習とディープラーニングは、データ分類タスクを解決する最先端のアプローチとなっている。
これらの手法を使用するには、大量のデータを取得してラベル付けする必要があるが、データアノテーションは時間がかかり、専門家の知識を必要とする可能性があるため、いくつかの分野では簡単ではない。
この課題はラベル付きデータとラベルなしデータの両方を利用する半教師付き学習手法によって解決できる。
本研究では,多変量および次元の多変量解析において重要となる分野である位相データ解析(tda)の手法に基づく,新しい半教師付き学習手法を提案する。
特に, 2つの異なる位相的アプローチに従って, 半教師付き学習法を考案した。
前者では、Bottleneck と Wasserstein 距離を用いてデータに関連付けられた永続性図について研究するホモロジー的アプローチを用いている。
後者では、データの接続性を考慮しています。
また、3つの合成データセット、5つの構造化データセット、2つの画像データセットを用いた開発手法の徹底的な分析を行った。
本研究で開発された半教師付き手法は,手動ラベル付きデータのみを用いて訓練したモデルと,古典的半教師付き学習法により得られたモデルとを比較検討した結果,最大16%の改善が得られた。
関連論文リスト
- Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Latent Graphs for Semi-Supervised Learning on Biomedical Tabular Data [4.498659756007485]
本研究では,本研究において,本質的なデータ関係を捉える潜在グラフを推定する手法を提案する。
グラフに基づく表現を活用することにより,グラフ全体の情報のシームレスな伝播を容易にする。
本研究は,頑健な潜伏グラフを構築するための実践的な方法として,インスタンス間関係発見の重要性を実証する。
論文 参考訳(メタデータ) (2023-09-27T16:13:36Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - Improving Few-Shot Generalization by Exploring and Exploiting Auxiliary
Data [100.33096338195723]
補助データを用いたFew-shot Learning(FLAD)に焦点を当てる。
FLADは、一般化を改善するために、数ショットの学習中に補助データへのアクセスを前提としている。
提案するアルゴリズムは EXP3-FLAD と UCB1-FLAD の2つである。
論文 参考訳(メタデータ) (2023-02-01T18:59:36Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Enhancing ensemble learning and transfer learning in multimodal data
analysis by adaptive dimensionality reduction [10.646114896709717]
マルチモーダルデータ分析では、すべての観測が同じレベルの信頼性や情報品質を示すわけではない。
この問題を克服するために,次元削減のための適応的アプローチを提案する。
多様な研究分野で得られたマルチモーダルデータセットのアプローチをテストします。
論文 参考訳(メタデータ) (2021-05-08T11:53:12Z) - Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-03T13:02:00Z) - Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。
局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。
本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文 参考訳(メタデータ) (2020-08-17T15:49:30Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。