論文の概要: Persistent Laplacian-enhanced Algorithm for Scarcely Labeled Data
Classification
- arxiv url: http://arxiv.org/abs/2305.16239v1
- Date: Thu, 25 May 2023 16:49:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:41:47.618194
- Title: Persistent Laplacian-enhanced Algorithm for Scarcely Labeled Data
Classification
- Title(参考訳): ラベル付きデータ分類のための持続的ラプラシアンエンハンスドアルゴリズム
- Authors: Gokul Bhusal, Ekaterina Merkurjev, Guo-Wei Wei
- Abstract要約: 永続ラプラシア拡張グラフMBO (PL-MBO) と呼ばれる半教師付き手法を提案する。
PL-MBOは、永続スペクトルグラフ理論と古典的なメリマン・バーンス=オッシャースキームを統合する。
データ分類における提案手法の性能評価を行った。
- 参考スコア(独自算出の注目度): 2.8360662552057323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of many machine learning (ML) methods depends crucially on having
large amounts of labeled data. However, obtaining enough labeled data can be
expensive, time-consuming, and subject to ethical constraints for many
applications. One approach that has shown tremendous value in addressing this
challenge is semi-supervised learning (SSL); this technique utilizes both
labeled and unlabeled data during training, often with much less labeled data
than unlabeled data, which is often relatively easy and inexpensive to obtain.
In fact, SSL methods are particularly useful in applications where the cost of
labeling data is especially expensive, such as medical analysis, natural
language processing (NLP), or speech recognition. A subset of SSL methods that
have achieved great success in various domains involves algorithms that
integrate graph-based techniques. These procedures are popular due to the vast
amount of information provided by the graphical framework and the versatility
of their applications. In this work, we propose an algebraic topology-based
semi-supervised method called persistent Laplacian-enhanced graph MBO (PL-MBO)
by integrating persistent spectral graph theory with the classical
Merriman-Bence- Osher (MBO) scheme. Specifically, we use a filtration procedure
to generate a sequence of chain complexes and associated families of simplicial
complexes, from which we construct a family of persistent Laplacians. Overall,
it is a very efficient procedure that requires much less labeled data to
perform well compared to many ML techniques, and it can be adapted for both
small and large datasets. We evaluate the performance of the proposed method on
data classification, and the results indicate that the proposed technique
outperforms other existing semi-supervised algorithms.
- Abstract(参考訳): 多くの機械学習(ML)手法の成功は、大量のラベル付きデータを持つことに大きく依存する。
しかし、十分なラベル付きデータを得ることは高価で時間がかかり、多くのアプリケーションで倫理的な制約を受ける可能性がある。
この手法はトレーニング中にラベル付きデータとラベル付きデータの両方を使用し、ラベル付きデータよりもラベル付きデータの方が比較的簡単で安価であることが多い。
実際、SSLメソッドは医療分析、自然言語処理(NLP)、音声認識など、ラベル付けのコストが特に高いアプリケーションでは特に有用である。
様々な分野で大きな成功を収めたsslメソッドのサブセットは、グラフベースの技術を統合するアルゴリズムを含んでいる。
これらの手順は、グラフィカルフレームワークが提供する膨大な情報と、それらのアプリケーションの汎用性のために人気がある。
本研究では、永続スペクトルグラフ理論と古典的メリマン・バンス・オッシャー(MBO)スキームを統合することで、永続ラプラシア強調グラフ(PL-MBO)と呼ばれる代数トポロジに基づく半教師付き手法を提案する。
具体的には, 濾過法を用いて, 鎖状錯体の配列とそれに関連する単座錯体の族を生成し, 永続的なラプラシアンの族を構築する。
全体として、多くのML技術と比較して、ラベル付きデータよりもはるかに少ないパフォーマンスを要求される非常に効率的なプロシージャであり、小さなデータセットと大規模なデータセットの両方に適応することができる。
本研究では,提案手法の性能評価を行い,提案手法が既存の半教師付きアルゴリズムよりも優れていることを示す。
関連論文リスト
- Stochastic Amortization: A Unified Approach to Accelerate Feature and
Data Attribution [67.28273187033693]
アモート化(amortization)と呼ばれる,所望の出力を直接予測するネットワークのトレーニングは安価で,驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Multiscale Laplacian Learning [3.24029503704305]
本稿では,機械学習タスクに対する2つの革新的なマルチスケールラプラシアン学習手法を提案する。
マルチカーネル多様体学習(MML)と呼ばれる最初のアプローチは、マルチカーネル情報と多様体学習を統合する。
2つ目のアプローチは、MBO (Multiscale MBO) 法と呼ばれ、有名な古典的なメリマン・バーンス=オッシャースキームの修正にマルチスケールのラプラシアンを導入している。
論文 参考訳(メタデータ) (2021-09-08T15:25:32Z) - Relieving the Plateau: Active Semi-Supervised Learning for a Better
Landscape [2.3046646540823916]
semi-supervised learning (ssl) はラベル付きデータよりもアクセスしやすいラベルなしデータを活用する。
active learning (al)は、ラベルなしのインスタンスを選択して、ラベル付きデータの少ないパフォーマンスを期待する。
本稿では,ラベル付き集合を含む問題条件を改善するためにラベル付きデータを選択するALアルゴリズムである収束率制御(CRC)を提案する。
論文 参考訳(メタデータ) (2021-04-08T06:03:59Z) - In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label
Selection Framework for Semi-Supervised Learning [53.1047775185362]
Pseudo-labeling (PL) は一般的な SSL アプローチで、この制約はありませんが、当初の処方では比較的不十分です。
PLは不整合モデルからの誤った高い信頼度予測により性能が低下していると論じる。
そこで本研究では,疑似ラベリング精度を向上させるための不確実性認識型擬似ラベル選択(ups)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-15T23:29:57Z) - PseudoSeg: Designing Pseudo Labels for Semantic Segmentation [78.35515004654553]
ラベルなしまたは弱いラベル付きデータを用いたトレーニングのための構造化された擬似ラベルを生成するための擬似ラベルの再設計を提案する。
提案手法の有効性を,低データと高データの両方において示す。
論文 参考訳(メタデータ) (2020-10-19T17:59:30Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z) - Analysis of label noise in graph-based semi-supervised learning [2.4366811507669124]
機械学習では、目に見えないデータに一般化できるモデルを監督するためにラベルを取得する必要がある。
多くの場合、私たちのデータのほとんどはラベル付けされていない。
半教師付き学習(SSL)は、ラベルと入力データ分布の関係について強い仮定をすることで緩和する。
論文 参考訳(メタデータ) (2020-09-27T22:13:20Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z) - Pseudo-Representation Labeling Semi-Supervised Learning [0.0]
近年、半教師付き学習は、ラベルのないデータを活用してディープラーニングモデルの性能向上に成功している。
本研究は、擬似ラベル付け技術を用いて少量の未ラベルデータを反復的にラベル付けし、それらをトレーニングデータとして使用する、シンプルで柔軟なフレームワークである擬似表現ラベリングを提案する。
従来の手法と比較して、擬似表現ラベリングはより直感的であり、現実世界の実践的な問題を効果的に解決することができる。
論文 参考訳(メタデータ) (2020-05-31T03:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。