論文の概要: Mathematical Foundations of Graph-Based Bayesian Semi-Supervised
Learning
- arxiv url: http://arxiv.org/abs/2207.01093v1
- Date: Sun, 3 Jul 2022 18:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 13:54:41.738070
- Title: Mathematical Foundations of Graph-Based Bayesian Semi-Supervised
Learning
- Title(参考訳): グラフベースベイズ半教師付き学習の数学的基礎
- Authors: Nicolas Garc\'ia Trillos, Daniel Sanz-Alonso, Ruiyi Yang
- Abstract要約: 本稿では,特徴間の類似性を利用したラベル伝搬フレームワークBayesian SSLについて概説する。
SSLは活発な研究領域であり、現存する文献の徹底的なレビューはこの記事の範囲を超えている。
- 参考スコア(独自算出の注目度): 2.707154152696381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent decades, science and engineering have been revolutionized by a
momentous growth in the amount of available data. However, despite the
unprecedented ease with which data are now collected and stored, labeling data
by supplementing each feature with an informative tag remains to be
challenging. Illustrative tasks where the labeling process requires expert
knowledge or is tedious and time-consuming include labeling X-rays with a
diagnosis, protein sequences with a protein type, texts by their topic, tweets
by their sentiment, or videos by their genre. In these and numerous other
examples, only a few features may be manually labeled due to cost and time
constraints. How can we best propagate label information from a small number of
expensive labeled features to a vast number of unlabeled ones? This is the
question addressed by semi-supervised learning (SSL).
This article overviews recent foundational developments on graph-based
Bayesian SSL, a probabilistic framework for label propagation using
similarities between features. SSL is an active research area and a thorough
review of the extant literature is beyond the scope of this article. Our focus
will be on topics drawn from our own research that illustrate the wide range of
mathematical tools and ideas that underlie the rigorous study of the
statistical accuracy and computational efficiency of graph-based Bayesian SSL.
- Abstract(参考訳): 数十年間、科学とエンジニアリングは、利用可能なデータ量の増加によって革命を遂げてきた。
しかし、データが収集され保存されるという前代未聞の容易さにもかかわらず、各機能を情報タグで補うことでラベル付けするのは難しい。
ラベル付けプロセスが専門知識を必要としたり、退屈で時間のかかる作業には、診断を伴うx線標識、タンパク質型によるタンパク質配列、トピックによるテキスト、感情によるつぶやき、ジャンルによるビデオなどがある。
これらや他の多くの例では、コストと時間の制約のために手動でラベル付けされる機能はわずかである。
少数の高価なラベル付き機能から、膨大な数のラベル付き機能まで、ラベル情報をどのように伝達するか。
これは半教師付き学習(ssl)によって解決される問題である。
本稿では,特徴間の類似性を利用したラベル伝搬の確率的フレームワークであるBayesian SSLに関する最近の基礎開発について概説する。
SSLは活発な研究領域であり、現存する文献の徹底的なレビューはこの記事の範囲を超えている。
我々の焦点は、グラフベースのベイズSSLの統計的精度と計算効率に関する厳密な研究の基盤となる、幅広い数学的ツールとアイデアを示す、我々の研究から得られたトピックに焦点を当てる。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Context Matters: Leveraging Spatiotemporal Metadata for Semi-Supervised Learning on Remote Sensing Images [2.518656729567209]
現在のアプローチでは、未ラベルサンプルのモデル予測から擬似ラベルを生成する。
擬似ラベルの品質向上のために,SSLにおける時空間情報の利用を提案する。
テスト時に予測器の入力に利用可能なメタデータを追加すると、トレーニングセットの時間分布外のメタデータの予測品質が劣化することを示す。
論文 参考訳(メタデータ) (2024-04-29T10:47:37Z) - Self-supervised on Graphs: Contrastive, Generative,or Predictive [25.679620842010422]
SSL(Self-supervised Learning)は、よく設計されたプリテキストタスクを通じて有益な知識を抽出するための新しいパラダイムとして登場しています。
既存のグラフSSLメソッドは、コントラスト、生成、予測の3つのカテゴリに分けられる。
また、一般的なデータセット、評価メトリクス、下流タスク、さまざまなアルゴリズムのオープンソース実装をまとめています。
論文 参考訳(メタデータ) (2021-05-16T03:30:03Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Graph Self-Supervised Learning: A Survey [73.86209411547183]
SSL(Self-supervised Learning)は、グラフデータの有望でトレンドの学習パラダイムとなっています。
グラフデータにSSL技術を用いた既存のアプローチをタイムリーかつ包括的にレビューします。
論文 参考訳(メタデータ) (2021-02-27T03:04:21Z) - Graph-based Semi-supervised Learning: A Comprehensive Review [51.26862262550445]
半教師付き学習(ssl)はラベル付きデータとラベルなしデータの両方を利用する能力があるため、実際非常に価値があります。
重要なSSLメソッドのクラスは、グラフベースの半教師付き学習(GSSL)メソッドに対応するグラフとしてデータを自然に表現することです。
GSSLメソッドは、構造のユニークさ、アプリケーションの普遍性、大規模データへのスケーラビリティのために、さまざまなドメインでその利点を実証しています。
論文 参考訳(メタデータ) (2021-02-26T05:11:09Z) - Analysis of label noise in graph-based semi-supervised learning [2.4366811507669124]
機械学習では、目に見えないデータに一般化できるモデルを監督するためにラベルを取得する必要がある。
多くの場合、私たちのデータのほとんどはラベル付けされていない。
半教師付き学習(SSL)は、ラベルと入力データ分布の関係について強い仮定をすることで緩和する。
論文 参考訳(メタデータ) (2020-09-27T22:13:20Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Self-supervised Learning on Graphs: Deep Insights and New Direction [66.78374374440467]
自己教師付き学習(SSL)は、ラベルのないデータにドメイン固有のプレテキストタスクを作成することを目的としている。
グラフニューラルネットワーク(GNN)の形でのグラフ領域へのディープラーニングの一般化への関心が高まっている。
論文 参考訳(メタデータ) (2020-06-17T20:30:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。