論文の概要: Data driven algorithms for limited labeled data learning
- arxiv url: http://arxiv.org/abs/2103.10547v1
- Date: Thu, 18 Mar 2021 22:19:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 21:42:21.098363
- Title: Data driven algorithms for limited labeled data learning
- Title(参考訳): 限定ラベルデータ学習のためのデータ駆動アルゴリズム
- Authors: Maria-Florina Balcan, Dravyansh Sharma
- Abstract要約: 類似ノードが類似するラベルを持つ可能性が高いという暗黙の仮定の下で,ラベルのない例がグラフで接続されるグラフベースの手法に注目した。
本稿では,このグラフを学習するための新しいデータ駆動アプローチを提案し,分布形式とオンライン学習形式の両方において強力な形式的保証を提供する。
- 参考スコア(独自算出の注目度): 35.193000364580975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a novel data driven approach for designing learning algorithms
that can effectively learn with only a small number of labeled examples. This
is crucial for modern machine learning applications where labels are scarce or
expensive to obtain. We focus on graph-based techniques, where the unlabeled
examples are connected in a graph under the implicit assumption that similar
nodes likely have similar labels. Over the past decades, several elegant
graph-based semi-supervised and active learning algorithms for how to infer the
labels of the unlabeled examples given the graph and a few labeled examples
have been proposed. However, the problem of how to create the graph (which
impacts the practical usefulness of these methods significantly) has been
relegated to domain-specific art and heuristics and no general principles have
been proposed. In this work we present a novel data driven approach for
learning the graph and provide strong formal guarantees in both the
distributional and online learning formalizations.
We show how to leverage problem instances coming from an underlying problem
domain to learn the graph hyperparameters from commonly used parametric
families of graphs that perform well on new instances coming from the same
domain. We obtain low regret and efficient algorithms in the online setting,
and generalization guarantees in the distributional setting. We also show how
to combine several very different similarity metrics and learn multiple
hyperparameters, providing general techniques to apply to large classes of
problems. We expect some of the tools and techniques we develop along the way
to be of interest beyond semi-supervised and active learning, for data driven
algorithms for combinatorial problems more generally.
- Abstract(参考訳): 少数のラベル付きサンプルだけで効果的に学習できる学習アルゴリズムを設計するための,新しいデータ駆動型アプローチを検討する。
これはラベルが手に入らない、あるいは高価である現代の機械学習アプリケーションにとって非常に重要である。
類似ノードが類似するラベルを持つ可能性が高いという暗黙の仮定の下で,ラベルのない例がグラフで接続されるグラフベースの手法に注目した。
過去数十年にわたり、グラフといくつかのラベル付き例からラベルなし例のラベルを推測する方法に関するエレガントなグラフベースの半教師付き能動的学習アルゴリズムが提案されている。
しかし、グラフの作成方法(これらの手法の実用性に大きな影響を与える)の問題は、ドメイン固有の技術やヒューリスティックに委ねられ、一般的な原則は提案されていない。
本研究では,グラフ学習のための新しいデータ駆動型アプローチを提案し,分散学習とオンライン学習の両形式化において強力な形式的保証を提供する。
同じドメインの新しいインスタンスでうまく機能するグラフのパラメトリックファミリからグラフハイパーパラメータを学ぶために、基盤となる問題ドメインから発生する問題インスタンスをどのように活用するかを示す。
オンライン環境では,少ない後悔と効率のよいアルゴリズムが得られ,分散環境では一般化が保証される。
また、いくつかの非常に異なる類似度メトリクスを結合し、複数のハイパーパラメータを学習する方法を示し、大きな問題のクラスに適用するための一般的な技術を提供する。
私たちは、組み合わさった問題に対するデータ駆動アルゴリズムに対して、半教師付き、アクティブな学習以上の関心を持つように開発するツールやテクニックを期待しています。
関連論文リスト
- Efficiently Learning the Graph for Semi-supervised Learning [4.518012967046983]
共役勾配法を用いてスパース族から最良のグラフを効率的に学習する方法を示す。
我々の手法は、軽度な滑らかさの仮定の下で、オンラインのサブ線形後悔でグラフを効率的に学習するためにも利用できる。
提案手法を実装し,ベンチマークデータセット上の学習グラフを用いた半教師付き学習の先行研究に対して,大幅な(sim$10-100x)スピードアップを示す。
論文 参考訳(メタデータ) (2023-06-12T13:22:06Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - A simple way to learn metrics between attributed graphs [11.207372645301094]
トレーニング可能なパラメータがほとんどないSGMLモデルを提案する。
このモデルにより、ラベル付き(分散)グラフのデータベースから適切な距離を構築することができ、単純な分類アルゴリズムの性能を向上させることができる。
論文 参考訳(メタデータ) (2022-09-26T14:32:38Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - A Unifying Generative Model for Graph Learning Algorithms: Label
Propagation, Graph Convolutions, and Combinations [39.8498896531672]
グラフに関する半教師付き学習は、ネットワーク科学と機械学習において広く適用可能な問題である。
我々は,ノード属性のデータ生成プロセスのためのマルコフ確率場モデルを開発した。
ラベル伝播,線形化グラフ畳み込みネットワーク,それらの組み合わせが条件付き期待値として導出できることを示す。
論文 参考訳(メタデータ) (2021-01-19T17:07:08Z) - Distributed Training of Graph Convolutional Networks using Subgraph
Approximation [72.89940126490715]
本稿では,グラフの複数の分割にまたがる失われる情報をサブグラフ近似スキームで緩和するトレーニング戦略を提案する。
サブグラフ近似アプローチは、分散トレーニングシステムが単一マシン精度で収束するのに役立つ。
論文 参考訳(メタデータ) (2020-12-09T09:23:49Z) - Graph topology inference benchmarks for machine learning [16.857405938139525]
本稿では,グラフ推論手法の相対的メリットと限界を明らかにするために,いくつかのベンチマークを導入する。
我々はまた、文学において最も顕著な技法のいくつかを対比している。
論文 参考訳(メタデータ) (2020-07-16T09:40:32Z) - Active Learning on Attributed Graphs via Graph Cognizant Logistic
Regression and Preemptive Query Generation [37.742218733235084]
本稿では,属性グラフにおけるノード分類処理のための新しいグラフベース能動学習アルゴリズムを提案する。
提案アルゴリズムは,線形化グラフ畳み込みニューラルネットワーク(GCN)と等価なグラフ認識ロジスティック回帰を用いて,予測フェーズの誤差低減を最大化する。
5つの公開ベンチマークデータセットで実験を行い、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-07-09T18:00:53Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。