論文の概要: Online Semi-Supervised Learning with Bandit Feedback
- arxiv url: http://arxiv.org/abs/2010.12574v1
- Date: Fri, 23 Oct 2020 17:56:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 22:00:10.864780
- Title: Online Semi-Supervised Learning with Bandit Feedback
- Title(参考訳): Bandit Feedbackを用いたオンライン半教師付き学習
- Authors: Sohini Upadhyay, Mikhail Yurochkin, Mayank Agarwal, Yasaman Khazaeni
and DjallelBouneffouf
- Abstract要約: 半教師付き学習と文脈的包帯の交点における新しい問題を定式化する。
半教師付き学習手法であるグラフ畳み込みネットワーク(GCN)が,新たな問題定式化に適応できることを実証する。
- 参考スコア(独自算出の注目度): 45.899239661737795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We formulate a new problem at the intersectionof semi-supervised learning and
contextual bandits,motivated by several applications including clini-cal trials
and ad recommendations. We demonstratehow Graph Convolutional Network (GCN), a
semi-supervised learning approach, can be adjusted tothe new problem
formulation. We also propose avariant of the linear contextual bandit with
semi-supervised missing rewards imputation. We thentake the best of both
approaches to develop multi-GCN embedded contextual bandit. Our algorithmsare
verified on several real world datasets.
- Abstract(参考訳): 半教師付き学習と文脈的バンディットの交点に新たな問題を定式化し,クリニカルトライアルや広告レコメンデーションなどの応用を動機付ける。
半教師付き学習手法であるグラフ畳み込みネットワーク(GCN)が,新たな問題定式化に適応できることを実証する。
また,半教師付き報酬計算を欠いた線形文脈帯域の変種も提案する。
次に,マルチGCN組込みコンテキスト帯域の開発において,両手法の利点を生かした。
我々のアルゴリズムはいくつかの実世界のデータセットで検証されている。
関連論文リスト
- Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - Rank Flow Embedding for Unsupervised and Semi-Supervised Manifold
Learning [9.171175292808144]
本稿では,教師なしおよび半教師付きシナリオに対するランクフロー埋め込み (RFE) という新しい多様体学習アルゴリズムを提案する。
RFEは文脈に敏感な埋め込みを計算し、それはランクベースの処理フローに従って洗練される。
生成された埋め込みは、より効果的な教師なし検索や半教師付き分類に利用することができる。
論文 参考訳(メタデータ) (2023-04-24T21:02:12Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Revisiting Deep Semi-supervised Learning: An Empirical Distribution
Alignment Framework and Its Generalization Bound [97.93945601881407]
経験分布アライメントによる半教師あり学習(SLEDA)と呼ばれる深層半教師あり学習フレームワークを提案する。
ラベル付きデータに対するトレーニング誤差を最小化することにより,半教師付き学習の一般化誤差を効果的にバウンドできることを示す。
新しい枠組みと理論的境界に基づいて、Augmented Distribution Alignment Network(ADA-Net)と呼ばれるシンプルで効果的な深層半教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2022-03-13T11:59:52Z) - Communication Efficient Federated Learning for Generalized Linear
Bandits [39.1899551748345]
連合学習環境下での一般化線形バンディットモデルについて検討する。
ローカルな更新とオフラインなリグレッションにオンラインのレグレッションを利用する通信効率の高いソリューションフレームワークを提案する。
我々のアルゴリズムは, 後悔とコミュニケーションの両コストにおいて, サブ線形レートが得られる。
論文 参考訳(メタデータ) (2022-02-02T15:31:45Z) - Asynchronous Upper Confidence Bound Algorithms for Federated Linear
Bandits [35.47147821038291]
本稿では,同種クライアントと異種クライアントの集合に対する非同期モデル更新と通信を行う汎用フレームワークを提案する。
この分散学習フレームワークにおける後悔とコミュニケーションのコストに関する厳密な理論的分析が提供される。
論文 参考訳(メタデータ) (2021-10-04T14:01:32Z) - Convolutional Neural Bandit: Provable Algorithm for Visual-aware
Advertising [41.30283330958433]
コンテクチュアルなマルチアームバンディットは、レコメンデーション手順に存在する探索・探索ジレンマを解決するための広告の適用に成功している。
本稿では,視覚的広告に触発され,文脈的帯域幅アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-02T03:02:29Z) - Learning by Fixing: Solving Math Word Problems with Weak Supervision [70.62896781438694]
数学用語問題(mwps)の従来のニューラルネットワークソルバは、完全な監視によって学習され、多様なソリューションを生み出すことができない。
MWPを学習するためのテキスト弱教師付きパラダイムを提案する。
この手法は最終回答のアノテーションのみを必要とし、単一の問題に対して様々な解決策を生成できる。
論文 参考訳(メタデータ) (2020-12-19T03:10:21Z) - Reinforcement Learning as Iterative and Amortised Inference [62.997667081978825]
我々は、この制御を推論フレームワークとして使用し、償却および反復推論に基づく新しい分類スキームを概説する。
この観点から、比較的探索されていないアルゴリズム設計空間の一部を特定できることを示す。
論文 参考訳(メタデータ) (2020-06-13T16:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。