論文の概要: A Boosting Algorithm for Positive-Unlabeled Learning
- arxiv url: http://arxiv.org/abs/2205.09485v1
- Date: Thu, 19 May 2022 11:50:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 12:39:55.888521
- Title: A Boosting Algorithm for Positive-Unlabeled Learning
- Title(参考訳): 正ラベル学習のためのブースティングアルゴリズム
- Authors: Yawen Zhao, Mingzhe Zhang, Chenhao Zhang, Tony Chen, Nan Ye, Miao Xu
- Abstract要約: Positive-Unlabeled (PU) 学習は、正の (P) と未ラベルの (U) データのみが利用できる場合のバイナリ分類問題を扱う。
本稿では,ニューラルネットワークと比較した新しいPU学習アルゴリズムAda-PUを提案する。
実験では、Ada-PUがベンチマークPUデータセットでニューラルネットワークより優れていることを示した。
- 参考スコア(独自算出の注目度): 11.872187498935135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Positive-unlabeled (PU) learning deals with binary classification problems
when only positive (P) and unlabeled (U) data are available. A lot of PU
methods based on linear models and neural networks have been proposed; however,
there still lacks study on how the theoretically sound boosting-style
algorithms could work with P and U data. Considering that in some scenarios
when neural networks cannot perform as good as boosting algorithms even with
fully-supervised data, we propose a novel boosting algorithm for PU learning:
Ada-PU, which compares against neural networks. Ada-PU follows the general
procedure of AdaBoost while two different distributions of P data are
maintained and updated. After a weak classifier is learned on the newly updated
distribution, the corresponding combining weight for the final ensemble is
estimated using only PU data. We demonstrated that with a smaller set of base
classifiers, the proposed method is guaranteed to keep the theoretical
properties of boosting algorithm. In experiments, we showed that Ada-PU
outperforms neural networks on benchmark PU datasets. We also study a
real-world dataset UNSW-NB15 in cyber security and demonstrated that Ada-PU has
superior performance for malicious activities detection.
- Abstract(参考訳): Positive-Unlabeled (PU) 学習は、正 (P) と未ラベル (U) のデータのみが利用できる場合のバイナリ分類問題を扱う。
線形モデルとニューラルネットワークに基づくPU法が数多く提案されているが、理論上は音声ブースティングスタイルのアルゴリズムがPとUのデータでどのように機能するかは研究されていない。
ニューラルネットワークが完全に教師されたデータでもアルゴリズムを向上できないシナリオを考えると、PU学習のための新しいブースティングアルゴリズムであるAda-PUを提案する。
Ada-PUはAdaBoostの一般的な手順に従い、Pデータの2つの異なる分布が維持および更新される。
新たに更新された分布について弱い分類器を学習した後、PUデータのみを用いて最終アンサンブルに対する対応する組み合わせ重みを推定する。
提案手法は,より小さな基底分類器を用いて,ブースティングアルゴリズムの理論的特性を維持することが保証された。
実験では、ベンチマークpuデータセットでada-puがニューラルネットワークを上回ることを示した。
また,サイバーセキュリティにおける実世界のデータセットunsw-nb15を調査し,ada-puが悪意のある活動検出に優れた性能を持つことを示した。
関連論文リスト
- Unrolled denoising networks provably learn optimal Bayesian inference [54.79172096306631]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。
圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文 参考訳(メタデータ) (2024-09-19T17:56:16Z) - Meta-learning for Positive-unlabeled Classification [40.11462237689747]
提案手法は,モデルがPUデータに適用された後のテスト分類リスクを最小限に抑える。
この方法は各インスタンスをニューラルネットワークを使ってタスク固有の空間に埋め込む。
提案手法は1つの実世界のデータセットと3つの実世界のデータセットで既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-06T01:50:01Z) - Learning A Disentangling Representation For PU Learning [18.94726971543125]
本稿では、ラベルのないデータを2つのクラスタに投影するロス関数を用いて、ニューラルネットワークに基づくデータ表現を学習することを提案する。
提案手法の性能向上を実証する PU データのシミュレーション実験を行った。
論文 参考訳(メタデータ) (2023-10-05T18:33:32Z) - Fast, Distribution-free Predictive Inference for Neural Networks with
Coverage Guarantees [25.798057062452443]
本稿では,予測推論(PI)のための新しい計算効率アルゴリズムを提案する。
データに対する分布的な仮定は不要で、ニューラルネットワークの既存のブートストラップ方式よりも高速に計算できる。
論文 参考訳(メタデータ) (2023-06-11T04:03:58Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Neural Algorithmic Reasoning with Causal Regularisation [18.299363749150093]
我々は重要な観察を行う: アルゴリズムが特定の中間計算を同一に実行する多くの異なる入力が存在する。
この洞察により、アルゴリズムの中間軌道が与えられた場合、ターゲットアルゴリズムが全く同じ次の軌道ステップを持つような入力を生成するデータ拡張手順を開発することができる。
我々は、Hint-Relicと呼ばれる結果の手法が、推論器のOOD一般化能力を改善することを証明した。
論文 参考訳(メタデータ) (2023-02-20T19:41:15Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Transformers Can Do Bayesian Inference [56.99390658880008]
我々はPFN(Presideed Data Fitted Networks)を提案する。
PFNは、大規模機械学習技術におけるインコンテキスト学習を活用して、大規模な後部集合を近似する。
我々は、PFNがガウス過程をほぼ完璧に模倣し、難解問題に対する効率的なベイズ推定を可能にすることを示した。
論文 参考訳(メタデータ) (2021-12-20T13:07:39Z) - Reinforcement Learning with Augmented Data [97.42819506719191]
本稿では,ほとんどのRLアルゴリズムを拡張可能なシンプルなプラグイン・アンド・プレイモジュールであるReinforcement Learning with Augmented Data (RAD)を提案する。
本稿では,RLアルゴリズムが複雑な最先端手法より優れていることを示すために,ランダム翻訳,作物,カラージッタ,パッチカットアウト,ランダム畳み込み,振幅スケールなどの拡張法を提案する。
論文 参考訳(メタデータ) (2020-04-30T17:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。