論文の概要: A proposal for PU classification under Non-SCAR using clustering and logistic model
- arxiv url: http://arxiv.org/abs/2604.17130v1
- Date: Sat, 18 Apr 2026 20:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.347516
- Title: A proposal for PU classification under Non-SCAR using clustering and logistic model
- Title(参考訳): クラスタリングとロジスティックモデルを用いた非SCARに基づくPU分類の提案
- Authors: Konrad Furmanczyk, Kacper Paczutkowski,
- Abstract要約: 本研究の目的は,SCAR条件が満たされていない場合に,計算的に単純かつPU分類を解くことのできるクラスタクリーニングアルゴリズムを検討することである。
この研究の二次目的は、SCAR条件の摂動に対するLassoJoint法の堅牢性を決定することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The present study aims to investigate a cluster cleaning algorithm that is both computationally simple and capable of solving the PU classification when the SCAR condition is unsatisfied. A secondary objective of this study is to determine the robustness of the LassoJoint method to perturbations of the SCAR condition. In the first step of our algorithm, we obtain cleaning labels from 2-means clustering. Subsequently, we perform logistic regression on the cleaned data, assigning positive labels from the cleaning algorithm with additional true positive observations. The remaining observations are assigned the negative label. The proposed algorithm is evaluated by comparing 11 real data sets from machine learning repositories and a synthetic set. The findings obtained from this study demonstrate the efficacy of the clustering algorithm in scenarios where the SCAR condition is violated and further underscore the moderate robustness of the LassoJoint algorithm in this context.
- Abstract(参考訳): 本研究の目的は,SCAR条件が満たされていない場合に,計算的に単純かつPU分類を解くことのできるクラスタクリーニングアルゴリズムを検討することである。
この研究の二次目的は、SCAR条件の摂動に対するLassoJoint法の堅牢性を決定することである。
アルゴリズムの最初のステップでは、2平均クラスタリングからクリーニングラベルを得る。
その後、クリーン化データに対してロジスティック回帰を行い、クリーニングアルゴリズムから正のラベルを付加的な正の観測で割り当てる。
残りの観測には負のラベルが割り当てられる。
提案アルゴリズムは、機械学習レポジトリと合成データセットから11個の実データセットを比較して評価する。
本研究は,SCAR条件に違反した場合のクラスタリングアルゴリズムの有効性を実証し,この文脈におけるLassoJointアルゴリズムの適度な頑健さを裏付けるものである。
関連論文リスト
- FLASC: A Flare-Sensitive Clustering Algorithm [0.0]
本稿では,クラスタ内の分岐を検知してサブポピュレーションを同定するアルゴリズムFLASCを提案する。
アルゴリズムの2つの変種が提示され、ノイズの堅牢性に対する計算コストが取引される。
両変種は計算コストの観点からHDBSCAN*と類似してスケールし,安定した出力を提供することを示す。
論文 参考訳(メタデータ) (2023-11-27T14:55:16Z) - Latent class analysis by regularized spectral clustering [0.0]
分類データの潜在クラスモデルを推定する2つの新しいアルゴリズムを提案する。
本アルゴリズムは, 応答行列から計算した正規化ラプラシアン行列を用いて開発した。
さらに,我々のアルゴリズムを実世界のカテゴリデータに適用し,有望な結果を得る。
論文 参考訳(メタデータ) (2023-10-28T15:09:08Z) - Machine Learning-Assisted Pattern Recognition Algorithms for Estimating
Ultimate Tensile Strength in Fused Deposition Modeled Polylactic Acid
Specimens [0.0]
混合沈着モデル(FDM)プロセスを用いて作製したポリ乳酸(PLA)試料の最大引張強度(UTS)を推定するための教師付き機械学習アルゴリズムの適用について検討した。
主な目的は、ロジスティック分類(Logistic Classification)、グラディエントブースティング分類(Gradient Boosting Classification)、決定木(Decision Tree)、K-Nearest Neighbor(K-Nearest Neighbor)の4つの異なる分類アルゴリズムの精度と有効性を評価することである。
その結果、決定木とK-Nearest NeighborアルゴリズムはともにF1スコア0.71を達成したが、KNNアルゴリズムはAUC(Area Under the Curve)スコア0.79を達成し、他のアルゴリズムを上回った。
論文 参考訳(メタデータ) (2023-07-13T11:10:22Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。