論文の概要: Approximate Borderline Sampling using Granular-Ball for Classification Tasks
- arxiv url: http://arxiv.org/abs/2506.02366v1
- Date: Tue, 03 Jun 2025 02:04:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.381496
- Title: Approximate Borderline Sampling using Granular-Ball for Classification Tasks
- Title(参考訳): グラニュラーボールを用いた近似境界線サンプリングによる分類作業
- Authors: Qin Xie, Qinghua Zhang, Shuyin Xia,
- Abstract要約: 近年, グラニュラーボール (GB) に基づくサンプリング手法は, 一般性や雑音の分類タスクにおいて有望な性能を示した。
本稿では,GB を用いた近似境界線サンプリング手法を提案する。
- 参考スコア(独自算出の注目度): 7.340676924771606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data sampling enhances classifier efficiency and robustness through data compression and quality improvement. Recently, the sampling method based on granular-ball (GB) has shown promising performance in generality and noisy classification tasks. However, some limitations remain, including the absence of borderline sampling strategies and issues with class boundary blurring or shrinking due to overlap between GBs. In this paper, an approximate borderline sampling method using GBs is proposed for classification tasks. First, a restricted diffusion-based GB generation (RD-GBG) method is proposed, which prevents GB overlaps by constrained expansion, preserving precise geometric representation of GBs via redefined ones. Second, based on the concept of heterogeneous nearest neighbor, a GB-based approximate borderline sampling (GBABS) method is proposed, which is the first general sampling method capable of both borderline sampling and improving the quality of class noise datasets. Additionally, since RD-GBG incorporates noise detection and GBABS focuses on borderline samples, GBABS performs outstandingly on class noise datasets without the need for an optimal purity threshold. Experimental results demonstrate that the proposed methods outperform the GB-based sampling method and several representative sampling methods. Our source code is publicly available at https://github.com/CherylTse/GBABS.
- Abstract(参考訳): データサンプリングは、データ圧縮と品質改善を通じて、分類器の効率と堅牢性を向上する。
近年, グラニュラーボール (GB) に基づくサンプリング手法は, 一般性や雑音の分類タスクにおいて有望な性能を示した。
しかし、境界線サンプリング戦略の欠如や、GB間の重複によるクラス境界のぼやけや縮小の問題など、いくつかの制限が残っている。
本稿では,GB を用いた近似境界線サンプリング手法を提案する。
まず、制限付き拡張によるGBオーバーラップを防止し、再定義したGBの正確な幾何学的表現を保存できる制限拡散ベースGB生成法(RD-GBG)を提案する。
第2に, 異種近接場の概念に基づくGBABS法が提案され, 境界線サンプリングとクラスノイズデータセットの品質向上を両立できる最初の一般サンプリング法である。
さらに、RD-GBGはノイズ検出を取り入れ、GBABSは境界線サンプルに重点を置いているため、GBABSは最適な純度閾値を必要とせず、クラスノイズデータセットで顕著に機能する。
実験の結果,提案手法はGBベースサンプリング法およびいくつかの代表サンプリング法より優れていた。
ソースコードはhttps://github.com/CherylTse/GBABS.comで公開されています。
関連論文リスト
- LGBQPC: Local Granular-Ball Quality Peaks Clustering [51.58924743533048]
密度ピーククラスタリング(DPC)アルゴリズムは、任意の形状のクラスタを検出する能力において、かなりの注目を集めている。
近年のDPCとグラニュラーボールコンピューティングの統合により、GBベースのDPCアルゴリズムが実現され、計算効率が向上した。
本稿では,ローカルGB品質ピーククラスタリング(LGBQPC)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-16T15:26:02Z) - A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.39844791923145]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。
本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文 参考訳(メタデータ) (2024-07-03T08:54:45Z) - Generation of Granular-Balls for Clustering Based on the Principle of Justifiable Granularity [51.58924743533048]
本稿では,クラスタリングタスクのための新しいGB生成手法を紹介する。
GB のカバレッジと特異性を定義し,GB 品質を評価するための包括的尺度を導入する。
従来のGB生成手法と比較して、新しい手法は生成したGBの全体的な品質を最大化する。
論文 参考訳(メタデータ) (2024-05-11T04:21:32Z) - Differentially Private SGD Without Clipping Bias: An Error-Feedback Approach [62.000948039914135]
Differentially Private Gradient Descent with Gradient Clipping (DPSGD-GC) を使用して、差分プライバシ(DP)がモデルパフォーマンス劣化の犠牲となることを保証する。
DPSGD-GCに代わる新しいエラーフィードバック(EF)DPアルゴリズムを提案する。
提案アルゴリズムに対するアルゴリズム固有のDP解析を確立し,R'enyi DPに基づくプライバシ保証を提供する。
論文 参考訳(メタデータ) (2023-11-24T17:56:44Z) - GBG++: A Fast and Stable Granular Ball Generation Method for Classification [17.7229704582645]
グラニュラーボールコンピューティングは効率的で堅牢でスケーラブルな学習方法である。
既存のGBG法の安定性と効率をさらに改善する必要がある。
まず, 高速かつ安定なGBG (GBG++) 手法を提案する。
論文 参考訳(メタデータ) (2023-05-29T04:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。