論文の概要: QC-SMOTE: Quality-Controlled SMOTE for Imbalanced Classification
- arxiv url: http://arxiv.org/abs/2606.24625v1
- Date: Tue, 23 Jun 2026 14:23:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:49.01316
- Title: QC-SMOTE: Quality-Controlled SMOTE for Imbalanced Classification
- Title(参考訳): QC-SMOTE:不均衡分類のための品質制御SMOTE
- Authors: Parth Upman, Shreyank N Gowda,
- Abstract要約: QC-SMOTEは、近距離信頼度スコアを用いて、少数サンプル信頼性を推定する。
合成候補は、IPQ誘導のベスト・オブ・K戦略を用いて生成される。
- 参考スコア(独自算出の注目度): 11.542407696902115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Class imbalance poses a significant challenge in classification, where existing methods such as SMOTE often generate low-quality synthetic samples in regions with noise or class overlap. We propose QC-SMOTE, a quality-controlled oversampling framework that estimates minority sample reliability using a composite neighbourhood trustworthiness score combining local density, safe-level, and isolation from the majority class. Synthetic candidates are generated using an IPQ-guided best-of-K strategy that evaluates midpoint purity and, when required, majority clearance, with allocation guided by sample reliability and boundary informativeness. Generation behaviour adapts across overlap--imbalance regimes, adjusting interpolation range and selection criteria to match local data geometry. Low-quality synthetic samples are replaced with original minority duplicates when neighbourhood purity falls below an adaptive threshold, providing graceful degradation by reverting to duplication in severely noisy regions. Experiments on 30 imbalanced datasets using repeated stratified cross-validation show that QC-SMOTE achieves the strongest average AUC-ROC and Macro F1 among the compared oversampling methods, with particularly clear gains under moderate and severe imbalance. These results demonstrate the importance of quality-aware, geometry-adaptive synthetic sampling for robust imbalanced classification.
- Abstract(参考訳): クラス不均衡は、SMOTEのような既存の手法がノイズやクラスオーバーラップのある領域で低品質な合成サンプルを生成する場合、分類において大きな課題となる。
QC-SMOTE(QC-SMOTE)は, 局所密度, 安全レベル, 多数層からの孤立度を組み合わせた複合的近傍信頼度スコアを用いて, 少数サンプルの信頼性を推定する品質制御オーバーサンプリングフレームワークである。
合成候補は、中点純度を評価するIPQ誘導のベスト・オブ・K戦略を用いて生成される。
生成行動は重なり合う不均衡状態に適応し、補間範囲と選択基準を局所データ幾何に合わせるように調整する。
低品質の合成サンプルは、近隣の純度が適応しきい値を下回ると元のマイノリティー複製に置換され、重騒音領域の重複に戻すことで優雅な劣化をもたらす。
QC-SMOTEは, 比較オーバーサンプリング法のうち, 平均平均値のAUC-ROCとマクロF1を達成し, 特に中等度および重度の不均衡下での顕著な利得を示した。
これらの結果は、ロバストな不均衡分類のための品質に配慮した幾何適応型合成サンプリングの重要性を示している。
関連論文リスト
- Q-SYNTH: Hybrid Quantum-Classical Adversarial Augmentation for Imbalanced Fraud Detection [2.063079740825497]
クレジットカード不正検出は、極端な階級不均衡によって根本的な課題となる。
本稿では,Q-SYNTHについて紹介する。
論文 参考訳(メタデータ) (2026-05-20T13:32:18Z) - Multimodal Learning on Low-Quality Data with Conformal Predictive Self-Calibration [72.0672328514289]
マルチモーダル学習は、しばしば低品質データの課題に悩まされる。
コンフォーマル予測自己校正(Conformal Predictive Self-Calibration)と呼ばれる統合フレームワークを提案する。
私たちのフレームワークは、既存の最先端メソッドを一貫して上回ります。
論文 参考訳(メタデータ) (2026-05-05T14:48:52Z) - Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification [55.56234913868664]
マルチモーダルデータを用いた信頼性学習のためのTAHCD(Test-time Adaptive Hierarchical Co-enhanced Denoising Network)を提案する。
提案手法は,最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現する。
論文 参考訳(メタデータ) (2026-01-12T03:14:12Z) - Towards Syn-to-Real IQA: A Novel Perspective on Reshaping Synthetic Data Distributions [74.00222571094437]
Blind Image Quality Assessment (BIQA)はディープラーニングを通じて大幅に進歩しているが、大規模なラベル付きデータセットの不足は依然として課題である。
合成データセットから学習した表現は、しばしば回帰性能を妨げる離散的かつクラスタ化されたパターンを示す。
本稿では,BIQAの一般化を促進するために,合成データ分布を再考する新しいフレームワークであるSynDR-IQAを紹介する。
論文 参考訳(メタデータ) (2026-01-01T06:11:16Z) - Rebalancing with Calibrated Sub-classes (RCS): A Statistical Fusion-based Framework for Robust Imbalanced Classification across Modalities [16.993547305381327]
Rebalancing with Calibrated Sub-classes (RCS)は、ロバストな不均衡な分類のための新しい分散キャリブレーションフレームワークである。
RCSはガウス成分の加重混合により、多数および中間クラスの分布から統計情報を融合する。
論文 参考訳(メタデータ) (2025-10-10T00:06:13Z) - Adaptive kernel-density approach for imbalanced binary classification [2.3126620160776845]
クラス不均衡は、現実世界のバイナリ分類タスクにおいて共通の課題である。
我々はKernel-density-Oriented Threshold Adjustment with Regional Optimization (KOTARO)と呼ばれる新しいアプローチを提案する。
小田ロでは、ガウス基底関数の帯域幅は各サンプルの周囲の推定密度に基づいて動的に調整される。
論文 参考訳(メタデータ) (2025-10-05T05:45:00Z) - Learning Majority-to-Minority Transformations with MMD and Triplet Loss for Imbalanced Classification [0.5390869741300152]
教師付き分類におけるクラス不均衡は、多数派に対する予測をバイアスすることでモデル性能を低下させることが多い。
多数サンプルをマイノリティ分布にマッピングするパラメトリック変換を学習するオーバーサンプリングフレームワークを導入する。
提案手法は,グローバルアライメントのためのトランスフォーメーションと真のマイノリティサンプル間の平均最大誤差(MMD)を最小化する。
論文 参考訳(メタデータ) (2025-09-15T01:47:29Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Learning with Imbalanced Noisy Data by Preventing Bias in Sample
Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。
不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T10:34:53Z) - A Novel Hybrid Sampling Framework for Imbalanced Learning [0.0]
SMOTE-RUS-NC」は他の最先端サンプリング技術と比較されている。
26個の不均衡なデータセットで厳密な実験が行われた。
論文 参考訳(メタデータ) (2022-08-20T07:04:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。