論文の概要: Consistency-guided semi-supervised outlier detection in heterogeneous data using fuzzy rough sets
- arxiv url: http://arxiv.org/abs/2512.18977v1
- Date: Mon, 22 Dec 2025 02:41:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.592981
- Title: Consistency-guided semi-supervised outlier detection in heterogeneous data using fuzzy rough sets
- Title(参考訳): ファジィ粗集合を用いた異種データの一貫性誘導半教師付き外乱検出
- Authors: Baiyang Chen, Zhong Yuan, Dezhong Peng, Xiaoliang Chen, Hongmei Chen,
- Abstract要約: Outlier Detectionは、データの大部分と異なる振る舞いをするサンプルを見つけることを目的としている。
半教師付き検出法は部分ラベルの監督を利用でき、偽陽性率を低減できる。
半教師付き方式でファジィ粗セット理論を用いた不均一データに対する一貫性誘導型外乱検出アルゴリズム(COD)を提案する。
- 参考スコア(独自算出の注目度): 45.9876416284051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outlier detection aims to find samples that behave differently from the majority of the data. Semi-supervised detection methods can utilize the supervision of partial labels, thus reducing false positive rates. However, most of the current semi-supervised methods focus on numerical data and neglect the heterogeneity of data information. In this paper, we propose a consistency-guided outlier detection algorithm (COD) for heterogeneous data with the fuzzy rough set theory in a semi-supervised manner. First, a few labeled outliers are leveraged to construct label-informed fuzzy similarity relations. Next, the consistency of the fuzzy decision system is introduced to evaluate attributes' contributions to knowledge classification. Subsequently, we define the outlier factor based on the fuzzy similarity class and predict outliers by integrating the classification consistency and the outlier factor. The proposed algorithm is extensively evaluated on 15 freshly proposed datasets. Experimental results demonstrate that COD is better than or comparable with the leading outlier detectors. This manuscript is the accepted author version of a paper published by Elsevier. The final published version is available at https://doi.org/10.1016/j.asoc.2024.112070
- Abstract(参考訳): Outlier Detectionは、データの大部分と異なる振る舞いをするサンプルを見つけることを目的としている。
半教師付き検出法は部分ラベルの監督を利用でき、偽陽性率を低減できる。
しかし、現在の半教師付き手法のほとんどは数値データに重点を置いており、データ情報の均一性を無視している。
本稿では, ファジィ粗集合理論を半教師付きで不均一なデータに対して, 整合性誘導型外乱検出アルゴリズム(COD)を提案する。
まず、ラベル付き外れ値を利用してラベル付きファジィ類似性関係を構築する。
次に、属性の知識分類への貢献を評価するためにファジィ決定システムの整合性を導入する。
次に、ファジィ類似度クラスに基づいて、外乱係数を定義し、分類一貫性と外乱係数を統合することにより外乱係数を予測する。
提案アルゴリズムは、15個の新たに提案されたデータセットに対して広範囲に評価される。
実験結果から、CODは先行するアウトリア検出器より優れているか同等であることが示された。
この写本はエルゼビアが出版した論文の受理版である。
最終版はhttps://doi.org/10.1016/j.asoc.2024.112070で公開されている。
関連論文リスト
- Outlier detection in mixed-attribute data: a semi-supervised approach with fuzzy approximations and relative entropy [44.721694491724406]
外乱検出はデータマイニングにおいて重要なタスクであり、標準から著しく逸脱するオブジェクトを特定することを目的としている。
本稿では,半教師付き外乱検出法,すなわちファジィ粗集合に基づく外乱検出(FROD)を提案する。
16の公開データセットの実験結果は、FRODが先行する検出アルゴリズムと同等かそれ以上であることを示している。
論文 参考訳(メタデータ) (2025-12-22T02:41:43Z) - Label-Informed Outlier Detection Based on Granule Density [43.94053430193935]
本稿では,グラニュラー・コンピューティングとファジィ・セットに基づく異種データのラベルインフォームド・アウトリー検出手法を提案する。
実世界の様々なデータセットによる実験結果から、GDOFはラベル付き外れ値の最小数で異種データの外れ値を検出する際際、顕著であることがわかった。
論文 参考訳(メタデータ) (2025-12-21T15:27:06Z) - Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z) - Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised Learning [69.81438976273866]
オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-21T09:07:15Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。