論文の概要: Outlier detection in mixed-attribute data: a semi-supervised approach with fuzzy approximations and relative entropy
- arxiv url: http://arxiv.org/abs/2512.18978v1
- Date: Mon, 22 Dec 2025 02:41:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.59388
- Title: Outlier detection in mixed-attribute data: a semi-supervised approach with fuzzy approximations and relative entropy
- Title(参考訳): 混合属性データにおける外乱検出:ファジィ近似と相対エントロピーを用いた半教師付きアプローチ
- Authors: Baiyang Chen, Zhong Yuan, Zheng Liu, Dezhong Peng, Yongxiang Li, Chang Liu, Guiduo Duan,
- Abstract要約: 外乱検出はデータマイニングにおいて重要なタスクであり、標準から著しく逸脱するオブジェクトを特定することを目的としている。
本稿では,半教師付き外乱検出法,すなわちファジィ粗集合に基づく外乱検出(FROD)を提案する。
16の公開データセットの実験結果は、FRODが先行する検出アルゴリズムと同等かそれ以上であることを示している。
- 参考スコア(独自算出の注目度): 44.721694491724406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outlier detection is a critical task in data mining, aimed at identifying objects that significantly deviate from the norm. Semi-supervised methods improve detection performance by leveraging partially labeled data but typically overlook the uncertainty and heterogeneity of real-world mixed-attribute data. This paper introduces a semi-supervised outlier detection method, namely fuzzy rough sets-based outlier detection (FROD), to effectively handle these challenges. Specifically, we first utilize a small subset of labeled data to construct fuzzy decision systems, through which we introduce the attribute classification accuracy based on fuzzy approximations to evaluate the contribution of attribute sets in outlier detection. Unlabeled data is then used to compute fuzzy relative entropy, which provides a characterization of outliers from the perspective of uncertainty. Finally, we develop the detection algorithm by combining attribute classification accuracy with fuzzy relative entropy. Experimental results on 16 public datasets show that FROD is comparable with or better than leading detection algorithms. All datasets and source codes are accessible at https://github.com/ChenBaiyang/FROD. This manuscript is the accepted author version of a paper published by Elsevier. The final published version is available at https://doi.org/10.1016/j.ijar.2025.109373
- Abstract(参考訳): 外乱検出はデータマイニングにおいて重要なタスクであり、標準から著しく逸脱するオブジェクトを特定することを目的としている。
半教師付き手法は、部分的にラベル付けされたデータを活用することで検出性能を向上させるが、典型的には現実世界の混合属性データの不確実性と不均一性を見落としている。
本稿では,これらの課題を効果的に解決するために,ファジィ粗集合系外乱検出(FROD)という半教師付き外乱検出手法を提案する。
具体的には、まずラベル付きデータの小さなサブセットを用いてファジィ決定システムを構築し、ファジィ近似に基づく属性分類の精度を導入し、アトリビュータ検出における属性セットの寄与を評価する。
ラベル付きデータはファジィ相対エントロピーの計算に使用され、不確実性の観点から外乱のキャラクタリゼーションを提供する。
最後に,属性分類精度とファジィ相対エントロピーを組み合わせた検出アルゴリズムを開発した。
16の公開データセットの実験結果は、FRODが先行する検出アルゴリズムと同等かそれ以上であることを示している。
すべてのデータセットとソースコードはhttps://github.com/ChenBaiyang/FRODでアクセスできる。
この写本はエルゼビアが出版した論文の受理版である。
最終版はhttps://doi.org/10.1016/j.ijar.2025.109373で公開されている。
関連論文リスト
- Consistency-guided semi-supervised outlier detection in heterogeneous data using fuzzy rough sets [45.9876416284051]
Outlier Detectionは、データの大部分と異なる振る舞いをするサンプルを見つけることを目的としている。
半教師付き検出法は部分ラベルの監督を利用でき、偽陽性率を低減できる。
半教師付き方式でファジィ粗セット理論を用いた不均一データに対する一貫性誘導型外乱検出アルゴリズム(COD)を提案する。
論文 参考訳(メタデータ) (2025-12-22T02:41:08Z) - Label-Informed Outlier Detection Based on Granule Density [43.94053430193935]
本稿では,グラニュラー・コンピューティングとファジィ・セットに基づく異種データのラベルインフォームド・アウトリー検出手法を提案する。
実世界の様々なデータセットによる実験結果から、GDOFはラベル付き外れ値の最小数で異種データの外れ値を検出する際際、顕著であることがわかった。
論文 参考訳(メタデータ) (2025-12-21T15:27:06Z) - Kernel Representation and Similarity Measure for Incomplete Data [55.62595187178638]
不完全データの類似性を測定することは、Webマイニング、レコメンデーションシステム、ユーザー行動分析において基本的な課題である。
従来のアプローチでは、不完全なデータを破棄するか、事前処理のステップとして計算を実行するかのいずれかであり、情報損失と類似性のバイアスが生じる。
本稿では,カーネルの特徴空間における不完全データ間の類似性を,元の空間における明示的な計算なしで直接計算する,新しい類似度尺度を提案する。
論文 参考訳(メタデータ) (2025-10-15T09:41:23Z) - Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - CoMadOut -- A Robust Outlier Detection Algorithm based on CoMAD [0.3749861135832073]
データセット上の機械学習アルゴリズムの予測を歪める可能性があるため、アウトレーヤは重要な役割を果たす。
この問題に対処するために,ロバストな外乱検出アルゴリズムCoMadOutを提案する。
われわれの手法は、外乱検出タスクの堅牢な代替手段と見なすことができる。
論文 参考訳(メタデータ) (2022-11-23T21:33:34Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。