論文の概要: Label-Informed Outlier Detection Based on Granule Density
- arxiv url: http://arxiv.org/abs/2512.18774v1
- Date: Sun, 21 Dec 2025 15:27:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.497153
- Title: Label-Informed Outlier Detection Based on Granule Density
- Title(参考訳): 顆粒密度に基づくラベルインフォーム外乱検出
- Authors: Baiyang Chen, Zhong Yuan, Dezhong Peng, Hongmei Chen, Xiaomin Song, Huiming Zheng,
- Abstract要約: 本稿では,グラニュラー・コンピューティングとファジィ・セットに基づく異種データのラベルインフォームド・アウトリー検出手法を提案する。
実世界の様々なデータセットによる実験結果から、GDOFはラベル付き外れ値の最小数で異種データの外れ値を検出する際際、顕著であることがわかった。
- 参考スコア(独自算出の注目度): 43.94053430193935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outlier detection, crucial for identifying unusual patterns with significant implications across numerous applications, has drawn considerable research interest. Existing semi-supervised methods typically treat data as purely numerical and} in a deterministic manner, thereby neglecting the heterogeneity and uncertainty inherent in complex, real-world datasets. This paper introduces a label-informed outlier detection method for heterogeneous data based on Granular Computing and Fuzzy Sets, namely Granule Density-based Outlier Factor (GDOF). Specifically, GDOF first employs label-informed fuzzy granulation to effectively represent various data types and develops granule density for precise density estimation. Subsequently, granule densities from individual attributes are integrated for outlier scoring by assessing attribute relevance with a limited number of labeled outliers. Experimental results on various real-world datasets show that GDOF stands out in detecting outliers in heterogeneous data with a minimal number of labeled outliers. The integration of Fuzzy Sets and Granular Computing in GDOF offers a practical framework for outlier detection in complex and diverse data types. All relevant datasets and source codes are publicly available for further research. This is the author's accepted manuscript of a paper published in IEEE Transactions on Fuzzy Systems. The final version is available at https://doi.org/10.1109/TFUZZ.2024.3514853
- Abstract(参考訳): 外乱検出は、多くのアプリケーションにまたがって重要な意味を持つ異常なパターンを特定するのに不可欠であり、かなりの研究関心を集めている。
既存の半教師付き手法は、データを純粋に数値的で決定論的に扱い、したがって複雑な実世界のデータセットに固有の不均一性と不確実性を無視する。
本稿では,グラニュラー・コンピューティングとファジィ・セットに基づく異種データ,すなわちグラニュル密度に基づくアウトレイア・ファクター(GDOF)をラベルインフォームで検出する手法を提案する。
特に、GDOFはラベルインフォームドファジィグラニュラー化を用いて、様々なデータ型を効果的に表現し、正確な密度推定のためにグラニュラー密度を開発する。
その後、ラベル付き外れ値の限られた数で属性関係を評価することにより、個々の属性からの顆粒密度を外値スコアに積分する。
実世界の様々なデータセットによる実験結果から、GDOFはラベル付き外れ値の最小数で異種データの外れ値を検出する際際、顕著であることがわかった。
GDOFにおけるファジィ・セットとグラニュラー・コンピューティングの統合は、複雑で多様なデータ型において、外れ値検出のための実践的なフレームワークを提供する。
関連するデータセットとソースコードはすべて、さらなる研究のために公開されている。
これは、IEEE Transactions on Fuzzy Systemsで発表された論文の著者が受け入れた原稿である。
最終バージョンはhttps://doi.org/10.1109/TFUZZ.2024.3514853で公開されている。
関連論文リスト
- Outlier detection in mixed-attribute data: a semi-supervised approach with fuzzy approximations and relative entropy [44.721694491724406]
外乱検出はデータマイニングにおいて重要なタスクであり、標準から著しく逸脱するオブジェクトを特定することを目的としている。
本稿では,半教師付き外乱検出法,すなわちファジィ粗集合に基づく外乱検出(FROD)を提案する。
16の公開データセットの実験結果は、FRODが先行する検出アルゴリズムと同等かそれ以上であることを示している。
論文 参考訳(メタデータ) (2025-12-22T02:41:43Z) - Consistency-guided semi-supervised outlier detection in heterogeneous data using fuzzy rough sets [45.9876416284051]
Outlier Detectionは、データの大部分と異なる振る舞いをするサンプルを見つけることを目的としている。
半教師付き検出法は部分ラベルの監督を利用でき、偽陽性率を低減できる。
半教師付き方式でファジィ粗セット理論を用いた不均一データに対する一貫性誘導型外乱検出アルゴリズム(COD)を提案する。
論文 参考訳(メタデータ) (2025-12-22T02:41:08Z) - Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - Conditional Semi-Supervised Data Augmentation for Spam Message Detection with Low Resource Data [0.0]
本研究では,データの可用性に欠けるスパム検出モデルに対して,条件付き半教師付きデータ拡張を提案する。
トレーニングデータを拡張するために、ラベルのないデータをデータ拡張に活用する。
潜在変数は、最終分類器の入力としてラベル付きおよびラベルなしのデータから得ることができる。
論文 参考訳(メタデータ) (2024-07-06T07:51:24Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z) - Self-training Avoids Using Spurious Features Under Domain Shift [54.794607791641745]
教師なし領域適応においては、条件付きエントロピー最小化と擬似ラベル処理は、既存の理論で解析されたものよりもドメインシフトがはるかに大きい場合であっても行われる。
ドメインシフトが大きくなる可能性のある特定の設定を特定・分析するが、特定のスパイラルな特徴はソースドメインのラベルと相関するが、ターゲットの独立なラベルである。
論文 参考訳(メタデータ) (2020-06-17T17:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。