論文の概要: The Importance of Suppressing Complete Reconstruction in Autoencoders
for Unsupervised Outlier Detection
- arxiv url: http://arxiv.org/abs/2211.03054v1
- Date: Sun, 6 Nov 2022 07:56:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 16:01:21.064245
- Title: The Importance of Suppressing Complete Reconstruction in Autoencoders
for Unsupervised Outlier Detection
- Title(参考訳): 教師なし外乱検出のためのオートエンコーダにおける完全再構成抑制の重要性
- Authors: Yafei Shen, Ling Yang
- Abstract要約: レグレッション解析では、通常、外れ値は通常高レバレッジ点と影響点に分けられる。
ほとんどの異常値は、最悪の回復主成分に対応する方向で検出されるが、よく回収された主成分の方向では、しばしば無視される。
本稿では,外乱検出における上記の欠陥を解消する新たな損失関数を提案する。
- 参考スコア(独自算出の注目度): 2.089792514720233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoencoders are widely used in outlier detection due to their superiority in
handling high-dimensional and nonlinear datasets. The reconstruction of any
dataset by the autoencoder can be considered as a complex regression process.
In regression analysis, outliers can usually be divided into high leverage
points and influential points. Although the autoencoder has shown good results
for the identification of influential points, there are still some problems
when detect high leverage points. Through theoretical derivation, we found that
most outliers are detected in the direction corresponding to the
worst-recovered principal component, but in the direction of the well-recovered
principal components, the anomalies are often ignored. We propose a new loss
function which solve the above deficiencies in outlier detection. The core idea
of our scheme is that in order to better detect high leverage points, we should
suppress the complete reconstruction of the dataset to convert high leverage
points into influential points, and it is also necessary to ensure that the
differences between the eigenvalues of the covariance matrix of the original
dataset and their corresponding reconstructed results in the direction of each
principal component are equal. Besides, we explain the rationality of our
scheme through rigorous theoretical derivation. Finally, our experiments on
multiple datasets confirm that our scheme significantly improves the accuracy
of outlier detection.
- Abstract(参考訳): オートエンコーダは、高次元および非線形データセットの処理が優れているため、異常検出に広く使われている。
オートエンコーダによる任意のデータセットの再構成は、複雑な回帰過程と見なすことができる。
回帰分析では、外れ値は通常高いレバレッジ点と影響点に分けられる。
オートエンコーダは影響力点の同定に優れた結果を示したが、高いレバレッジ点の検出にはいくつかの問題がある。
理論的導出により, 最悪の主成分に対応する方向にほとんどの異常値が検出されることがわかったが, 良く回収された主成分の方向には, しばしば異常が無視される。
本稿では,上記の異常検出の欠陥を解決する新しい損失関数を提案する。
提案手法の核となる考え方は,高レバレッジ点をよりよく検出するためには,高レバレッジ点を影響力点に変換するためにデータセットの完全な再構築を抑制することであり,また,元のデータセットの共分散行列の固有値とそれに対応する各主成分の方向の再構成結果との差が等しくなることを保証する必要がある。
さらに、厳密な理論的導出を通して、我々の計画の合理性を説明する。
最後に,複数のデータセットに対する実験により,外乱検出の精度を大幅に向上させることを確認した。
関連論文リスト
- Back to Bayesics: Uncovering Human Mobility Distributions and Anomalies with an Integrated Statistical and Neural Framework [14.899157568336731]
DeepBayesicは、ベイズ原理とディープニューラルネットワークを統合し、基盤となる分布をモデル化する新しいフレームワークである。
我々は,いくつかのモビリティデータセットに対するアプローチを評価し,最先端の異常検出手法の大幅な改善を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:02:06Z) - Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Pain level and pain-related behaviour classification using GRU-based
sparsely-connected RNNs [61.080598804629375]
慢性的な痛みを持つ人は、特定の身体の動きを無意識に適応させ、怪我や追加の痛みから身を守る。
この相関関係を分析するための専用のベンチマークデータベースが存在しないため、日々の行動に影響を及ぼす可能性のある特定の状況の1つを検討した。
我々は、複数のオートエンコーダを組み込んだゲートリカレントユニット(GRU)と疎結合なリカレントニューラルネットワーク(s-RNN)のアンサンブルを提案した。
本手法は,痛みレベルと痛み関連行動の両方の分類において,最先端のアプローチよりも優れていることを示すいくつかの実験を行った。
論文 参考訳(メタデータ) (2022-12-20T12:56:28Z) - Tensor Decomposition of Large-scale Clinical EEGs Reveals Interpretable
Patterns of Brain Physiology [0.13980986259786218]
本稿では,人口レベルの脳波パターンの相似集合を発見するためのテンソル分解手法を提案する。
認知障害のさまざまな段階を含む患者のコホートを用いて臨床評価を行った。
論文 参考訳(メタデータ) (2022-11-24T20:39:22Z) - Benchmarking Joint Face Spoofing and Forgery Detection with Visual and
Physiological Cues [81.15465149555864]
視覚的外観と生理的rcuesを用いた第1回関節スプーフィングおよび検出ベンチマークを作成した。
r周期性判別を強化するために,顔の強信号マップと連続ウェーブレットを入力として変換した2分岐生理ネットワークを設計した。
論文 参考訳(メタデータ) (2022-08-10T15:41:48Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Learning Inter-Modal Correspondence and Phenotypes from Multi-Modal
Electronic Health Records [15.658012300789148]
本稿では,複数モーダル間の対応を表現型発見と併用して推測するcHITFを提案する。
実世界のMIMIC-IIIデータセットを用いて行った実験は、cHITFが臨床的に意味のあるモーダル間通信を効果的に推論することを示した。
論文 参考訳(メタデータ) (2020-11-12T10:30:29Z) - Interpretable multimodal fusion networks reveal mechanisms of brain
cognition [26.954460880062506]
我々は,自動診断と結果解釈を同時に行うことができる,解釈可能なマルチモーダル融合モデルgCAM-CCLを開発した。
脳画像遺伝学的研究におけるgCAM-CCLモデルの有効性を検証し,gCAM-CCLの分類と機構解析の両面において良好な性能を示した。
論文 参考訳(メタデータ) (2020-06-16T18:52:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。