論文の概要: In Search of the Unknown Unknowns: A Multi-Metric Distance Ensemble for Out of Distribution Anomaly Detection in Astronomical Surveys
- arxiv url: http://arxiv.org/abs/2510.23702v1
- Date: Mon, 27 Oct 2025 18:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.39538
- Title: In Search of the Unknown Unknowns: A Multi-Metric Distance Ensemble for Out of Distribution Anomaly Detection in Astronomical Surveys
- Title(参考訳): 未知の未知領域の探索:天文調査における分布異常検出のための多次元距離アンサンブル
- Authors: Siddharth Chaini, Federica B. Bianco, Ashish Mahabal,
- Abstract要約: 本稿では,距離測定値のアンサンブルを用いて新しいものを見つけるディスタンス・マルチメトリック異常検出(DiMMAD)を提案する。
我々は、このマルチメトリックなアプローチを、天文学的時系列の単純かつ解釈可能な科学的発見のツールとして実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Distance-based methods involve the computation of distance values between features and are a well-established paradigm in machine learning. In anomaly detection, anomalies are identified by their large distance from normal data points. However, the performance of these methods often hinges on a single, user-selected distance metric (e.g., Euclidean), which may not be optimal for the complex, high-dimensional feature spaces common in astronomy. Here, we introduce a novel anomaly detection method, Distance Multi-Metric Anomaly Detection (DiMMAD), which uses an ensemble of distance metrics to find novelties. Using multiple distance metrics is effectively equivalent to using different geometries in the feature space. By using a robust ensemble of diverse distance metrics, we overcome the metric-selection problem, creating an anomaly score that is not reliant on any single definition of distance. We demonstrate this multi-metric approach as a tool for simple, interpretable scientific discovery on astronomical time series -- (1) with simulated data for the upcoming Vera C. Rubin Observatory Legacy Survey of Space and Time, and (2) real data from the Zwicky Transient Facility. We find that DiMMAD excels at out-of-distribution anomaly detection -- anomalies in the data that might be new classes -- and beats other state-of-the-art methods in the goal of maximizing the diversity of new classes discovered. For rare in-distribution anomaly detection, DiMMAD performs similarly to other methods, but may allow for improved interpretability. All our code is open source: DiMMAD is implemented within DistClassiPy: https://github.com/sidchaini/distclassipy/, while all code to reproduce the results of this paper is available here: https://github.com/sidchaini/dimmad/.
- Abstract(参考訳): 距離に基づく手法は特徴間の距離値の計算を含み、機械学習において確立されたパラダイムである。
異常検出では、異常は通常のデータポイントからの距離によって識別される。
しかしながら、これらの手法の性能は、天文学に共通する複雑な高次元の特徴空間に最適でない1つのユーザ選択距離距離(例えばユークリッド距離)にヒンジすることが多い。
そこで本研究では,距離メトリクスのアンサンブルを用いた距離多重距離異常検出法(DiMMAD)を提案する。
多重距離メトリクスの使用は、特徴空間における異なるジオメトリを使用することと効果的に等価である。
多様な距離指標の頑健なアンサンブルを用いることで、距離の単一定義に依存しない異常スコアを生成する。
我々は、このマルチメトリックなアプローチを、天文学的時系列の単純かつ解釈可能な科学的発見のためのツールとして示している。(1)次回のVera C. Rubin Observatory Legacy Survey of Space and Timeのシミュレーションデータ、(2)Zwicky Transient Facilityの実際のデータ。
DiMMADは配布外異常検出 -- 新たなクラスである可能性のあるデータの異常 -- に優れており、新たに発見されたクラスの多様性を最大化することを目的として、他の最先端メソッドに勝っていることが分かりました。
まれな分布異常検出のために、DiMMADは他の方法と同様に機能するが、解釈性を改善することができる。
DiMMADはDistClassiPy内で実装されている: https://github.com/sidchaini/distclassipy/ しかし、この論文の結果を再現するすべてのコードは以下の通りである。
関連論文リスト
- GeoMM: On Geodesic Perspective for Multi-modal Learning [55.41612200877861]
本稿では,マルチモーダル学習における測地線距離を新しい距離測定基準として導入する。
我々のアプローチは、現在のマルチモーダル学習に測地距離を適用するための包括的な戦略を取り入れている。
論文 参考訳(メタデータ) (2025-05-16T13:12:41Z) - A Classifier-Based Approach to Multi-Class Anomaly Detection Applied to Astronomical Time-Series [0.0]
異常検出は多くの科学分野において 未解決の問題です
天文時系列のほとんどの異常検出アルゴリズムは、手作りの特徴か、教師なし表現学習によって生成された特徴に依存している。
本稿では,ニューラルネットワーク分類器の潜時空間を利用した異常検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-05T18:00:00Z) - Unsupervised Distance Metric Learning for Anomaly Detection Over
Multivariate Time Series [0.0]
時系列上の異常検出のための教師なし距離メトリック学習法であるFCM-wDTWを提案する。
FCM-wDTWは生データを潜在空間にエンコードし、クラスタセンターを通して通常の次元関係を明らかにする。
11種類のベンチマークによる実験は、我々の手法の競合精度と効率を実証している。
論文 参考訳(メタデータ) (2024-03-04T09:55:16Z) - Continuous Memory Representation for Anomaly Detection [24.58611060347548]
CRADは「連続的」メモリ内の正常な特徴を表現するための新しい異常検出手法である。
MVTec ADデータセットを用いた評価では、CRADは、マルチクラス統一異常検出におけるエラーの65.0%を削減し、従来の最先端手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-02-28T12:38:44Z) - Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs [49.71319907864573]
本稿では,分解が容易なマルチエージェントスキル発見法を提案する。
我々のキーとなる考え方は、合同状態空間をクロネッカーグラフとして近似することであり、そのフィドラーベクトルを直接見積もることができる。
ラプラシアンスペクトルを直接計算することは、無限大の状態空間を持つタスクには難易度が高いことを考慮し、さらに本手法の深層学習拡張を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:53:12Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Robust Multi-Object Tracking by Marginal Inference [92.48078680697311]
ビデオにおける多目的追跡は、隣接するフレーム内のオブジェクト間の1対1の割り当てに関する根本的な問題を解決する必要がある。
本稿では,各オブジェクトの限界確率をリアルタイムに計算する効率的な手法を提案する。
MOT17とMOT20ベンチマークで競合する結果を得る。
論文 参考訳(メタデータ) (2022-08-07T14:04:45Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Ranking the information content of distance measures [61.754016309475745]
2つの異なる距離測度を用いて保持する相対的情報を評価する統計的テストを導入する。
これにより、候補者のプールから最も情報に富んだ距離を測定することができる。
論文 参考訳(メタデータ) (2021-04-30T15:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。