論文の概要: Toward Unsupervised Outlier Model Selection
- arxiv url: http://arxiv.org/abs/2211.01834v1
- Date: Thu, 3 Nov 2022 14:14:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 13:44:24.412157
- Title: Toward Unsupervised Outlier Model Selection
- Title(参考訳): 教師なしアウトリアーモデル選択に向けて
- Authors: Yue Zhao, Sean Zhang, Leman Akoglu
- Abstract要約: ELECTは、ラベルなしで新しいデータセット上で有効なモデルを選択するための新しいアプローチである。
メタラーニング(メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニングなど)に基づく。
オンデマンドでアウトプットを提供し、さまざまな時間予算に対応できる。
- 参考スコア(独自算出の注目度): 20.12322454417006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Today there exists no shortage of outlier detection algorithms in the
literature, yet the complementary and critical problem of unsupervised outlier
model selection (UOMS) is vastly understudied. In this work we propose ELECT, a
new approach to select an effective candidate model, i.e. an outlier detection
algorithm and its hyperparameter(s), to employ on a new dataset without any
labels. At its core, ELECT is based on meta-learning; transferring prior
knowledge (e.g. model performance) on historical datasets that are similar to
the new one to facilitate UOMS. Uniquely, it employs a dataset similarity
measure that is performance-based, which is more direct and goal-driven than
other measures used in the past. ELECT adaptively searches for similar
historical datasets, as such, it can serve an output on-demand, being able to
accommodate varying time budgets. Extensive experiments show that ELECT
significantly outperforms a wide range of basic UOMS baselines, including no
model selection (always using the same popular model such as iForest) as well
as more recent selection strategies based on meta-features.
- Abstract(参考訳): 現在、文献には外れ値検出アルゴリズムが不足していないが、教師なしの外れ値モデル選択(UOMS)の相補的および重要な問題は大いに検討されている。
そこで本研究では,提案手法であるelectを提案する。outlier detection algorithm と hyperparameter(s) を用いて,ラベルを伴わない新しいデータセットを探索する手法である。
ELECTはメタラーニングに基づいており、UOMSを促進するために新しいものと類似した過去のデータセットに事前の知識(例えばモデルパフォーマンス)を転送する。
ユニークなことに、データセットの類似度尺度はパフォーマンスに基づいており、これは過去に使用された他の指標よりも直接的で目標駆動である。
ELECTは、同様の過去のデータセットを適応的に検索するので、オンデマンドでアウトプットを提供し、さまざまな時間予算に対応できる。
大規模な実験により、ELECTは、モデル選択(iForestのような同じ人気モデルを使うことが多い)や、メタ機能に基づいたより最近の選択戦略を含む、幅広い基本的UOMSベースラインを著しく上回ります。
関連論文リスト
- LESS: Selecting Influential Data for Targeted Instruction Tuning [69.50855460630105]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - DsDm: Model-Aware Dataset Selection with Datamodels [81.01744199870043]
標準的なプラクティスは、データ品質という人間の考え方にマッチする例をフィルタリングすることです。
質の高い"データソースとの類似性に応じた選択は、ランダムに選択するデータに比べてパフォーマンスが向上しない(さらに傷つく)可能性がある。
我々のフレームワークは、データ品質に関する手作業による概念を回避し、学習プロセスがターゲットタスクの予測にデータポイントをトレーニングする方法を明確にモデル化する。
論文 参考訳(メタデータ) (2024-01-23T17:22:00Z) - Self-Evolved Diverse Data Sampling for Efficient Instruction Tuning [47.02160072880698]
モデル自体が等しくあるいはそれ以上に効果的であるサブセットを積極的にサンプリングできる自己進化メカニズムを導入します。
データサンプリング技術の鍵は、選択したサブセットの多様性の向上にあります。
3つのデータセットとベンチマークにわたる大規模な実験は、DiverseEvolの有効性を示している。
論文 参考訳(メタデータ) (2023-11-14T14:10:40Z) - Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。
アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。
FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文 参考訳(メタデータ) (2023-09-29T15:50:14Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - AnoShift: A Distribution Shift Benchmark for Unsupervised Anomaly
Detection [7.829710051617368]
本稿では,ネットワーク侵入検知のためのトラフィックデータセットである Kyoto-2006+ 上に構築された,時間とともに変化するデータを含む教師なし異常検出ベンチマークを提案する。
まず, 基本機能解析, t-SNE, および最適輸送手法を用いて, 年々の分布距離を計測する。
従来のアプローチからディープラーニングまで,さまざまなモデルでパフォーマンス劣化を検証する。
論文 参考訳(メタデータ) (2022-06-30T17:59:22Z) - Subject Adaptive EEG-based Visual Recognition [14.466626957417864]
本稿では,脳波信号に基づいて被験者が観察する視覚オブジェクトのクラスを予測することを目的とした,脳波に基づく視覚認識に焦点を当てた。
主な課題の1つは、異なる主題からの信号の大きなばらつきである。
本稿では,脳波をベースとした視覚認識という新たな課題について紹介する。
論文 参考訳(メタデータ) (2021-10-26T08:06:55Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Automating Outlier Detection via Meta-Learning [37.736124230543865]
メタ学習をベースとした,Overier検出のためのモデル選択のための,最初の原則付きデータ駆動型アプローチであるMetaODを開発した。
検出モデルの選択におけるMetaODの有効性を示す。
この新しい問題をさらに研究するために、私たちはメタラーニングシステム全体、ベンチマーク環境、テストベッドデータセットをオープンソース化しました。
論文 参考訳(メタデータ) (2020-09-22T15:14:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。