Fugu-MT 論文翻訳(概要): Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone!

論文の概要: Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone!

arxiv url: http://arxiv.org/abs/2409.05672v1
Date: Mon, 9 Sep 2024 14:41:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-10 14:19:16.213315
Title: Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone!
Title（参考訳）: 事前データフィットネットワークによるゼロショットアウトレイラ検出:モデル選択バイゴーン!
Authors: Yuchen Shen, Haomin Wen, Leman Akoglu,
Abstract要約: 外乱検知(OD)は環境モニタリング、サイバーセキュリティ、ファイナンス、医療に多くの応用がある。本質的に教師なしのタスクであるモデル選択は、ラベルの監督なしにODにとって重要なボトルネックとなる。本稿では,0/0ショットODのためのFoMo-0Dを提案する。
参考スコア（独自算出の注目度）: 28.823740273813296
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Outlier detection (OD) has a vast literature as it finds numerous applications in environmental monitoring, cybersecurity, finance, and medicine to name a few. Being an inherently unsupervised task, model selection is a key bottleneck for OD (both algorithm and hyperparameter selection) without label supervision. There is a long list of techniques to choose from -- both classical algorithms and deep neural architectures -- and while several studies report their hyperparameter sensitivity, the literature is quite slim on unsupervised model selection -- limiting the effective use of OD in practice. In this paper we present FoMo-0D, for zero/0-shot OD exploring a transformative new direction that bypasses the hurdle of model selection altogether (!), thus breaking new ground. The fundamental idea behind FoMo-0D is the Prior-data Fitted Networks, recently introduced by Muller et al.(2022), which trains a Transformer model on a large body of synthetically generated data from a prior data distribution. In essence, FoMo-0D is a pretrained Foundation Model for zero/0-shot OD on tabular data, which can directly predict the (outlier/inlier) label of any test data at inference time, by merely a single forward pass -- making obsolete the need for choosing an algorithm/architecture, tuning its associated hyperparameters, and even training any model parameters when given a new OD dataset. Extensive experiments on 57 public benchmark datasets against 26 baseline methods show that FoMo-0D performs statistically no different from the top 2nd baseline, while significantly outperforming the majority of the baselines, with an average inference time of 7.7 ms per test sample.
Abstract（参考訳）: 外乱検知(OD)は、環境モニタリング、サイバーセキュリティ、ファイナンス、医療に多くの応用があるため、膨大な文献がある。本質的に教師なしのタスクであるモデル選択は、ラベルの監督なしにOD(アルゴリズムとハイパーパラメータの選択の両方)にとって重要なボトルネックである。古典的アルゴリズムとディープ・ニューラル・アーキテクチャの両方から選択すべきテクニックが多数あり、いくつかの研究でハイパーパラメータの感度が報告されているが、この文献は教師なしのモデル選択にかなり重点を置いており、実際にはODの有効利用を制限している。本稿では,FoMo-0Dを提案する。0/0ショットODにおいて,モデル選択のハードルを完全に回避する変形的な新しい方向を探索し,新たな地盤を破る。 FoMo-0Dの背後にある基本的な考え方は、Muler et al (2022)によって最近導入されたPresideed-data Fitted Networksである。基本的には、FoMo-0Dは、表データ上のゼロ/0ショットODのための事前訓練されたファンデーションモデルであり、単一のフォワードパスによって、推論時に任意のテストデータの(外)ラベルを直接予測することができる。 26のベースライン法に対する57の公開ベンチマークデータセットに対する大規模な実験では、FoMo-0Dは上位2のベースラインと統計的に変わらないが、ベースラインの大部分をはるかに上回り、平均推定時間は7.7msである。

関連論文リスト

DONOD: Robust and Generalizable Instruction Fine-Tuning for LLMs via Model-Intrinsic Dataset Pruning [22.704995231753397]
大規模言語モデル(LLM)のアドホック命令の微調整は、ドメイン固有の適応に広く採用されている。本研究では,軽量なモデル固有データ解析手法であるDONODを提案する。完全なデータセットの70%をフィルタリングすることで、ターゲットドメインの精度を14.90%、クロスドメインの精度を5.67%向上させる。
論文参考訳（メタデータ） (2025-04-21T02:25:03Z)
DataDecide: How to Predict Best Pretraining Data with Small Experiments [67.95896457895404]
私たちはDataDecideのモデル、データ、評価を公開しています。最大100Bトークン,最大1Bパラメータのモデルサイズ,および3つのランダムシードを用いて,25コーパスにわたる事前学習実験を行った。
論文参考訳（メタデータ） (2025-04-15T17:02:15Z)
Training on the Benchmark Is Not All You Need [52.01920740114261]
本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。本手法は,モデルトレーニングデータや重みを使用せずに,グレーボックス条件下で動作可能である。 4つのベンチマークデータセットから35個の主要なオープンソースLCMのデータ漏洩度を評価する。
論文参考訳（メタデータ） (2024-09-03T11:09:44Z)
Out-of-Distribution Detection with a Single Unconditional Diffusion Model [54.15132801131365]
アウト・オブ・ディストリビューション(OOD)検出は、異常サンプルを特定しようとする機械学習において重要なタスクである。従来、教師なし手法はOOD検出に深い生成モデルを用いていた。本稿では,単一モデルが多様なタスクに対してOOD検出を行うことができるかどうかを考察する。
論文参考訳（メタデータ） (2024-05-20T08:54:03Z)
Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。 FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文参考訳（メタデータ） (2023-09-29T15:50:14Z)
MAPS: A Noise-Robust Progressive Learning Approach for Source-Free Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文参考訳（メタデータ） (2023-02-09T12:06:08Z)
Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文参考訳（メタデータ） (2022-12-20T19:29:37Z)
Toward Unsupervised Outlier Model Selection [20.12322454417006]
ELECTは、ラベルなしで新しいデータセット上で有効なモデルを選択するための新しいアプローチである。メタラーニング(メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニング、メタラーニングなど)に基づく。オンデマンドでアウトプットを提供し、さまざまな時間予算に対応できる。
論文参考訳（メタデータ） (2022-11-03T14:14:46Z)
Unsupervised Model Selection for Time-series Anomaly Detection [7.8027110514393785]
提案手法は, 予測誤差, モデル中心性, および, 注入された合成異常に対する性能の3種類のサロゲート(教師なし)メトリクスを同定する。我々は、厳密なランク集約問題として、複数の不完全なサロゲート指標との計量結合を定式化する。複数の実世界のデータセットに対する大規模な実験は、我々の提案した教師なしアプローチが、最も正確なモデルを選択するのと同じくらい効果的であることを示す。
論文参考訳（メタデータ） (2022-10-03T16:49:30Z)
Information FOMO: The unhealthy fear of missing out on information. A method for removing misleading data for healthier models [0.0]
ミスリーディングや不要なデータは、マシンラーニング(ML)モデルの健全性や正確性に大きく影響します。本稿では,データセット内の重要な情報を特定するシーケンシャルな選択法を提案する。これらの不安定性は、基礎となるマップの複雑さの結果であり、極端な事象や重い尾と結びついている。
論文参考訳（メタデータ） (2022-08-27T19:43:53Z)
Efficient Testing of Deep Neural Networks via Decision Boundary Analysis [28.868479656437145]
我々は、新しいラベルのないデータに基づいてDNNの性能を推定できるAriesという新しい手法を提案する。 Aries による推定精度は 0.03% -- 2.60% (平均 0.61%) しか真の精度から外れていない。
論文参考訳（メタデータ） (2022-07-22T08:39:10Z)
Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文参考訳（メタデータ） (2022-07-07T17:14:10Z)
Unsupervised Model Drift Estimation with Batch Normalization Statistics for Dataset Shift Detection and Model Selection [0.0]
本研究では,未ラベル試験データに基づくバッチ正規化層の統計量を利用したモデルドリフト推定手法を提案する。本手法は,モデル動物園内に複数の候補モデルが存在する場合のモデル選択だけでなく,教師なしの方法でのトレーニングトラジェクトリにおいても有効であることを示す。
論文参考訳（メタデータ） (2021-07-01T03:04:47Z)
Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文参考訳（メタデータ） (2021-06-11T01:36:08Z)
Time Series Anomaly Detection with label-free Model Selection [0.6303112417588329]
ラベルのない時系列データに対するラベルなしモデル選択を用いた新しい異常検出アルゴリズムであるLaF-ADを提案する。我々のアルゴリズムは容易に並列化可能であり、不条件データや季節データに対してより堅牢であり、多数の異常モデルに対して非常にスケーラブルである。
論文参考訳（メタデータ） (2021-06-11T00:21:06Z)
Automating Outlier Detection via Meta-Learning [37.736124230543865]
メタ学習をベースとした,Overier検出のためのモデル選択のための,最初の原則付きデータ駆動型アプローチであるMetaODを開発した。検出モデルの選択におけるMetaODの有効性を示す。この新しい問題をさらに研究するために、私たちはメタラーニングシステム全体、ベンチマーク環境、テストベッドデータセットをオープンソース化しました。
論文参考訳（メタデータ） (2020-09-22T15:14:45Z)
Contextual-Bandit Anomaly Detection for IoT Data in Distributed Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文参考訳（メタデータ） (2020-04-15T06:13:33Z)
SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文参考訳（メタデータ） (2020-03-11T00:22:50Z)
Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文参考訳（メタデータ） (2020-02-20T03:13:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。