論文の概要: UnfoldML: Cost-Aware and Uncertainty-Based Dynamic 2D Prediction for
Multi-Stage Classification
- arxiv url: http://arxiv.org/abs/2210.15056v2
- Date: Fri, 28 Oct 2022 01:36:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 12:48:35.166860
- Title: UnfoldML: Cost-Aware and Uncertainty-Based Dynamic 2D Prediction for
Multi-Stage Classification
- Title(参考訳): UnfoldML:マルチステージ分類のためのコスト認識と不確実性に基づく動的2次元予測
- Authors: Yanbo Xu, Alind Khare, Glenn Matlin, Monish Ramadoss, Rishikesan
Kamaleswaran, Chao Zhang and Alexey Tumanov
- Abstract要約: UnfoldMLは、多段階分類のためのコスト意識と不確実性に基づく動的2D予測パイプラインである。
最高性能のマルチクラスベースラインから0.1%の精度で達成される。
推論の逐次的コストと早期(3.5時間)の発症予測で20倍近く節約する。
- 参考スコア(独自算出の注目度): 9.414586896131777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) research has focused on maximizing the accuracy of
predictive tasks. ML models, however, are increasingly more complex, resource
intensive, and costlier to deploy in resource-constrained environments. These
issues are exacerbated for prediction tasks with sequential classification on
progressively transitioned stages with ''happens-before'' relation between
them.We argue that it is possible to ''unfold'' a monolithic single multi-class
classifier, typically trained for all stages using all data, into a series of
single-stage classifiers. Each single-stage classifier can be cascaded
gradually from cheaper to more expensive binary classifiers that are trained
using only the necessary data modalities or features required for that stage.
UnfoldML is a cost-aware and uncertainty-based dynamic 2D prediction pipeline
for multi-stage classification that enables (1) navigation of the accuracy/cost
tradeoff space, (2) reducing the spatio-temporal cost of inference by orders of
magnitude, and (3) early prediction on proceeding stages. UnfoldML achieves
orders of magnitude better cost in clinical settings, while detecting
multi-stage disease development in real time. It achieves within 0.1% accuracy
from the highest-performing multi-class baseline, while saving close to 20X on
spatio-temporal cost of inference and earlier (3.5hrs) disease onset
prediction. We also show that UnfoldML generalizes to image classification,
where it can predict different level of labels (from coarse to fine) given
different level of abstractions of a image, saving close to 5X cost with as
little as 0.4% accuracy reduction.
- Abstract(参考訳): 機械学習(ML)の研究は、予測タスクの精度を最大化することに焦点を当てている。
しかし、MLモデルはますます複雑になり、リソース集約化され、リソース制約のある環境にデプロイするのにコストがかかる。
これらの問題は, 逐次的に遷移した段階を段階的に分類した予測タスクにおいてさらに悪化し, モノリシックな単一クラス分類器の「展開」が可能であり, 典型的にはすべての段階において, 全データを用いて訓練される。
各シングルステージ分類器は、その段階に必要なデータモダリティや機能のみを使用してトレーニングされる、安価からより高価なバイナリ分類器から徐々にカスケードすることができる。
UnfoldMLは,(1)精度/コストトレードオフ空間のナビゲーション,(2)桁違いの推論の時空間コストの削減,(3)進行段階の早期予測を可能にする,多段階分類のためのコスト認識および不確実性に基づく動的2D予測パイプラインである。
UnfoldMLは、複数段階の疾患の発生をリアルタイムで検出しながら、臨床環境での桁違いのコスト向上を実現している。
高いパフォーマンスのマルチクラスベースラインから0.1%の精度で達成し、時空間的な推論コストと早期(3.5hrs)の発症予測で20倍近く節約する。
また、UnfoldMLは画像分類に一般化し、画像の異なるレベルの抽象化を与えられたラベル(粗いものから細かいものまで)を予測し、0.4%の精度で5倍近いコストを節約できることを示した。
関連論文リスト
- Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.54623137152208]
本研究では,大規模言語モデル (LLM) を用いて予測モデルの事前分布を推定する手法を提案する。
本研究では,LLMがパラメータ分布を真に生成するかどうかを評価するとともに,文脈内学習と事前推論のためのモデル選択戦略を提案する。
その結果,LLMによる事前パラメータ分布は,低データ設定における非形式的先行よりも予測誤差を著しく低減することがわかった。
論文 参考訳(メタデータ) (2024-11-26T10:13:39Z) - Zero-Shot Class Unlearning in CLIP with Synthetic Samples [0.0]
私たちは、画像テキストペアの巨大なデータセットに基づいてトレーニングされたデュアルビジョン言語モデルであるCLIP内でのアンラーニングに重点を置いています。
リプシッツ正則化をCLIPのマルチモーダル文脈に適用する。
我々の忘れる手順は反復的であり、合成された忘れ物セットの精度を追跡し、選択された閾値未満の精度で停止する。
論文 参考訳(メタデータ) (2024-07-10T09:16:14Z) - Uncertainty-aware Sampling for Long-tailed Semi-supervised Learning [89.98353600316285]
擬似ラベルサンプリングのモデル化プロセスに不確実性を導入し、各クラスにおけるモデル性能が異なる訓練段階によって異なることを考慮した。
このアプローチにより、モデルは異なる訓練段階における擬似ラベルの不確かさを認識でき、それによって異なるクラスの選択閾値を適応的に調整できる。
FixMatchのような他の手法と比較して、UDTSは自然シーン画像データセットの精度を少なくとも5.26%、1.75%、9.96%、1.28%向上させる。
論文 参考訳(メタデータ) (2024-01-09T08:59:39Z) - DOCTOR: A Multi-Disease Detection Continual Learning Framework Based on Wearable Medical Sensors [3.088223994180069]
ウェアラブル医療センサ(WMS)に基づく多相検出連続学習フレームワークであるDOCTORを提案する。
マルチヘッドディープニューラルネットワーク(DNN)とリプレイスタイルのCLアルゴリズムを採用している。
平均テスト精度は1.43倍、F1スコアは1.25倍、後方転送は0.41倍である。
論文 参考訳(メタデータ) (2023-05-09T19:33:17Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Lightweight Conditional Model Extrapolation for Streaming Data under
Class-Prior Shift [27.806085423595334]
非定常ストリーミングデータを用いて学習する新しい方法であるLIMESを紹介する。
我々は、特定のデータ分布に対する特定の分類器を導出するモデルパラメータの集合を1つ学習する。
Twitterデータを用いた一連の模範的なタスクの実験では、LIMESが代替手法よりも高い精度を達成することが示された。
論文 参考訳(メタデータ) (2022-06-10T15:19:52Z) - Cascaded Classifier for Pareto-Optimal Accuracy-Cost Trade-Off Using
off-the-Shelf ANNs [0.0]
カスケード分類器の精度と効率を最大化する手法を導出する。
マルチステージ実現は、最先端の分類器を最適化するために利用できる。
論文 参考訳(メタデータ) (2021-10-27T08:16:11Z) - Learning Gaussian Mixtures with Generalised Linear Models: Precise
Asymptotics in High-dimensions [79.35722941720734]
多クラス分類問題に対する一般化線形モデルは、現代の機械学習タスクの基本的な構成要素の1つである。
実験的リスク最小化による高次元推定器の精度を実証する。
合成データの範囲を超えて我々の理論をどのように適用できるかを論じる。
論文 参考訳(メタデータ) (2021-06-07T16:53:56Z) - Meta-Generating Deep Attentive Metric for Few-shot Classification [53.07108067253006]
本稿では,新しい数ショット学習タスクのための特定のメトリックを生成するための,新しい深度メタジェネレーション手法を提案する。
本研究では,各タスクの識別基準を生成するのに十分なフレキシブルな3層深い注意ネットワークを用いて,メトリクスを構造化する。
特に挑戦的なケースでは、最先端の競合他社よりも驚くほどパフォーマンスが向上しています。
論文 参考訳(メタデータ) (2020-12-03T02:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。